Imagen:前所未有的真实感 × 深入的语言理解
Imagen 在 COCO 数据集上达到了新的最先进的 FID 分数 7.27,而无需在 COCO 上进行训练,并且人类评估者发现 Imagen 样本在图像文本对齐方面与 COCO 数据本身相当。
Imagen 使用大型冻结 T5-XXL 编码器将输入文本编码为嵌入。条件扩散模型将文本嵌入映射到 64×64 图像中。 Imagen进一步利用文本条件超分辨率扩散模型对图像进行上采样64×64→256×256和256×256→1024×1024。
无数据
提示
AI Short - AI Prompt Management, Productivity Tool
图像生成
Ai Drawing
语音合成
探索我们的 AI 工具集
对话式聊天机器人
AI Voiceover, AI Voice Generator, Free Online Voiceover, Voice Software, Voice Tools
AI 语音生成器
AI Learning Roadmap