腾讯混元图像 2.0 模型发布：毫秒级响应，一边打字一边出图

IT之家前天 17:33

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

腾讯正式发布混元图像2.0模型，该模型主打实时生图和超写实画质。相比前代，新模型参数量提升了一个数量级，生图速度显著提升，可实现毫秒级响应，改变了传统等待模式。通过强化学习和引入人类美学知识，生成的图像避免了“AI味”。在GenEval基准测试中，准确率超过95%，远超同类模型。此外，还发布了实时绘画板功能，支持用户一边绘制一边生成上色效果，突破了传统线性流程，并支持多图融合，丰富了AI生图的交互体验。腾讯混元原生多模态图像生成大模型也在开发中。

🚀**实时生图与超写实画质：** 腾讯混元图像2.0模型最大的亮点在于其能够实现毫秒级的实时生图，并且生成的图像具有超写实的画质，避免了传统AIGC图像常见的“AI味”。

🎨**绘画板功能革新创作流程：** 新发布的实时绘画板功能，允许用户在绘制线稿或调整参数时，预览区同步生成上色效果，突破了传统“绘制-等待-修改”的线性流程，极大地提升了创作效率。

🧩**多图融合增强交互体验：** 实时绘画板支持多图融合，用户可以上传多个草图叠加至同一画布自由创作，AI会自动协调透视与光影，按照提示词内容生成融合图像，进一步丰富了AI生图的交互体验。

📊**GenEval基准测试领先：** 在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval上，腾讯混元图像2.0模型的准确率超过95%，远超其他同类模型，显示了其强大的技术实力。

IT之家 5 月 16 日消息，腾讯混元图像 2.0 模型（Hunyuan Image2.0）今日正式发布，在腾讯混元官方网站上线，并对外开放注册体验。

腾讯混元图像 2.0 模型主要有两大特点：实时生图、超写实画质。

相比前代模型，腾讯混元图像 2.0 模型参数量提升了一个数量级，得益于超高压缩倍率的图像编解码器以及全新扩散架构，其生图速度“显著快于行业领先模型”，在同类商业产品每张图推理速度需要 5 到 10 秒的情况下，腾讯混元号称可实现毫秒级响应，支持用户可以一边打字或者一边说话一边出图，改变了传统“抽卡 — 等待 — 抽卡”的方式。

除了速度快以外，腾讯混元图像 2.0 模型图像生成质量提升明显，通过强化学习等算法以及引入大量人类美学知识对齐，生成的图像号称可避免 AIGC 图像中的“AI 味”。

在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准 GenEval（Geneval Bench）上，腾讯混元图像 2.0 模型准确率超过 95%，远超其他同类模型。

IT之家附图片示例如下：

人像摄影风格

动物特写

复古摄影

动漫风格

真实人物风格

本次模型升级还带来了发布了实时绘画板功能，基于模型的实时生图能力，用户在绘制线稿或调整参数时，预览区同步生成上色效果，突破了传统“绘制-等待-修改”的线性流程，可助力专业设计师的创作。

实时绘画板支持多图融合，用户上传多图后，可将多个草图叠加至同一画布自由创作，经过 AI 自动协调透视与光影，按照提示词内容生成融合图像，进一步丰富了 AI 生图的交互体验。

腾讯混元原生多模态图像生成大模型已经在路上，腾讯表示，新模型在多轮图像生成、实时交互体验等方面有突出表现。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签