阿里开源通义万相2.2：可生成电影级高清视频

快科技资讯 12小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

阿里云的通义万相2.2模型已正式开源，其核心亮点是生成电影级高清视频的能力，单次可生成5秒高品质视频，在光影、色彩、构图和人物微表情等细节上达到专业水准。此次开源的三款模型包括文生视频、图生视频和统一视频生成，其中文生视频和图生视频模型采用业界首创的MoE架构，总参数量27B，激活参数14B，通过高低噪声专家协同工作，优化了计算资源使用效率。此外，该模型还引入了首创的电影美学控制系统，能够精准调控视频的艺术风格和感染力，为创作者提供了强大的视频制作工具。

🎬 **电影级视频生成能力**：通义万相2.2模型能够生成单次长达5秒的高清视频，并在光影、色彩、构图以及人物微表情等细节处理上达到专业电影制作水准，显著提升了AI视频生成的艺术表现力。

🚀 **业界首创MoE架构**：文生视频和图生视频模型采用了业界首创的MoE（Mixture of Experts）架构，总参数量27B，激活参数14B。该架构通过高噪声和低噪专家模型协同工作，分别负责视频的整体框架和细节完善，有效节省了约50%的计算资源，提高了运行效率。

🎨 **首创电影美学控制系统**：通义万相2.2模型引入了电影美学控制系统，能够像导演一样精准把控视频的艺术风格。通过对光影、色彩、构图的精妙调整，可以营造不同场景的氛围，赋予视频电影般的艺术感染力。

💡 **开源赋能广泛创作者**：此次开源的三款模型（文生视频、图生视频、统一视频生成）为广大创作者、开发者和普通用户提供了便捷的电影级视频创作工具，降低了高质量视频制作的门槛，促进了内容创作的创新与发展。

快科技7月28日消息，阿里云宣布旗下通义万相2.2模型正式开源。

通义万相2.2最令人瞩目的，当属其生成电影级高清视频的能力。目前，该模型单次便可生成5秒的高清视频。

这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上，通义万相2.2达到了专业电影制作的水平。

此次开源，通义万相2.2推出了文生视频（Wan2.2-T2V-A14B）、图生视频（Wan2.2-I2V-A14B）和统一视频生成（Wan2.2-TI2V-5B）三款模型。

值得一提的是，文生视频模型和图生视频模型采用了业界首创的MoE架构，总参数量达27B，激活参数14B。

这两款模型由高噪声专家模型和低噪专家模型协同工作，前者负责搭建视频的整体布局框架，后者专注于完善视频细节，二者配合默契，在同参数规模下，能节省约50%的计算资源，大大提高了模型运行效率。

此外，通义万相2.2还首创电影美学控制系统。这一系统如同一位经验丰富的电影导演，能够精准把控视频中的美学元素。

无论是营造紧张刺激的动作场景氛围，还是刻画浪漫唯美的爱情画面，它都能通过对光影、色彩、构图的精妙调整，让视频呈现出电影般的艺术感染力。

通义万相2.2的开源，为广大创作者、开发者乃至普通用户打开了一扇通往电影级视频创作的大门。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签