快科技资讯 12小时前
阿里开源通义万相2.2:可生成电影级高清视频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里云的通义万相2.2模型已正式开源,其核心亮点是生成电影级高清视频的能力,单次可生成5秒高品质视频,在光影、色彩、构图和人物微表情等细节上达到专业水准。此次开源的三款模型包括文生视频、图生视频和统一视频生成,其中文生视频和图生视频模型采用业界首创的MoE架构,总参数量27B,激活参数14B,通过高低噪声专家协同工作,优化了计算资源使用效率。此外,该模型还引入了首创的电影美学控制系统,能够精准调控视频的艺术风格和感染力,为创作者提供了强大的视频制作工具。

🎬 **电影级视频生成能力**:通义万相2.2模型能够生成单次长达5秒的高清视频,并在光影、色彩、构图以及人物微表情等细节处理上达到专业电影制作水准,显著提升了AI视频生成的艺术表现力。

🚀 **业界首创MoE架构**:文生视频和图生视频模型采用了业界首创的MoE(Mixture of Experts)架构,总参数量27B,激活参数14B。该架构通过高噪声和低噪专家模型协同工作,分别负责视频的整体框架和细节完善,有效节省了约50%的计算资源,提高了运行效率。

🎨 **首创电影美学控制系统**:通义万相2.2模型引入了电影美学控制系统,能够像导演一样精准把控视频的艺术风格。通过对光影、色彩、构图的精妙调整,可以营造不同场景的氛围,赋予视频电影般的艺术感染力。

💡 **开源赋能广泛创作者**:此次开源的三款模型(文生视频、图生视频、统一视频生成)为广大创作者、开发者和普通用户提供了便捷的电影级视频创作工具,降低了高质量视频制作的门槛,促进了内容创作的创新与发展。

快科技7月28日消息,阿里云宣布旗下通义万相2.2模型正式开源。

通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。

这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。

此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型。

值得一提的是,文生视频模型和图生视频模型采用了业界首创的MoE架构,总参数量达27B,激活参数14B。

这两款模型由高噪声专家模型和低噪专家模型协同工作,前者负责搭建视频的整体布局框架,后者专注于完善视频细节,二者配合默契,在同参数规模下,能节省约50%的计算资源,大大提高了模型运行效率。

此外,通义万相2.2还首创电影美学控制系统。这一系统如同一位经验丰富的电影导演,能够精准把控视频中的美学元素。

无论是营造紧张刺激的动作场景氛围,还是刻画浪漫唯美的爱情画面,它都能通过对光影、色彩、构图的精妙调整,让视频呈现出电影般的艺术感染力。

通义万相2.2的开源,为广大创作者、开发者乃至普通用户打开了一扇通往电影级视频创作的大门。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义万相2.2 阿里云 AI视频生成 开源模型 电影级视频
相关文章