阿里開源通義萬相2.2，直接將光影、色彩、鏡頭語言三大電影美學元素裝進模型

富途牛牛头条 12小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

阿里巴巴近期发布了电影级视频生成模型通义万相Wan2.2，并将其开源。该模型集成了光影、色彩、镜头语言三大电影美学元素，通过60多个直观参数实现电影级画面的高效制作。Wan2.2包含文生视频、图生视频和统一视频生成三款模型，其中文生视频和图生视频模型是业界首个采用MoE架构的视频生成模型，拥有27B总参数和14B激活参数，通过高低噪专家模型协同工作，显著降低了计算资源消耗，并在复杂运动、人物交互和美学表达方面有大幅提升。此外，Wan2.2还创新性地引入了电影美学控制系统，能够通过关键词精确控制光影、色彩、构图和微表情等，生成专业电影级别的视觉效果。

🎬 Wan2.2集成了光影、色彩、镜头语言三大电影美学元素，用户可通过组合60多个直观参数，显著提升电影级画面的制作效率。这使得专业级的视觉效果创作更加便捷和高效。

🚀 模型开源了文生视频（Wan2.2-T2V-A14B）、图生视频（Wan2.2-I2V-A14B）和统一视频生成（Wan2.2-TI2V-5B）三款模型。其中，文生视频和图生视频模型是业界首个采用MoE（Mixture of Experts）架构的视频生成模型，总参数量27B，激活参数14B。

💡 MoE架构的引入，通过高噪专家模型和低噪专家模型分别负责视频的整体布局和细节完善，在同等参数规模下，能够节省约50%的计算资源，有效解决了视频生成过程中因Token过长导致的计算资源消耗问题，同时在复杂运动生成、人物交互和美学表达方面也得到了显著提升。

✨ Wan2.2首创了电影美学控制系统，在光影、色彩、构图、微表情等方面的能力媲美专业电影水平。例如，用户可以通过输入“黄昏”、“柔光”、“中心构图”等关键词，生成具有特定氛围和风格的画面，极大地增强了创作的精确性和艺术性。

7月28日晚，繼上週阿里AI三連發後，阿里又扔出新的開源模型，電影級視頻生成模型通義萬相Wan2.2。Wan2.2直接將光影、色彩、鏡頭語言三大電影美學元素裝進模型，可以隨意組合60多個直觀可控的參數，大幅提升電影級畫面的製作效率。

據了解，Wan2.2此次共開源文生視頻（Wan2.2-T2V-A14B）、圖生視頻（Wan2.2-I2V-A14B）和統一視頻生成（Wan2.2-TI2V-5B）三款模型。

其中文生視頻模型和圖生視頻模型均爲業界首個使用MoE架構的視頻生成模型，總參數量爲27B，激活參數14B，均由高噪聲專家模型和低噪專家模型組成，分別負責視頻的整體佈局和細節完善，在同參數規模下，可節省約50%的計算資源消耗，有效解決視頻生成處理Token過長導致的計算資源消耗大問題，同時在複雜運動生成、人物交互、美學表達、複雜運動等維度上也取得了顯著提升。

Wan2.2還首創了電影美學控制系統，光影、色彩、構圖、微表情等能力媲美專業電影水平。例如，用戶輸入「黃昏」、「柔光」、「邊緣光」、「暖色調」「中心構圖」等關鍵詞，模型可自動生成金色的落日餘暉的浪漫畫面；使用「冷色調」、「硬光」、「平衡圖」、「低角度」的組合，則可以生成接近科幻片的畫面效果。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签