国产文生视频大模型 Vidu 发布 1.5 版本更新：可保证多不同视角下的一致性

IT之家 2024年11月14日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

国产文生视频大模型厂商 Vidu 发布了 1.5 新版本，实现了“世界领先水平”的突破，能够理解多样化的输入并解决视频生成中的一致性难题。Vidu 1.5 具备角色一致性生成能力，可锁定人物面部特征，确保视频生成中人物面部特征的一致性。此外，新版本还具备上下文学习能力，提升了模型的可控性，实现了多角度、多主体、多元素的一致性生成。具体体现在复杂主体的精准控制、人物面部特征和动态表情的自然一致以及多主体一致性等方面，有效解决了传统视频模型在复杂场景下的瑕疵问题，为用户提供了更灵活、更强大的视频生成体验。

🤔**复杂主体的精准控制：**Vidu 1.5 能够在不同视角下保持复杂主体（如3D动画角色）的细节一致性，例如头型、服饰等，避免了传统模型在视角切换时出现的瑕疵。

😄**人物面部特征和动态表情的自然一致：**在特写镜头中，Vidu 1.5 能自然流畅地保持人物面部特征和表情的连贯性，避免面部僵硬或失真现象。

🤝**多主体一致性：**用户可以上传多个主题图像（人物、道具、环境等），Vidu 1.5 可以实现这些元素在视频生成中的交互，例如创建定制角色在特定场景中自由动作的视频。

🚀**上下文学习能力：**Vidu 1.5 首次展现了上下文学习能力，提升了整体视频模型的可控性，通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。

IT之家 11 月 14 日消息，国产文生视频大模型厂商 Vidu 昨日宣布，Vidu 1.5 新版本正式上线，其实现了“世界领先水平”的突破 —— 能够理解多样化的输入，突破“一致性”的难题。

Vidu 方面称，其在上线之初就已具备角色一致性生成能力，通过锁定人物面部特征可解决视频生成的关键痛点，确保了人物面部特征的一致性。此次发布的更新中，Vidu 则首次展现了上下文学习的能力，提升了整体视频模型的可控性，通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。

IT之家获悉，其在三个方面直观呈现了“技术突破”：

复杂主体的精准控制：无论是细节丰富的角色，还是复杂的物体，Vidu 都能保证其在多个不同视角下的一致性。如造型复杂的 3D 动画风格角色，无论视角如何变化，其能够始终确保头型、服饰的全角度细节一致，避免了传统视频模型在复杂视角切换时产生的瑕疵。

人物面部特征和动态表情的自然一致：在人物特写镜头中，其能够自然且流畅地保持人物面部特征和表情的连贯性，避免了面部僵硬或失真的现象。

多主体一致性：用户可上传多个主题图像，包括人物角色、道具物体、环境背景等，并在视频生成中实现这些元素的交互。例如，用户可以上传主体、客体和环境的图片，创建定制角色身穿特定服装、在定制空间内自由动作的场景。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签