字节豆包发布AI视频模型实现多方面突破，多模态能力再升级（附股）

韭研公社 2024年09月25日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

9月24日，火山引擎AI创新巡展发布豆包大模型最新进展，包括视频生成、音乐及同声传译模型，其中视频模型实现多方面能力突破。

🎬豆包·视频生成模型中的PixelDance（图生视频）及Seaweed（文生视频）模型，具备精准的语义理解及多动作多主体交互能力，能够遵从复杂prompt，实现时序性多拍动作指令与多个主体间的交互。

🎥该视频模型拥有强大动态与酷炫运镜，具备变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力，可灵活控制视角，呈现真实世界的效果。

🎵此次发布还包括豆包·音乐模型及豆包·同声传译模型，丰富了豆包大模型的功能。

1、豆包发布全新更新，视频模型实现不俗突破。9月24日，2024火山引擎AI创新巡展在深圳举办，发布豆包大模型最新进展，全新发布豆包·视频生成模型、豆包·音乐模型及豆包·同声传译模型，其中视频模型包括PixelDance（图生视频）及Seaweed（文生视频）模型，实现多方面能力突破：1）精准的语义理解及多动作多主体交互，能遵从复杂 prompt，解锁时序性多拍动作指令与多个主体间的交互能力；2）强大动态与酷炫运镜，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力，灵活控制视角，带来真实世界

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签