韭研公社 2024年09月25日
字节豆包发布AI视频模型实现多方面突破,多模态能力再升级(附股)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

9月24日,火山引擎AI创新巡展发布豆包大模型最新进展,包括视频生成、音乐及同声传译模型,其中视频模型实现多方面能力突破。

🎬豆包·视频生成模型中的PixelDance(图生视频)及Seaweed(文生视频)模型,具备精准的语义理解及多动作多主体交互能力,能够遵从复杂prompt,实现时序性多拍动作指令与多个主体间的交互。

🎥该视频模型拥有强大动态与酷炫运镜,具备变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,可灵活控制视角,呈现真实世界的效果。

🎵此次发布还包括豆包·音乐模型及豆包·同声传译模型,丰富了豆包大模型的功能。

1、豆包发布全新更新,视频模型实现不俗突破。9月24日,2024火山引擎AI创新巡展在深圳举办,发布豆包大模型最新进展,全新发布豆包·视频生成模型、豆包·音乐模型及豆包·同声传译模型,其中视频模型包括PixelDance(图生视频)及Seaweed(文生视频)模型,实现多方面能力突破:1)精准的语义理解及多动作多主体交互,能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力;2)强大动态与酷炫运镜,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角,带来真实世界

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

豆包大模型 视频生成 音乐模型 同声传译
相关文章