IT之家 07月02日 16:48
百度发布自研视频生成模型 MuseSteamer:一张图即可生成电影级高清有声视频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

百度商业研发团队推出了自研视频生成模型MuseSteamer和创作平台绘想。MuseSteamer是全球首个实现中文音视频一体化生成的视频模型,能够协同创作画面、音效和人声台词,打破了传统AIGC视频的割裂流程。该模型在VBench I2V榜单中以89.38%的总分位列全球第一,支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达到专业影视水准。MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有声版,满足不同用户的需求,其中Turbo版已开启限时免费公测。

🎬 MuseSteamer是全球首个实现中文音视频一体化生成的视频模型,实现了画面、音效和人声台词的协同创作,改变了传统AIGC视频“先画面后配音”的流程。

🥇 在权威榜单VBench I2V中,MuseSteamer以89.38%的总分位列全球第一,展现了其在视频生成领域的领先技术。

🖼️ MuseSteamer支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达到专业影视水准,提供了高质量的视频生成能力。

⚙️ MuseSteamer的核心技术包括亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化,确保了其卓越的性能。

📢 MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有声版,满足从普通创作者到专业影视机构的不同需求,其中Turbo版已在绘想平台开启限时免费公测。

IT之家 7 月 2 日消息,百度商业研发团队发布自研视频生成模型“MuseSteamer”及创作平台“绘想”,MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC 视频“先画面后配音”的割裂流程。

据悉,MuseSteamer 在权威榜单 VBench I2V 中以 89.38% 总分登顶全球第一,支持一张图生成 10 秒 1080p 电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。

据IT之家了解,MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线绘想平台开启限时免费公测,其余版本将于 8 月陆续开放。平台同步启动“跨次元捏合”AI 视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MuseSteamer 视频生成 AIGC 百度
相关文章