对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

快科技资讯前天 10:51

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌在I/O开发者大会上推出了第三代视频生成模型Veo 3，直接对标OpenAI的Sora。Veo 3不仅能根据文本和图像提示生成高质量视频，还能同步嵌入音效，实现更逼真的视听体验，如人物对白、鸟鸣等。目前，Veo 3主要面向美国地区的Gemini Ultra订阅用户，每月收费249.99美元，也将纳入谷歌面向企业客户的Vertex AI平台。此外，谷歌还发布了升级版图像生成模型Imagen 4、电影制作辅助工具Flow，并更新了Veo 2，新增了通过文字提示对视频中物体进行增删的功能。

🎬Veo 3的核心功能是能够基于文本和图像提示生成高质量的视频，并且同步嵌入音效，从而提供更加逼真的视听体验。例如，它可以为人物对白、鸟鸣或街头交通等场景配上相应的声音效果。

💰Veo 3目前主要面向美国地区的Gemini Ultra订阅用户开放，每月收费249.99美元。同时，该模型也将纳入谷歌面向企业客户的Vertex AI平台，进一步扩大其应用范围。

🛠️除了Veo 3，谷歌还发布了多个与生成式AI相关的新产品，包括升级版图像生成模型Imagen 4和电影制作辅助工具Flow。此外，谷歌还宣布对Veo 2进行更新，新增支持通过文字提示对视频中物体进行增删的功能。

⚠️值得注意的是，谷歌在AI图像生成领域并非一帆风顺。此前，Imagen 3模型因生成带有历史错误的图像内容而受到批评，并被迫重新发布，这表明AI模型在生成内容时仍需谨慎测试和验证。

快科技5月21日消息，在今年的I/O开发者大会上，谷歌发布第三代视频生成模型Veo 3。

据悉，Veo 3对标OpenAI的Sora，具备生成视频的同时同步嵌入音效的能力。

谷歌表示，Veo 3不仅可以基于文本和图像提示生成高质量的视频，还能为人物对白、鸟鸣或街头交通等场景配上相应的音效，实现更逼真的视听体验。

谷歌DeepMind产品副总裁Eli Collins表示：“从文字和图像提示，到真实世界物理效果与精准的唇形同步，Veo 3的表现都非常出色。”

目前，该模型主要面向美国地区的Gemini Ultra订阅用户，每月收费249.99美元。

此外，Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。

除了Veo 3外，谷歌还发布了多个与生成式AI相关的新产品，包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。

此外，谷歌还宣布对原来的Veo 2进行更新，并新增支持通过文字提示对视频中物体进行增删的功能。

目前，生成式AI在图像和视频创作领域的应用日益普及。

不过值得注意的是，谷歌在AI图像生成领域的历史并非一帆风顺。

2024年，谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评，随后被迫重新发布该工具。

谷歌联合创始人Sergey Brin后来坦承，问题源于“测试不充分”。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签