谷歌在I/O开发者大会上推出了第三代视频生成模型Veo 3,直接对标OpenAI的Sora。Veo 3不仅能根据文本和图像提示生成高质量视频,还能同步嵌入音效,实现更逼真的视听体验,如人物对白、鸟鸣等。目前,Veo 3主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元,也将纳入谷歌面向企业客户的Vertex AI平台。此外,谷歌还发布了升级版图像生成模型Imagen 4、电影制作辅助工具Flow,并更新了Veo 2,新增了通过文字提示对视频中物体进行增删的功能。
🎬Veo 3的核心功能是能够基于文本和图像提示生成高质量的视频,并且同步嵌入音效,从而提供更加逼真的视听体验。例如,它可以为人物对白、鸟鸣或街头交通等场景配上相应的声音效果。
💰Veo 3目前主要面向美国地区的Gemini Ultra订阅用户开放,每月收费249.99美元。同时,该模型也将纳入谷歌面向企业客户的Vertex AI平台,进一步扩大其应用范围。
🛠️除了Veo 3,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4和电影制作辅助工具Flow。此外,谷歌还宣布对Veo 2进行更新,新增支持通过文字提示对视频中物体进行增删的功能。
⚠️值得注意的是,谷歌在AI图像生成领域并非一帆风顺。此前,Imagen 3模型因生成带有历史错误的图像内容而受到批评,并被迫重新发布,这表明AI模型在生成内容时仍需谨慎测试和验证。
快科技5月21日消息,在今年的I/O开发者大会上,谷歌发布第三代视频生成模型Veo 3。
据悉,Veo 3对标OpenAI的Sora,具备生成视频的同时同步嵌入音效的能力。
谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能为人物对白、鸟鸣或街头交通等场景配上相应的音效,实现更逼真的视听体验。
谷歌DeepMind产品副总裁Eli Collins表示:“从文字和图像提示,到真实世界物理效果与精准的唇形同步,Veo 3的表现都非常出色。”
目前,该模型主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元。
此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。
除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。
此外,谷歌还宣布对原来的Veo 2进行更新,并新增支持通过文字提示对视频中物体进行增删的功能。
目前,生成式AI在图像和视频创作领域的应用日益普及。
不过值得注意的是,谷歌在AI图像生成领域的历史并非一帆风顺。
2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。
谷歌联合创始人Sergey Brin后来坦承,问题源于“测试不充分”。
