IT之家 05月21日 02:43
谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌在I/O开发者大会上推出了新一代视频生成模型Veo3,该模型不仅能生成高质量的视频画面,还具备生成视频背景音效的能力,包括鸟鸣、街头交通等环境音,甚至能模拟人物对话。Veo3在物理模拟和口型同步方面也取得了显著进展。目前,Veo3仅对美国地区的Gemini Ultra用户和Vertex AI企业用户开放,并已集成到谷歌的AI影视制作工具Flow中。为了应对AI生成内容带来的挑战,谷歌还推出了SynthID Detector,帮助用户检测媒体文件是否包含AI水印。

🐦 Veo3是谷歌推出的新一代视频生成模型,最大的亮点在于其能够同时生成视频画面和背景音效,包括环境音和人物对话,实现了视听的同步。

🌎 Veo3在物理模拟和口型同步方面表现出色,这意味着生成的视频更具真实感和沉浸感。

🔓 目前,Veo3仅向美国地区的Gemini Ultra用户和Vertex AI企业用户开放,并已集成到谷歌的AI影视制作工具Flow中,用户可以通过Flow进行镜头控制和编辑。

🔍 为了应对AI生成内容带来的挑战,谷歌推出了SynthID Detector,用户可以使用该工具检测媒体文件是否包含SynthID水印,从而识别AI生成内容。

IT之家 5 月 21 日消息,在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。

谷歌称,Veo 3 在物理模拟与口型同步方面也表现优异。目前,该模型仅面向美国地区的 Gemini Ultra 用户,以及 Vertex AI 的企业用户开放,也已集成进谷歌的 AI 影视制作工具 Flow 中。

用户仍可为 Veo 2 提供人物、风格、场景或物体的图像参考,并通过 Flow 使用镜头控制功能进行旋转、缩放,甚至将画面从竖屏调整为横屏,或在视频中添加、删除元素。

当前用户越来越难以辨别 AI 生成内容,谷歌为此推出了 SynthID Detector。用户可上传媒体文件以检测其是否包含 SynthID 水印,这是谷歌用于识别 AI 作品的标记工具。不过,目前并非所有图像生成模型都支持这一水印。

谷歌 I/O 开发者大会仍在进行,IT之家将保持关注。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

谷歌 Veo3 AI视频生成 SynthID
相关文章