深度财经头条 2024年12月17日
谷歌AI视频模型深夜炸场:4K分辨率+2分钟时长 又给OpenAI“来了一枪”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌发布Veo 2,其视频生成能力显著提升,最高支持4K分辨率和2分钟以上的时长,在物理世界理解、镜头控制和人物表现力方面均有突破。Veo 2在性能评估中超越了Sora Turbo等其他AI模型,并已应用于谷歌旗下视频创作工具VedioFX。同时,国内AI视频生成领域也在快速发展,快手、智谱AI、字节等公司纷纷推出和升级相关产品。AI视频生成工具的迭代加速,预示着其在创意、设计、教育等领域的应用潜力巨大,同时也对算力提出了更高要求。

🎬Veo 2在视频生成质量上取得重大进展,其分辨率高达4K,时长可达2分钟以上,对物理世界和镜头控制的理解也更加深入,这标志着高质量视频生成领域的重要突破。

💡Veo 2的性能评估超越了Sora Turbo等其他AI模型,这主要归功于三个方面的技术进步:物理引擎的优化、摄影技术的集成以及人物表现力的提升,这些进步使得AI生成的视频更具真实感和视觉冲击力。

🚀国内AI视频生成领域也在快速发展,快手、智谱AI、字节等公司都在积极研发和迭代相关产品,这些产品的不断升级表明AI视频生成工具在应用场景上的渗透速度正在加快。

💰山西证券的研报指出,随着AI视频生成工具的持续迭代,其在创意、设计、教育等多模态领域的应用将加速,同时,视频生成模型对算力的需求也显著提升,AI算力相关产业值得关注。


《科创板日报》12月17日讯 Sora正式发布仅8天后,“谷歌版Sora”的2.0版本——Veo 2便正式发布。

据谷歌官网显示,Veo 2可制作具有逼真动作和高质量输出的视频。其最高分辨率可达4K,时长可达2分钟以上。谷歌方面表示,Veo代表着高质量视频生成领域的重大进步。

除视频清晰度有所长进外,Veo 2对物理世界和镜头控制的理解也是惊人的:

这段画面的部分提示词是:低角度跟踪拍摄,18mm镜头。汽车漂移,留下光迹和轮胎烟雾。相机低速跟踪,捕捉到光滑的橄榄绿色肌肉车接近拐角时的画面。

该画面部分提示词为:特写镜头聚焦于一位女DJ的脸部,她美丽、浓密的黑色卷发勾勒出她的五官。她闭上双眼,沉浸在节奏中,嘴角挂着一丝微笑。当她随着节拍点头和摇摆时,相机捕捉到了她头部的细微动作

从上述案例可见,Veo 2在真实世界还原以及Prompt指令遵循方面都有不错的表现。而在谷歌官网发布的性能评估中,Veo 2同样打败了Sora Turbo、可灵、MiniMaX等一众海内外AI文生视频大模型。

对此,谷歌总结称,Veo 2在技术层面上的进步主要体现在三个方面。一是物理引擎的优化,这决定了AI视频模型对于现实世界物理规律的深入理解。二是摄影技术的集成,能够输出更为丰富的视觉效果。最后是人物表现力的提升,使人物动作和表情更具实感。

目前,Veo 2已被引入谷歌旗下视频创作工具VedioFX。就在上周,OpenAI正式推出Sora Turbo,向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

与此同时,国内文生视频进展不断。今年以来,国内企业开始加速研发并迭代AI视频生成产品,产品能力不断提升:

今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频;

7月,智谱AI上线视频生成产品智谱清影,并在11月进行升级,支持生成时长为10秒的4K超高清视频;

8月,字节推出即梦AI一站式创作平台,随后在11月宣布即梦AI视频模型S2.0Pro和P2.0Pro上线。

山西证券12月12日研报指出,随着AI视频生成工具持续迭代,未来其向多种应用场景的渗透有望加速。一方面,应用层建议重点关注创意、设计、教育等多模态特别是视频生成强相关的领域;另一方面,视频生成模型对算力需求较文本显著提升,重点关注AI算力相关标的。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Veo 2 AI视频生成 Sora 视频技术 AI算力
相关文章