Bay的设计奥德赛 05月20日 01:07
AI视频进展速读|Runway超强生图能力、Veo免费体验、3个剪辑新产品、优秀短片及提示词技巧
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文聚焦AI视频领域的最新发展,重点介绍了Runway的Gen-4功能、Veo2的免费体验、HeyGen的产品更新以及Pippit等新产品的动态。同时,文章还分享了多个优秀的AI视频案例,涵盖动漫、广告等多种类型,并对AI视频产品的生成成本进行了调研分析。作者还分享了一些视频制作的经验,以及对AI视频行业未来趋势的观察和思考。

🎬 Runway发布Gen-4,新增文本转图像及图片References功能,支持主体物多角度一致性、绿幕图生成等,并可通过Prompt控制摄像机角度、构图等细节。

📹 Veo2现已开放免费体验,T2V效果出色,I2V部分案例惊艳,免费用户每日可生成几个无水印视频。

🗣️ HeyGen进行了产品大幅更新,支持真实人物、宠物、插画生成对口型视频,并新增语音镜像功能,可以模仿音调、语调和节奏。

💰 Pippit是字节跳动推出的电商营销新产品,可以根据网页信息制作视频,但AI生成的文本需要人工调整。

💡 通过对AI视频产品调研,Runway、Luma等产品在生图模型能力上持续发力,主体物参考和首尾帧是视频创作的刚需,而Veo2的生成成本略高于Runway Gen4,但效果出色。

原创 BayJ 2025-05-19 20:00 广东

Runway发布了Gen-4 文本转图像及图片References功能,测试案例达到了令人吃惊的地步 —— 可以通过添加结构参考图,将主体物可以置于参考场景中,同时可通过Prompt控制新的摄像机角度、构图、角色造型等细节。混合后的新图片中

自24年H2开始,AI视频行业以周为单位高速发展,GenLumio是我从24年开始0-1规划 - 设计 - 开发的AI视频项目,旨在为大家带来每周最新鲜的AI视频优秀作品、产品动向。

我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。

更多案例欢迎访问:https://genlumio.framer.website/

一.AI视频模型 & 产品主要更新

Runway

Runway发布了Gen-4 文本转图像及图片References功能,测试案例达到了令人吃惊的地步 —— 可以通过添加结构参考图,将主体物可以置于参考场景中,同时可通过Prompt控制新的摄像机角度、构图、角色造型等细节。混合后的新图片中,有非常适宜的灯光、阴影和构图效果,甚至能识别简单的构图标注进行图像生成。同时也支持对图片风格进行参考。

该功能可以用于主体物多角度一致性、绿幕图生成、甚至3D模型在不同场景的渲染。

以下是我收集的一些案例:

该能力可以快速实现3D白模在不同场景的渲染

这里值得一提的是Runway参考图片引用的交互方式,就像@某个人那样,你可以通过@来引用需要参考的图像,来替代在历史图片库中查找。

Veo2可以免费体验了

Veo2的体验入口终于被我找到了,Google的产品入口比较分散,交互体验也很一般,但这不影响我对Veo2模型能力的赞美之情。Veo2支持生成8s视频,并且可以上传图片体验I2V,测了几条感觉 T2V的效果是真不错,I2V的部分案例非常惊艳,提示词遵循能力做的很好,绝对是当下第一梯队的模型能力。例如这个篮球旋转几圈再掉入篮筐的镜头,我测试过世面上大部分模型只有Veo2干净利落的成功了。

免费用户现在每日可以生成几个无水印视频,处理日常需求已足够:

https://aistudio.google.com/generate-video

Pixverse

刚刚更新了4.5模型,更新了20+ 摄像机控制功能、多元素参考和融合,并且模型价格相比4.0降低了一些,但比起其他产品还是偏贵的,效果也不在第一梯队,本次更新没有引起什么声量,就不过多介绍了。

HeyGen

HeyGen近期进行了产品大幅更新。真实人物、宠物、插画都可以生成对口型视频,除了对口型的准确度提高,另外还支持了多角度对口型:侧面、仰视视角都可以生成。嘴巴以外,人物的面部肌肉有自然的运动,看了一些案例,通常人物的手部、整体画面也有轻微运动,但如果这样的运动可以更多,再配合一些镜头移动效果,视频的真实感会得到极大提升。

使用HeyGen制作音乐MV

其中语音镜像功能很有趣,AI 可以模仿你输入的真实音调、语调和节奏,并且匹配对应口型,这个功能极大提高了视频制作的可控性。

HeyGen语音镜像

另外推荐一则HeyGen制作的创意短片。

visiblemakers使用HeyGen制作的短片

新产品

Pippit 字节电商营销新产品

去年写过HeyGen、 Opus Clip之后,在AI视频进展中还没有提过电商营销新产品,近期Capcut背后的新产品Pippit在Product Hunt 登顶,提供的能力非常丰富,功能介绍十字路口这篇文章写的很详细了,感兴趣可查看:字节 Pippit 悄悄登顶 Product Hunt  | AI 营销创业「血战」号角吹起

我输入了GenLumio的网页链接,消耗120积分让Pippit帮我的网站制作视频,Pippit一次性生成了10条视频,看上去每条视频的数字人语气都真的像那么回事的。只是在爬取了网页信息后,AI撰写的文本对GenLumio的功能进行了夸大,产品介绍文本基本没法用,需要后期人工调整。

同时,该领域还有Creatify、Captions 值得关注。

Medeo

一款来自国内团队的视频Agent产品,支持输入URL、文章、文件内容进行视频生成。

我先是输入了此前撰写的AI Coding的文章和GenLumio网址进行测试。和Pippit不同,Medeo并没有使用文章或者网页中的相关资源,而是通过对内容进行一定总结后生成了一段总结性文本,并且根据内容生成了图片,再进行图生视频。生成的效果有点像科普风(也可能和我的内容有关),如果想要建立有特色的个人账号,可能还是要花一些功夫,但是对一些新闻科普、小说故事剧情讲解视频来说,这种快速低成本制作出来的视频可以试试。

下面的视频分别是让Medeo生成间谍过家家动漫介绍短片;对AI Coding文章进行总结,在短视频平台介绍我的AI Coding经验:

交互上Medeo提交Prompt后会直接消耗大额积分进行视频生成,生成视频中的文本也和输入Prompt的语言匹配,这点前置感知也非常不强烈。Medeo缺乏了Gemini、Lovart等产品分布完成或主动确认任务的可控感。如果在执行几十秒视频生成的复杂任务前,事先进行任务理解、偏好询问,并对生图、文案进行分步确认,会让结果更具备可控性。

Gemini和Lovart的确认过程

感兴趣的朋友可以试用,每个账号可免费生成一次:https://ai.medeo.app

Ponder

一个即将发布的AI 视频编辑器,可以通过Prompt命令对原始拍摄素材进行AI剪辑,这里加入waitlist:https://ponder.ai/

二.最新优秀案例

动漫短片

传统动画师使用Runway做了非常优秀的动画剧集《Mars and Siv. 》,现推出了第一集。整体风格创作模仿了小时候的动画片,分镜、角色设计和场景建模均由传统流程中的人工完成,通过Runway对渲染图进行连贯动画生成,然后刻意抽取中间帧,做成了定格效果。

文章讲述了详细创作过程:https://runwayml.com/customers/the-making-of-mars-and-siv

视频中很多画面采取了分角色生成+绿幕合成的制作:

再次被yachimat的作品惊艳到,不论画面美感、配音、BGM、动画效果都是日漫风格创作者中的绝佳了。

叙事短片

来自Runway CEO Cristóbal Valenzuela 发表的作品,讲述了一只猫在城市中的生活,短片中动物肢体运动协调真实,镜头跟随猫咪进入不同场景,镜头切换非常自然。

广告片两则

来自汗青团队的新作(创意真的没有瓶颈),这是一条Lovart的广告片,讲述AI是如何做梦露的IP商业化设计的,视频故事从一次安迪沃霍尔的设计师面试开始说起。

Snoop Dogg 的作品。由 Dave Meyers 执导。携手 30 多位艺术家,将传统艺术(3D、绘画等)与AI结合,画面有一些拼贴艺术效果。

4个视频制作经验分享

来自Freepik官方的视频,这套面部表情的提示效果非常好

来自Ray (movie arc)分享的案例:Gen-4提示词技巧:“视图突然被四等分,同一镜头的不同未来发生在四个四分之一中”(二等分和“细分为 X”也有效)

来自madpencil_分享的案例:上传一张黑色空白图片,然后在上面提示任何内容,这个技巧几乎适用于所有平台,尤其是在像 Gen 4 这样的模型上:低角度拍摄,摄像机跟踪一滴清澈的水摆动并弹跳下来/漂浮/(地点设置),水滴溅到摄像机镜头上,形成了文字“XYZ”。

来自Cristobal Valenzuela分享的案例:如果你希望在 Gen-4 中实现有趣的摄像机运动,一个很好的建议是使用如下提示结构:“允许摄像机在整个场景中完全自由地移动,采用动态技术,例如俯冲空中运动、戏剧性的俯冲过渡、快速鞭打摇摄和平滑跟踪”。

三.近期AI视频产品调研结论

记录下近期AI视频产品的观察结论:

1. Runway、Luma等产品这几个月一直在发力生图模型能力,AI Wrapper 忙着把所有模型能力集成在一起。在AI生图、视频方向上,也许存在定义下一代交互方式的机会,没有创业者会不为此心动

2. 主体物参考(画面内容一致性、风格迁移)、首尾帧是视频创作的刚需,前者除了Veo和Sora,其他主流产品几乎全部支持,后者Hailuo AI还没有补齐

3. 调研了一圈AI视频模型每秒生成成本

AI视频趋势系列

AI视频进展速读|5个老牌产品更新,2个新产品动向,8个创意转绘、广告、动漫案例精选

AI视频进展速读|Pika高速更新,动漫风格神仙打架,Wan 2.1成为最强开源模型

其他AI视频相关文章

一站式AI视频Showcase:GenLumio每周带你纵览全球佳作

AI视频爆发式更新|近半年值得关注的13个闭源产品动向

AI视频生成(下)| 20个产品推荐及实践教学

AI视频生成 (中)| 20个产品推荐及实践教学

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI视频 Runway Veo2 HeyGen Pippit
相关文章