AI视频进展速读｜Runway超强生图能力、Veo免费体验、3个剪辑新产品、优秀短片及提示词技巧

原创 BayJ 2025-05-19 20:00 广东

Runway发布了Gen-4 文本转图像及图片References功能，测试案例达到了令人吃惊的地步 —— 可以通过添加结构参考图，将主体物可以置于参考场景中，同时可通过Prompt控制新的摄像机角度、构图、角色造型等细节。混合后的新图片中

自24年H2开始，AI视频行业以周为单位高速发展，GenLumio是我从24年开始0-1规划 - 设计 - 开发的AI视频项目，旨在为大家带来每周最新鲜的AI视频优秀作品、产品动向。

我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。

更多案例欢迎访问：https://genlumio.framer.website/

一.AI视频模型 & 产品主要更新

Runway

Runway发布了Gen-4 文本转图像及图片References功能，测试案例达到了令人吃惊的地步 —— 可以通过添加结构参考图，将主体物可以置于参考场景中，同时可通过Prompt控制新的摄像机角度、构图、角色造型等细节。混合后的新图片中，有非常适宜的灯光、阴影和构图效果，甚至能识别简单的构图标注进行图像生成。同时也支持对图片风格进行参考。

该功能可以用于主体物多角度一致性、绿幕图生成、甚至3D模型在不同场景的渲染。

以下是我收集的一些案例：

该能力可以快速实现3D白模在不同场景的渲染

这里值得一提的是Runway参考图片引用的交互方式，就像@某个人那样，你可以通过@来引用需要参考的图像，来替代在历史图片库中查找。

Veo2可以免费体验了

Veo2的体验入口终于被我找到了，Google的产品入口比较分散，交互体验也很一般，但这不影响我对Veo2模型能力的赞美之情。Veo2支持生成8s视频，并且可以上传图片体验I2V，测了几条感觉 T2V的效果是真不错，I2V的部分案例非常惊艳，提示词遵循能力做的很好，绝对是当下第一梯队的模型能力。例如这个篮球旋转几圈再掉入篮筐的镜头，我测试过世面上大部分模型只有Veo2干净利落的成功了。

免费用户现在每日可以生成几个无水印视频，处理日常需求已足够：

https://aistudio.google.com/generate-video

Pixverse

刚刚更新了4.5模型，更新了20+ 摄像机控制功能、多元素参考和融合，并且模型价格相比4.0降低了一些，但比起其他产品还是偏贵的，效果也不在第一梯队，本次更新没有引起什么声量，就不过多介绍了。

HeyGen

HeyGen近期进行了产品大幅更新。真实人物、宠物、插画都可以生成对口型视频，除了对口型的准确度提高，另外还支持了多角度对口型：侧面、仰视视角都可以生成。嘴巴以外，人物的面部肌肉有自然的运动，看了一些案例，通常人物的手部、整体画面也有轻微运动，但如果这样的运动可以更多，再配合一些镜头移动效果，视频的真实感会得到极大提升。

使用HeyGen制作音乐MV

其中语音镜像功能很有趣，AI 可以模仿你输入的真实音调、语调和节奏，并且匹配对应口型，这个功能极大提高了视频制作的可控性。

HeyGen语音镜像

另外推荐一则HeyGen制作的创意短片。

visiblemakers使用HeyGen制作的短片

新产品

Pippit 字节电商营销新产品

继去年写过HeyGen、 Opus Clip之后，在AI视频进展中还没有提过电商营销新产品，近期Capcut背后的新产品Pippit在Product Hunt 登顶，提供的能力非常丰富，功能介绍十字路口这篇文章写的很详细了，感兴趣可查看：字节 Pippit 悄悄登顶 Product Hunt | AI 营销创业「血战」号角吹起

我输入了GenLumio的网页链接，消耗120积分让Pippit帮我的网站制作视频，Pippit一次性生成了10条视频，看上去每条视频的数字人语气都真的像那么回事的。只是在爬取了网页信息后，AI撰写的文本对GenLumio的功能进行了夸大，产品介绍文本基本没法用，需要后期人工调整。

同时，该领域还有Creatify、Captions 值得关注。

Medeo

一款来自国内团队的视频Agent产品，支持输入URL、文章、文件内容进行视频生成。

我先是输入了此前撰写的AI Coding的文章和GenLumio网址进行测试。和Pippit不同，Medeo并没有使用文章或者网页中的相关资源，而是通过对内容进行一定总结后生成了一段总结性文本，并且根据内容生成了图片，再进行图生视频。生成的效果有点像科普风（也可能和我的内容有关），如果想要建立有特色的个人账号，可能还是要花一些功夫，但是对一些新闻科普、小说故事剧情讲解视频来说，这种快速低成本制作出来的视频可以试试。

下面的视频分别是让Medeo生成间谍过家家动漫介绍短片；对AI Coding文章进行总结，在短视频平台介绍我的AI Coding经验：

交互上Medeo提交Prompt后会直接消耗大额积分进行视频生成，生成视频中的文本也和输入Prompt的语言匹配，这点前置感知也非常不强烈。Medeo缺乏了Gemini、Lovart等产品分布完成或主动确认任务的可控感。如果在执行几十秒视频生成的复杂任务前，事先进行任务理解、偏好询问，并对生图、文案进行分步确认，会让结果更具备可控性。