差评 04月16日 01:22
快手的可灵又更新了,这次搓出来的视频真有点东西。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

快手推出可灵2.0视频生成模型和可图2.0图像生成模型,全量开放,宣称在动态质量上有所提升,并增加了多模态编辑功能。文章通过对比测试,展示了可灵2.0在语义理解和动态效果上的进步,但也指出了价格偏贵和画面稳定性等问题。尽管如此,可灵AI在技术水平和商业化方面均取得了一定进展,并有望与快手形成更深度的联动。

🚀 可灵2.0在动态效果上有所优化,生成的视频在流畅度和细节表现上有所提升,例如对人物动作和物体运动的模拟更加逼真。

✨ 可灵2.0新增多模态编辑功能,允许用户基于现有视频进行元素替换、增加和删减,提高了视频生成的可控性,为视频后期编辑提供了更多可能性。

💰 可灵2.0的收费模式为按积分消耗,生成5秒视频需花费100积分,约合10元人民币,价格相对较高,可能会影响用户的使用意愿。

📈 可灵AI在商业化方面取得进展,截至2025年2月,累计营业收入已突破1亿元。快手也开始利用AI生成营销素材,降低制作成本,为AI商业化提供了潜力。

2025-04-16 00:02 浙江

太强啦。



一个好消息,可灵AI这次来了波大的。

就在今天下午,快手上线了可灵2.0视频生成模型和可图2.0图像生成模型,全量开放,进他们家官网就能用。


一上来,快手的高级副总裁盖坤就直接摆数据,可灵2.0的文生视频模型甩了Veo2和Sora好几个车尾灯,图生视频也要比Runway的新模型Gen-4强不少。


甚至还在现场放话,把可灵2.0称作是“世界上最强大的视觉生成模型”。


虽说世超没去发布会现场,但结合官方放出来的demo、网友的测试,当然还有我们自己的一手体验,咱不敢打包票可灵2.0是最强的,但实力的确对得起现阶段“AI视频版本答案”这个称号。


这次升级比较出色的一个点,就是动态质量上的优化。


可灵AI官方 po  出来的案例,那效果可以说是非常惊艳了,随便拎出一个来,都可以称得上是百万镜头、千亿制作。


就比如这个,穿着长袍的人在漫天黄沙中行走,你别说,还真有点电影《沙丘》那味儿了。


可灵2.0发布后的第一时间,X上也有不少网友把自己的case发了出来。


拿已经生成好的图片,让可灵2.0跑一个灾难片场景。短短5秒的时间,可灵2.0把男人整体逃跑的动作流畅地表现了出来。

当然瑕疵也是有的,空中散落的传单大部分都糊掉了。


直接拿同一组prompt分别测试了可灵2.0和可灵1.6的效果。


就比如这个少女骑着海上摩托艇送外卖的视频,可以看到,可灵2.0对海上摩托艇的动态处理更逼真,不再是千篇一律的慢动作,发动机对于海浪的冲击是在变化的,反观可灵1.6的摩托艇,稳得有点太假了。。。

还有一个图片生成的视频,提示词是“她很生气”,可灵2.0和1.6的表现力高下立判。

前者的面部表情很生动,把对“生气”的理解变成了破口大骂,后者的“生气”,有点猜不出到底是生气还是无语。


看下来,大伙儿对可灵2.0的评价都还挺正向的,唯一的一点吐槽,可能就是价格真的有一点贵。。。


用可灵2.0生成一个5秒的视频,要花掉100积分,也就是10块钱。世超也只能用兜里仅剩的几十块钱,给大伙儿浅浅测评一波。


在动态效果上,我用可图2.0生成的地下室忍者图片,跑了一个模拟被忍者追杀的镜头。


prompt是这样的:忍者做完一个前空翻之后,举起手中的武器冲向镜头,镜头不断后移,随着地下室场景的变化,光线越来越暗。


半小时的等待时间里,我把同一组prompt喂给了可灵1.6。


1.6快是快了,但质量得打对折。说好的前空翻呢,往下蹲这一下算怎么回事??


再来看可灵2.0的结果,相比之下要顺眼多了。


虽说前空翻的动作一整个糊掉了,但好歹动作完成度是有的,举起手中的武器冲向镜头也理解得没毛病。在语义响应方面,做得确实还不错。


不过老实说,这个视频的动态效果没有我想象中的那么好,特别是在画面稳定性上,明显能看到手部、武器变形的地方。


再来看这个例子(prompt:拥挤的车流中,一只机器狗往前狂奔,镜头慢慢往右移动到机器狗的侧面,到达十字路口的时候,机器狗起跳,越过了一辆汽车,而后继续向前狂奔)


别的先不说,这个画面质感世超必须夸一夸,这机器狗的耳朵动起来就跟真的似的。而且在机器狗奔跑的过程中,没有看到特别明显的变形,画面流畅,地面上的倒影也都对上了。


就是镜头移动没能体现出来,还有越过汽车的方式,跟世超想象中的多少差点意思。


值得一提的是,这次可灵2.0还上新了一个叫做多模态编辑的功能。基于一个视频,咱可以进行替换、增加和删减元素。


世超用上面机器狗的视频试了下这个功能,再上传一张柯基的照片,让可灵2.0帮我把视频里的机器狗换成柯基。


大伙儿看看效果,评价一下?


原来的车流背景看不到特别大的变化,柯基的运动轨迹也跟机器狗基本一致。理论上,咱们还可以基于机器狗的视频做更多改动,比如把马路变成花田,或者再多加一只金毛之类的。


根据快手高级副总裁盖坤的说法,可灵定义了一种人和AI交互的新语言Multi-modal Visual Language(MVL)。


啥意思呢,就是以前咱们用文字跟AI说要生成啥样啥样的视频,最后的结果多多少少都会有偏差。但如果你多给一个图片和视频的参考,AI就能更懂你。


这么说吧,多模态编辑的功能让视频的可控性更高了,对于视频生成和视频后期编辑来说,都有不小的帮助。


所以测试下来,世超觉得可灵2.0在产品的深度和广度上,确实下足了功夫。不敢说已经能碰瓷摄像机了,但整体瑕不掩瑜,如果能把价格也打下来,那就更好了。


有一说一,自打去年6月快手推出可灵以来,满打满算也才一年时间不到。但无论是技术水平,还是全球知名度,可灵都是众多玩家里比较拔尖的那一个。

上个月快手发财报,还首次披露了一组数据:截至2025年2月,可灵AI累计营业收入已突破1亿元大关。


虽然在快手的整体营收面前,可灵的这丁点收入充其量也只是苍蝇腿。


但有个问题,目前市面上的AIGC产品收费且营收能干到1亿的,又有多少?


并且快手的财报中也提到,2024年第四季度,快手AIGC营销素材日均消耗超3000万元人民币,也就是说,有不少广告主开始选择用AI生成的素材来做营销。


而且快手CEO程一笑也表示,AI大模型预计可以把短视频营销素材的制作成本,降低60 - 70%甚至更高。


所以,快手完全有给AI提供稳定商业化的潜力。


如果可灵过后能够跟快手形成深度联动,不仅AI的商业化有着落,说不定也能借AI重做一个快手。


撰文:没瓜西

编辑:江江&面线

美编:富贵


图片、资料来源:

可灵AI





阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

快手 可灵2.0 AI视频 视频生成 多模态编辑
相关文章