AI视频玩家 2025-01-15 22:14 北京
DeepSeek火爆之后,再一家用效果和价格震撼海外的大模型公司。价格打下来了!1秒低至“4分钱”!
新年伊始,国产视频大模型 Vidu 2.0 正式发布,一上线就来了一记重磅组合拳:
速度上,秒级生成,视频生成速度跑进 10 秒;
价格上,全新套餐直接将成本打下来了,生成单秒视频仅需 4 分钱,直接推动视频生成走向“分”时代,同时上线「错峰模式」,支持闲时不限量生成,不卡积分、不卡条数,简直不要太香;
模型效果也更上一层楼,首尾帧全网最流畅,风格和多主体保持更稳定,镜头运动表现最佳;
总结起来就是“极致高科技,极致性价比”,这也意味着视频大模型迎来“奇点时刻”,开启“人人可用”的规模化阶段。
此外,一向低调的 Vidu 研发团队也罕见公布了运营数据。据官方发布,自 2024 年 7 月底全球上线以来,Vidu 仅用了 20 天用户数就突破百万,上线 100 天用户数就突破千万,截至目前来自全球 200 个国家和地区的用户在 Vidu 平台上共计生产了上亿条视频。根据目前已公开的数据来看,Vidu 是目前全球增速最快的 AI 视频模型产品。
生成速度最快不到 10 秒,比快更快
2024 年以来, 视频大模型虽然在效果、玩法上迭代很快,但是离真正普及仍有段距离,生成速度是其中的关键阻碍。
暂且不说作为免费用户,想要生成一段素材,动辄要面临小时级别的排队时间,此外实际推理环节的时间非常漫长。比如国外同类产品想要生成一段画面,都是分钟级别。
生成时间长,且效果不可预期,看似在 AI 的加持下,视频制作的效率得到了大大提升,但实际上,用户并没有因此节省多少时间。
而生成速度快一直是 Vidu 的拿手好戏,早在去年 7 月底全球上线 1.0 版本时,Vidu 单片段的实测推理速度就已跑进了 30 秒以内,当时就实现了全球最快,此后随着不断迭代,Vidu 生成速度进一步提升。
而这次 Vidu 2.0 在生成速度上更是直接放了个大招,视频生成速度突破至秒级,不管是图生视频、首尾帧生视频,生成 4 秒 512P 单片段视频不到 10 秒,喝口水的功夫视频就生成了。
Vidu 2.0 512-4s 图生视频生成速度实时测评
相比于之前版本,Vidu 2.0 生成速度进一步提升,从 30 秒到 10 秒,提升了三倍。
对于广告制作、影视动画等专业内容创作场景来说,Vidu 2.0 将带来显著的效率提升。
以广告商业片为例,传统广告制作流程繁杂,需要经过策划、拍摄、后期剪辑、配音等环节。一般来说光拍摄周期可能在 3-5 天,后期制作更是耗时耗力,从 5-15 天不等,遇到复杂的动作特效或者画面特效需要更长的时间,总体看,一条 1 分钟广告片的交付周期在 1 个月左右。
Vidu 则彻底重塑了流程,尤其在 Vidu 2.0 的加速下,理想状态下,仅需花费 5 分钟就能跑出足够 1 分钟时长的视频素材,这不单单直接省去了最耗时费劲的实拍环节,还能够节省 90% 的后期制作环节。
短期来看 Vidu 2.0 已推进视频生成进入“秒级时代”,随着生成时间的快速提升,长期来看,视频生成逐步走向实时生成,未来将诞生全新的内容互动形式,创造类似互动短剧、互动游戏等全新用户体验。
加量还降价!单秒视频成本仅需“4 分钱”,百元就能产出 1 分钟商业片
视频大模型最近被广泛讨论,吸引了很多用户体验,但是其中也不乏槽点,特别是付费方面,用户似乎陷入到了视频大模型的新型消费黑洞。
本来希望用 AI 视频工具来节省成本,但是在实际使用过程中发现却与预期不一致。目前市场上的视频模型采用的是订阅制,除了不菲的订阅费之外,每月还会有积分的限制。以 Runway 为例,产出一条素材需要花费 25 积分,每月 625 积分的话只能产出 25 条 5 秒左右的素材片段,比如做 1 分钟的广告片至少需要可能 5 分钟甚至更多的素材,每月 625 积分是远远不够用的,若生成质量不高,还需要不断地提升会员权益,陷入不断买积分的循环黑洞中。
实际上在 Sora 刚上线的时就有海外用户吐槽 Sora 价格“太贵了”,生成一个 5 秒 480P 视频成本为 0.5 美元,折合人民币 3.63 元,生成一段 1080p 视频成本更是高达 27 元。
此次 Vidu 2.0 推出了全新的收费套餐,直接将每秒单价成本降至最低 4 分钱,真正让人人都能用得起。
横向与同类模型产品对比,Vidu 2.0 的价格也可以说是“真香”。
以各家 720P 每秒单价计算的话,Vidu 2.0 为 0.258 元/秒,行业平均价格约为 0.6 元/秒。大致算下来的话,Vidu 2.0 720P 的收费仅为行业平均的 43%,也就是连现在业内平均价格的一半都不到。Runway 虽然效果不错,但是每秒单价超过了 0.5 元,实际对于用户来说仍然是笔不小的支出。
价格便宜了就意味着可以生成的视频素材更多了。以 720P 为例,目前市面上的视频模型,10 元钱平均只能生成 20 秒的视频,而 Vidu 2.0 能生成 38 秒的视频,接近行业平均水平的两倍。
视频生成进入“分”时代意味着可能不到百元的成本我们就能完成一支短片的制作。
可以粗略地算一笔账。以 1 分钟的短片的制作为例,通常传统广告片制作需要经过平面、动效、剪辑等流程,需要雇佣剪辑师、画师、特效师等等,即使是一个 4-5 人的小团队,按照普通出品水准,1 分钟广告片的行业平均成本至少也在 3000-5000 元左右。
而采用 Vidu 2.0 生成 1 分钟商业广告片素材的成本在 3-5 元左右,即便考虑素材的有效率和后期剪辑配音等成本,1 分钟广告片的成本也大约为 100 元左右,相比传统制作广告,成本下降了 30-50 倍。
当然若用户不着急立刻生成,而对成本有严格的控制,或者想进一步薅 Vidu 的羊毛,那么还可以试试 Vidu 悄悄上线的省钱妙招——“错峰模式”。
“错峰模式”有点类似于饭店闲时特价,用户申请的任务将排队等待流量低峰时执行,错峰生成不仅不扣用户现有积分,而且生成素材无限量,想生成多少次就生成多少次,对于视频生成的用户来说,不花积分就能生成无限量的视频素材,这波羊毛不薅白不薅。既可以有效避免高峰时期的等待期,也能帮助用户进一步节约成本,实现资源的有效利用,主打一个“加量还降价”。
已有率先体验 Vidu 2.0 内测的用户直接在社交平台评价生成速度和无限生成“很爽”。
风格、主体、动作稳定性更高
在视频大模型行业一直存在着不可能三角,很难同时做到“又快又好又划算”。但是若想要实现视频大模型的普及,就需要满足用户的“既要又要”。
让人惊喜的是,这次 Vidu 2.0 恰好满足了用户在速度、价格和生成效果一个都不能少的诉求。不仅生成速度快,价格降到了“分”,而且效果质量上有了更进一步的升级。
一个字总结就是“稳”。风格一致性上保持得更好,画面细节、主体更加稳定,镜头运动理解更强。正如一位 AI 视频爱好者所评价的,Vidu 2.0 稳定发挥,给用户提供了牢靠的保障。
风格一致性保持更稳
目前市面上视频生成工具上线了非常多的风格模版,比如动漫、中国风等,但是对于真正的用户而言,用起来最为关键的不只是风格多样,而是在视频生成过程中始终保持风格一致,这才是产业化商业化内容落地的核心。
在风格保持上,Vidu 2.0 图生视频非常稳定,能够完整理解风格元素,并始终保持整体画面风格一致。
下图是一位卷发男子在花丛中的油画,整体风格偏印象派。对比各家视频生成效果如图:
可以看到,Vidu2.0 有更好的风格保持力, 男生手中的花与画面背景的花是一致的,油画风格贯穿始终,其余模型都出现了虽然风格还行但大幅度崩坏,降维/丢失细节,或是风格直接变化的情况,比如 Pika 2.0 和 Sora 直接变成写实风格了。
看到风格一致性,小编突然有了个想法,直接将商品的海报图用 Vidu 2.0 参考生视频变成动态视频,比如做一个猫粮的视频宣传,比起静态图,猫咪伸出爪子吃猫粮的时刻更能引发猫主子们的购买欲。
镜头运动表现更佳
针对用户诉求比较高的镜头运动,此次推出的 Vidu 2.0 在镜头运动表现上更加自然流畅,对于镜头运动指令的理解也更到位,在电影中常见的上下左右推拉旋转镜头运动,Vidu 2.0 在同类视频生成模型中表现更佳。
以下图动漫人物为例,对比几家的效果:
对比来看,Vidu 相对于其他模型较为领先,尤其是 Vidu2.0,其对于顺时针旋转的理解更为优秀,超出了大部分模型。对比来看,runway 旋转镜头理解到位,但是人物在旋转过程中偏静态,有点类似于动态 PPT,Pika 运动幅度大但对部分镜头理解有问题,将旋转理解为人物自身的旋转而不是镜头的旋转, Sora 更是完全没 Get 到旋转镜头的意思。
首尾帧画面切换更加自然
继 2024 年 10 月 Vidu 首次上线首尾帧功能,此次 Vidu 2.0 首尾帧的性能又有了进一步提升。
相对于 Vidu 1.5,Vidu 2.0 兼顾了想象力和稳定性,实现了两者更好的平衡。对于首尾帧中间的过渡更加丝滑流畅,画面稳定性更强,同时在首尾帧中间的场景切换、镜头切换更具有想象力,类似某种镜头“黑魔法”,通过首尾帧生成的镜头语言切换,体现更多故事背后的故事。
如下面的视频,从两个古人在秋天围炉喝茶的画面一下穿越到大雪纷飞的古城街头,Vidu 2.0 生成的视频更让人有种瞬时穿越感。相对而言同类产品则出现了比较多的画面跳变情况,切换生硬,整体画面非常不连贯。如 Luma1.6 和 runway 在切换过渡上并不丝滑,有些许卡顿,Sora 切换让人想起了 PPT 幻灯片模式。
参考生视频更稳更像
作为全球首发的参考生视频功能和多主体一致性功能,Vidu 在视频生成的可控一致性方面一直位于行业第一梯队。
随着 Vidu 2.0 的推出,参考生视频的性能又经历了大幅的提升。
在不同风格的主体和背景的稳定性上,Vidu 2.0 不仅相较 Vidu 1.5 提升较大,而且与 Pika 2.0 相比,Vidu 2.0 在稳定性上拉开了明显差距。
prompt:一个鸭梨头的角色滚动着身体向前一步,抱着花束靠近一个草莓头的角色
参考图:
可以看到在三维动画风格中,Pika 2.0 的视频中出现了崩坏的情况,相对而言 Vidu 2.0 在多主体情况下仍然保持了画面主体和背景的一致。
更让人惊喜的是,Vidu 2.0 参考生对于主体相似度已进化到了 Next level,主体相似度保持得更好,生成的视频的主体、背景都与参考图更像。
以下图两个动漫角色为例:
prompt:A dynamic action scene set in a back alley. Two men engage in a fierce fistfight, exchanging powerful blows with all their might. The camera is fixed at a bust-up angle, capturing the lively expressions on both men's faces. One is a blond man in a white suit, the other a dark-haired man in red.
Every punch and facial expression is meticulously rendered, immersing the viewer in the action.
Japanese animation style.
可以看到 Pika 2.0 生成的视频中,白衣男生与参考图完全判若两人,眼睛都变成绿色了,很难将参考角色与视频联系起来。Vidu 1.5 在主体保持上遵从得也不太好,相对来说 Vidu 2.0 生成的视频角色能做到一眼认出的程度,与参考图主角相似度非常高,即使在打架这种大幅度动作中也能保持主角的一致。
用户数 20 天破百万,百天破千万,全球增速第一
Vidu 此次首次对外公布了运营数据,自 7 月底全球上线以来,Vidu 仅用了 20 天用户数就突破百万,上线 100 天用户数就突破千万,截至到目前 Vidu 平台累计生成的视频数突破亿条,其中“参考生视频”功能仅上线三个月,用户利用该功能生成的视频数就已达到千万级别。据目前媒体已公开数据来看,Vidu 是目前为止全球增速最快的 AI 视频模型工具。
虽然 Vidu 未公开截至目前的用户数,但相比市面上已知的竞品情况,爱诗科技于 11 月 18 日公布用户数超 1200 万,讨论度较高的可灵于 12 月 10 日公布的用户数超 600 万,而相比之下,Vidu 在 10 月底就实现了千万用户数,用户规模远超可灵。没想到,一向低调的 Vidu 在用户规模上已领先同行一个身位。
从用户覆盖地区看,目前 Vidu 已服务了全球超过 200 个国家和地区,用户规模位列全球第一梯队。每天在世界不同国家,不同年龄层职业的用户都在使用着这款来自中国的视频模型工具。
远在美国俄克拉荷马州的一位 60 岁老奶奶是 Vidu 的忠实粉丝。MamaFish 是一名儿童书作家,她非常擅长写儿童故事,非常希望让她写的故事通过视频形式让更多小朋友接触到。但由于不会做视频,雇佣人做视频对于其个人来说花费不小,这个梦想一直没有实现。不过偶然间接触到 Vidu 后,她发现即使不会做视频也能利用 Vidu 帮助生成她想要的视频,在短短 20 分钟内创建 50 多个场景,而且成本非常便宜。MamaFish 的视频不仅在 YouTube 上广受欢迎,而且还因此获得了更多收益。
素材为 MamaFish 利用 Vidu 创作的儿童动画短片《If I Were A Cow》
即使是动漫强国日本,也有用户开始用 Vidu 来制作动画,提升创作效率。@8co28 是 Vidu 第一批早期用户,同时还是一位二次元爱好者。此前尝试过 kling、gen3、hailuo、Pika、luma 等产品来创作二次元动画,但是整体体验后,他最终选择了 Vidu,在其看来 Vidu 在参考生视频方面要比其他平台有更强大的优势,同时对于大动作大动态的处理也十分突出。目前 @8co28 也因为做的这些 AI 视频的出色效果,吸引了更多人的关注,目前粉丝已经超过 35 万。
素材为 @8co28 用 Vidu 生成的 AI 动画
不仅是 TOC 用户,甚至在一些国内出海企业中,Vidu 的产品力也获得了众多企业的认可。Evoke 是一家面向海外用户的 AI 图生视频应用,也是 Vidu 早期的 Maas 客户。
对于一家应用 APP 公司来说,最为关键的指标是用户留存和月活跃用户数。用户留存度高,月活高,通常代表产品黏性高,用户规模大,这通常也意味着变现能力更强。
对于 Evoke AI 图生视频应用来说,就是能让用户用起来轻松、丝滑,能准确理解用户意图,同时快速生成。自从接入 Vidu 的 API 后,据 Evoke 内部数据,在「拥抱」「亲吻」等场景上,相较于同类视频生成平台,Vidu 在模型准确率提升了超 60%,在视频生成时间上从 270 秒缩短到 35 秒,时间相对下降了近九成。用户满意度也有显著提升,可以看到用户取消视频生成的概率降低了 10%。而这些用户体验帮助 Evoke 在海外获得了更多注册用户和付费用户。
可以说,这回 Vidu 算是把“”极致高科技,极致性价比”玩明白了,Vidu 2.0 的发布也标志着视频生成领域迈向“人人可用”阶段,意味着视频生成真正从小众走向大众。
Vidu 2.0体验链接:www.vidu.cn