20天用户超百万，全球增速第一！这家国产视频模型公司是真的“快”

AI视频玩家 2025-01-15 22:14 北京

DeepSeek火爆之后，再一家用效果和价格震撼海外的大模型公司。价格打下来了！1秒低至“4分钱”！

新年伊始，国产视频大模型 Vidu 2.0 正式发布，一上线就来了一记重磅组合拳:

速度上，秒级生成，视频生成速度跑进 10 秒；

价格上，全新套餐直接将成本打下来了，生成单秒视频仅需 4 分钱，直接推动视频生成走向“分”时代，同时上线「错峰模式」，支持闲时不限量生成，不卡积分、不卡条数，简直不要太香；

模型效果也更上一层楼，首尾帧全网最流畅，风格和多主体保持更稳定，镜头运动表现最佳；

总结起来就是“极致高科技，极致性价比”，这也意味着视频大模型迎来“奇点时刻”，开启“人人可用”的规模化阶段。

此外，一向低调的 Vidu 研发团队也罕见公布了运营数据。据官方发布，自 2024 年 7 月底全球上线以来，Vidu 仅用了 20 天用户数就突破百万，上线 100 天用户数就突破千万，截至目前来自全球 200 个国家和地区的用户在 Vidu 平台上共计生产了上亿条视频。根据目前已公开的数据来看，Vidu 是目前全球增速最快的 AI 视频模型产品。

生成速度最快不到 10 秒，比快更快

2024 年以来，视频大模型虽然在效果、玩法上迭代很快，但是离真正普及仍有段距离，生成速度是其中的关键阻碍。

暂且不说作为免费用户，想要生成一段素材，动辄要面临小时级别的排队时间，此外实际推理环节的时间非常漫长。比如国外同类产品想要生成一段画面，都是分钟级别。

生成时间长，且效果不可预期，看似在 AI 的加持下，视频制作的效率得到了大大提升，但实际上，用户并没有因此节省多少时间。

而生成速度快一直是 Vidu 的拿手好戏，早在去年 7 月底全球上线 1.0 版本时，Vidu 单片段的实测推理速度就已跑进了 30 秒以内，当时就实现了全球最快，此后随着不断迭代，Vidu 生成速度进一步提升。

而这次 Vidu 2.0 在生成速度上更是直接放了个大招，视频生成速度突破至秒级，不管是图生视频、首尾帧生视频，生成 4 秒 512P 单片段视频不到 10 秒，喝口水的功夫视频就生成了。

Vidu 2.0 512-4s 图生视频生成速度实时测评

相比于之前版本，Vidu 2.0 生成速度进一步提升，从 30 秒到 10 秒，提升了三倍。

对于广告制作、影视动画等专业内容创作场景来说，Vidu 2.0 将带来显著的效率提升。

以广告商业片为例，传统广告制作流程繁杂，需要经过策划、拍摄、后期剪辑、配音等环节。一般来说光拍摄周期可能在 3-5 天，后期制作更是耗时耗力，从 5-15 天不等，遇到复杂的动作特效或者画面特效需要更长的时间，总体看，一条 1 分钟广告片的交付周期在 1 个月左右。

Vidu 则彻底重塑了流程，尤其在 Vidu 2.0 的加速下，理想状态下，仅需花费 5 分钟就能跑出足够 1 分钟时长的视频素材，这不单单直接省去了最耗时费劲的实拍环节，还能够节省 90% 的后期制作环节。

短期来看 Vidu 2.0 已推进视频生成进入“秒级时代”，随着生成时间的快速提升，长期来看，视频生成逐步走向实时生成，未来将诞生全新的内容互动形式，创造类似互动短剧、互动游戏等全新用户体验。

加量还降价！单秒视频成本仅需“4 分钱”，百元就能产出 1 分钟商业片

视频大模型最近被广泛讨论，吸引了很多用户体验，但是其中也不乏槽点，特别是付费方面，用户似乎陷入到了视频大模型的新型消费黑洞。

本来希望用 AI 视频工具来节省成本，但是在实际使用过程中发现却与预期不一致。目前市场上的视频模型采用的是订阅制，除了不菲的订阅费之外，每月还会有积分的限制。以 Runway 为例，产出一条素材需要花费 25 积分，每月 625 积分的话只能产出 25 条 5 秒左右的素材片段，比如做 1 分钟的广告片至少需要可能 5 分钟甚至更多的素材，每月 625 积分是远远不够用的，若生成质量不高，还需要不断地提升会员权益，陷入不断买积分的循环黑洞中。

实际上在 Sora 刚上线的时就有海外用户吐槽 Sora 价格“太贵了”，生成一个 5 秒 480P 视频成本为 0.5 美元，折合人民币 3.63 元，生成一段 1080p 视频成本更是高达 27 元。

此次 Vidu 2.0 推出了全新的收费套餐，直接将每秒单价成本降至最低 4 分钱，真正让人人都能用得起。

横向与同类模型产品对比，Vidu 2.0 的价格也可以说是“真香”。

以各家 720P 每秒单价计算的话，Vidu 2.0 为 0.258 元/秒，行业平均价格约为 0.6 元/秒。大致算下来的话，Vidu 2.0 720P 的收费仅为行业平均的 43%，也就是连现在业内平均价格的一半都不到。Runway 虽然效果不错，但是每秒单价超过了 0.5 元，实际对于用户来说仍然是笔不小的支出。

价格便宜了就意味着可以生成的视频素材更多了。以 720P 为例，目前市面上的视频模型，10 元钱平均只能生成 20 秒的视频，而 Vidu 2.0 能生成 38 秒的视频，接近行业平均水平的两倍。

视频生成进入“分”时代意味着可能不到百元的成本我们就能完成一支短片的制作。

可以粗略地算一笔账。以 1 分钟的短片的制作为例，通常传统广告片制作需要经过平面、动效、剪辑等流程，需要雇佣剪辑师、画师、特效师等等，即使是一个 4-5 人的小团队，按照普通出品水准，1 分钟广告片的行业平均成本至少也在 3000-5000 元左右。

而采用 Vidu 2.0 生成 1 分钟商业广告片素材的成本在 3-5 元左右，即便考虑素材的有效率和后期剪辑配音等成本，1 分钟广告片的成本也大约为 100 元左右，相比传统制作广告，成本下降了 30-50 倍。

当然若用户不着急立刻生成，而对成本有严格的控制，或者想进一步薅 Vidu 的羊毛，那么还可以试试 Vidu 悄悄上线的省钱妙招——“错峰模式”。

“错峰模式”有点类似于饭店闲时特价，用户申请的任务将排队等待流量低峰时执行，错峰生成不仅不扣用户现有积分，而且生成素材无限量，想生成多少次就生成多少次，对于视频生成的用户来说，不花积分就能生成无限量的视频素材，这波羊毛不薅白不薅。既可以有效避免高峰时期的等待期，也能帮助用户进一步节约成本，实现资源的有效利用，主打一个“加量还降价”。

已有率先体验 Vidu 2.0 内测的用户直接在社交平台评价生成速度和无限生成“很爽”。

风格、主体、动作稳定性更高

在视频大模型行业一直存在着不可能三角，很难同时做到“又快又好又划算”。但是若想要实现视频大模型的普及，就需要满足用户的“既要又要”。

让人惊喜的是，这次 Vidu 2.0 恰好满足了用户在速度、价格和生成效果一个都不能少的诉求。不仅生成速度快，价格降到了“分”，而且效果质量上有了更进一步的升级。

一个字总结就是“稳”。风格一致性上保持得更好，画面细节、主体更加稳定，镜头运动理解更强。正如一位 AI 视频爱好者所评价的，Vidu 2.0 稳定发挥，给用户提供了牢靠的保障。

国外用户生成的Vidu不同版本对比视频

风格一致性保持更稳

目前市面上视频生成工具上线了非常多的风格模版，比如动漫、中国风等，但是对于真正的用户而言，用起来最为关键的不只是风格多样，而是在视频生成过程中始终保持风格一致，这才是产业化商业化内容落地的核心。

在风格保持上，Vidu 2.0 图生视频非常稳定，能够完整理解风格元素，并始终保持整体画面风格一致。

下图是一位卷发男子在花丛中的油画，整体风格偏印象派。对比各家视频生成效果如图：

可以看到，Vidu2.0 有更好的风格保持力，男生手中的花与画面背景的花是一致的，油画风格贯穿始终，其余模型都出现了虽然风格还行但大幅度崩坏，降维/丢失细节，或是风格直接变化的情况，比如 Pika 2.0 和 Sora 直接变成写实风格了。

看到风格一致性，小编突然有了个想法，直接将商品的海报图用 Vidu 2.0 参考生视频变成动态视频，比如做一个猫粮的视频宣传，比起静态图，猫咪伸出爪子吃猫粮的时刻更能引发猫主子们的购买欲。

镜头运动表现更佳

针对用户诉求比较高的镜头运动，此次推出的 Vidu 2.0 在镜头运动表现上更加自然流畅，对于镜头运动指令的理解也更到位，在电影中常见的上下左右推拉旋转镜头运动，Vidu 2.0 在同类视频生成模型中表现更佳。

以下图动漫人物为例，对比几家的效果：

对比来看，Vidu 相对于其他模型较为领先，尤其是 Vidu2.0，其对于顺时针旋转的理解更为优秀，超出了大部分模型。对比来看，runway 旋转镜头理解到位，但是人物在旋转过程中偏静态，有点类似于动态 PPT，Pika 运动幅度大但对部分镜头理解有问题，将旋转理解为人物自身的旋转而不是镜头的旋转, Sora 更是完全没 Get 到旋转镜头的意思。

首尾帧画面切换更加自然

继 2024 年 10 月 Vidu 首次上线首尾帧功能，此次 Vidu 2.0 首尾帧的性能又有了进一步提升。

相对于 Vidu 1.5，Vidu 2.0 兼顾了想象力和稳定性，实现了两者更好的平衡。对于首尾帧中间的过渡更加丝滑流畅，画面稳定性更强，同时在首尾帧中间的场景切换、镜头切换更具有想象力，类似某种镜头“黑魔法”，通过首尾帧生成的镜头语言切换，体现更多故事背后的故事。

如下面的视频，从两个古人在秋天围炉喝茶的画面一下穿越到大雪纷飞的古城街头，Vidu 2.0 生成的视频更让人有种瞬时穿越感。相对而言同类产品则出现了比较多的画面跳变情况，切换生硬，整体画面非常不连贯。如 Luma1.6 和 runway 在切换过渡上并不丝滑，有些许卡顿，Sora 切换让人想起了 PPT 幻灯片模式。

参考生视频更稳更像

作为全球首发的参考生视频功能和多主体一致性功能，Vidu 在视频生成的可控一致性方面一直位于行业第一梯队。

随着 Vidu 2.0 的推出，参考生视频的性能又经历了大幅的提升。

在不同风格的主体和背景的稳定性上，Vidu 2.0 不仅相较 Vidu 1.5 提升较大，而且与 Pika 2.0 相比，Vidu 2.0 在稳定性上拉开了明显差距。

prompt：一个鸭梨头的角色滚动着身体向前一步，抱着花束靠近一个草莓头的角色

参考图：

可以看到在三维动画风格中，Pika 2.0 的视频中出现了崩坏的情况，相对而言 Vidu 2.0 在多主体情况下仍然保持了画面主体和背景的一致。

更让人惊喜的是，Vidu 2.0 参考生对于主体相似度已进化到了 Next level，主体相似度保持得更好，生成的视频的主体、背景都与参考图更像。

以下图两个动漫角色为例：

prompt：A dynamic action scene set in a back alley. Two men engage in a fierce fistfight, exchanging powerful blows with all their might. The camera is fixed at a bust-up angle, capturing the lively expressions on both men's faces. One is a blond man in a white suit, the other a dark-haired man in red.
Every punch and facial expression is meticulously rendered, immersing the viewer in the action.
Japanese animation style.

可以看到 Pika 2.0 生成的视频中，白衣男生与参考图完全判若两人，眼睛都变成绿色了，很难将参考角色与视频联系起来。Vidu 1.5 在主体保持上遵从得也不太好，相对来说 Vidu 2.0 生成的视频角色能做到一眼认出的程度，与参考图主角相似度非常高，即使在打架这种大幅度动作中也能保持主角的一致。

用户数 20 天破百万，百天破千万，全球增速第一

Vidu 此次首次对外公布了运营数据，自 7 月底全球上线以来，Vidu 仅用了 20 天用户数就突破百万，上线 100 天用户数就突破千万，截至到目前 Vidu 平台累计生成的视频数突破亿条，其中“参考生视频”功能仅上线三个月，用户利用该功能生成的视频数就已达到千万级别。据目前媒体已公开数据来看，Vidu 是目前为止全球增速最快的 AI 视频模型工具。

虽然 Vidu 未公开截至目前的用户数，但相比市面上已知的竞品情况，爱诗科技于 11 月 18 日公布用户数超 1200 万，讨论度较高的可灵于 12 月 10 日公布的用户数超 600 万，而相比之下，Vidu 在 10 月底就实现了千万用户数，用户规模远超可灵。没想到，一向低调的 Vidu 在用户规模上已领先同行一个身位。

从用户覆盖地区看，目前 Vidu 已服务了全球超过 200 个国家和地区，用户规模位列全球第一梯队。每天在世界不同国家，不同年龄层职业的用户都在使用着这款来自中国的视频模型工具。

远在美国俄克拉荷马州的一位 60 岁老奶奶是 Vidu 的忠实粉丝。MamaFish 是一名儿童书作家，她非常擅长写儿童故事，非常希望让她写的故事通过视频形式让更多小朋友接触到。但由于不会做视频，雇佣人做视频对于其个人来说花费不小，这个梦想一直没有实现。不过偶然间接触到 Vidu 后，她发现即使不会做视频也能利用 Vidu 帮助生成她想要的视频，在短短 20 分钟内创建 50 多个场景，而且成本非常便宜。MamaFish 的视频不仅在 YouTube 上广受欢迎，而且还因此获得了更多收益。

素材为 MamaFish 利用 Vidu 创作的儿童动画短片《If I Were A Cow》

即使是动漫强国日本，也有用户开始用 Vidu 来制作动画，提升创作效率。@8co28 是 Vidu 第一批早期用户，同时还是一位二次元爱好者。此前尝试过 kling、gen3、hailuo、Pika、luma 等产品来创作二次元动画，但是整体体验后，他最终选择了 Vidu，在其看来 Vidu 在参考生视频方面要比其他平台有更强大的优势，同时对于大动作大动态的处理也十分突出。目前 @8co28 也因为做的这些 AI 视频的出色效果，吸引了更多人的关注，目前粉丝已经超过 35 万。

素材为 @8co28 用 Vidu 生成的 AI 动画

不仅是 TOC 用户，甚至在一些国内出海企业中，Vidu 的产品力也获得了众多企业的认可。Evoke 是一家面向海外用户的 AI 图生视频应用，也是 Vidu 早期的 Maas 客户。

对于一家应用 APP 公司来说，最为关键的指标是用户留存和月活跃用户数。用户留存度高，月活高，通常代表产品黏性高，用户规模大，这通常也意味着变现能力更强。

对于 Evoke AI 图生视频应用来说，就是能让用户用起来轻松、丝滑，能准确理解用户意图，同时快速生成。自从接入 Vidu 的 API 后，据 Evoke 内部数据，在「拥抱」「亲吻」等场景上，相较于同类视频生成平台，Vidu 在模型准确率提升了超 60%，在视频生成时间上从 270 秒缩短到 35 秒，时间相对下降了近九成。用户满意度也有显著提升，可以看到用户取消视频生成的概率降低了 10%。而这些用户体验帮助 Evoke 在海外获得了更多注册用户和付费用户。