36氪 - AI相关文章 03月04日
不给呼兰“留活路”的DeepSeek,如何重塑技术信仰?|牛白丁
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期「牛白丁」节目,火星电波创始人橘子与华创资本投资人候晓雯,探讨了 DeepSeek 在创投圈和用户中引发的火爆现象。DeepSeek 在中文写作能力方面的出色表现,以及其背后的技术突破,让人们看到了 AGI 元年到来的可能性。硅基流动首发上线基于华为云昇腾云的满血版 DeepSeek-R1 & V3,预示着开源推理模型的活跃将推动 AI Agent 的落地,并催生更多 AI-Native 应用。DeepSeek 的出现也引发了关于中美 AI 竞争的讨论,以及对未来 AI 发展方向的思考。

🚀DeepSeek 以其卓越的中文写作能力和思维链功能,在用户中口碑持续发酵,成为春节期间的“破圈”事件,让用户体验到前所未有的 AI 写作能力。

💰DeepSeek 在人才战略上采取高薪策略,吸引顶尖研究人员,并坚持专注数学和逻辑,致力于 AGI 的研发,展现出纯粹的理想主义。

🌐DeepSeek 的技术突破引发了海外的关注甚至恐慌,英伟达股价下跌,美国开始重新审视中国 AI 的发展,这可能影响未来的国际合作与竞争格局。

💡DeepSeek 的出现降低了创作门槛,使得内容不再由创作者决定形式,而是由消费者决定,推动了内容消费的个性化和多样化。

NewBranding

牛/白/丁

欢迎来到「牛白丁」,在这里,你将听到来自华创资本和我们的朋友们,以投资人和创业者的第一视角,一起交流那些投资、创业、前沿科技、消费、生命科学等领域的洞察和趋势,回忆片段与瞬间,剖析认知和思考。

欢迎听友们关注「牛白丁」喜马拉雅、小宇宙、苹果播客、QQ音乐、豆瓣官方账号,与我们一起用耳朵感受「时常有趣、偶尔深刻」。

不久前,火星电波创始人、CEO橘子用 DeepSeek写了一段模仿呼兰风格的脱口秀,呼兰本人看过后直呼:“哎呀,不给我们人类留活路啊!”这次 DeepSeek带来的惊喜创作体验,让橘子意识到未来的内容可能不再由创作者来决定形式,而是由消费者来决定。 

除了能写段子外,DeepSeek在文学创作、吵架骂人,甚至算命等方面展现出的能力,使其口碑在普通用户之间持续发酵,成为春节期间最为“破圈”的事件。 

而在此期间,华创派企业硅基流动也承接住了DeepSeek的第一波流量。近期,硅基流动的大模型云服务平台 SiliconCloud首发上线基于华为云昇腾云的满血版 DeepSeek-R1 & V3,率先走通在国产芯片部署 DeepSeek 模型的路径,大幅提升了基于国产芯片的大模型推理速度及实际算力利用率,显著降低模型推理时间与成本,获得持平全球高端 GPU 部署模型的效果。 

DeepSeek引发的这一系列连锁反应,让不少AI从业者相信2025年将会是“AGI(通用人工智能)元年”。自称“降临派”的橘子,在公众号连续发布了多篇对于DeepSeek的观察分析,近日他做客「牛白丁」,和华创资本投资人候晓雯一起探讨了DeepSeek在创投圈、用户中,甚至是海外的火爆现象和原因。在“技术依然是最大变量”的时代,身处其中的创业者要如何应对?又能抓住哪些机遇? 

DeepSeek开年的这一“国运级”事件,让我们更加相信,开源推理模型的活跃,未来势必会推动 AI Agent 的落地,并催生更多 AI-Native 应用诞生的机会,也欢迎持续关注「牛白丁」AGI系列节目。        

您将在本期节目听到以下内容:

01:20   AI从业者对于 DeepSeek 的使用体验

05:54  DeepSeek 五点就下班,薪资高到字节都挖不到人

13:49  DeepSeek破圈:本质还是技术解锁了更多场景

23:10  呼兰看到DeepSeek写的段子:不给人类留活路了!

28:12  AI带来的改变:内容不再由创作者来决定形式,而是由消费者来决定

34:10  不少AI圈的人信心满满:2025年就是“AGI元年”

40:58  硅基流动第一波承接住了DeepSeek的流量

嘉宾介绍:

橘子, 火星电波创始人、CEO,「橘子汽水铺」主理人 

本期主播:

候晓雯, 华创资本投资人 

以下为节目内容,经过 CGCVC 编辑——

候晓雯: 大家好,这里是华创资本的播客节目「牛白丁」,我是 Vivienne 晓雯。 好久不见的 A GI 系列来 填坑了,这一期我们请到了好朋友橘子,聊聊最近爆火的被称之为“东方神秘 力量”的DeepSeek。 

橘子: 大家好,我是橘子,火星电波的创始人、CEO,我们公司主要做 AI 应用的消费和创作辅助。 我自己有一个自媒体叫「橘子汽水铺」,我也是主理人。 我从2022年开始就做 AI 的产品经理,对AI行业比较熟悉。 

候晓雯: 橘子春节完全没有休息,公众号几乎是日更的频率,社群也非常活跃。 很多 AI 从业者也几乎都没有放假,沉浸在DeepSeek 引起的狂欢之中。 你当时使用 DeepSeek 的使用体验怎么样呢? 

橘子: 我在春节前就开始用了,当时完全不卡。 它是第一个做了思维链加搜索的功能,特别好用,我在自媒体上疯狂安利大家使用。 最早是看到和菜头写了七天的DeepSeek,大家开始关注它的写作,发现DeepSeek不仅能吵架还能写诗。 

候晓雯: 确实 DeepSeek 在中文写作能力方面非常出众,我在小红书看到大家也夸这一点。 

橘子: 因为它的模型之前是o1,写作能力并没有那么好,但逻辑能力很强,写严肃文章的时候效果不错,而且它价格很贵,所以大部分人还没有感受到,也不会去尝试。 而DeepSeek 让所有人第一次看到写东西可以这么好。 

候晓雯: 相信这也是DeepSeek春节期间破圈的一个原因。 过去两年,我们在使用 ChatGPT 时,需要特别注意如何prompt,比如你要去声明你的身份、目的,需要把过程明确出来,比如你希望 AI 帮你做什么、怎么做。 但是在DeepSeek 使用过程中,prompt 可以很简单,这是让我非常惊喜的一个使用体验。 

橘子: 以前我们要构建一个场景,让 AI 进入,然后它去思考才能输出高质量内容。 但现在DeepSeek是自己打开了一个世界,它开始要照顾用户的情绪,要理解是什么意思,理解用户说的朋友是不是指他自己。 

候晓雯: 把思维链的过程呈现出来,太自然了,自然到我以为本身一个产品就是这样子的,直到最近跟朋友讨论,才知道说 ChatGPT 之前不是这样的。 我觉得这是一个非常好的产品设计。 这对你在思考AI 产品设计上面有什么启发吗? 

橘子: 最大的启发就是DeepSeek的思考过程和写出来的内容都太优美了,年前我就发了一条内容,说 AI 写作已经超过我了。 虽然我当时是基于 Google 的 Gemini 2.0 Flash Thinking ,它的思考能力、写作能力已经很强很强,但DeepSeek的中文能力更强,很可怕。 

候晓雯: 我看了一下你的公众号,一月二十四号发的第一篇关于DeepSeek R1 的文章《自学成才之路,DeepSeek R1 论文解读》其实是用Gemini写的。 因为我是文科生,所以我看非 DeepSeek 的 AI 写出来的文章老觉得非常像理工科的论文。 但 DeepSeek就像文科生一样,写出来的内容字字都非常讲究,所以这也是让大家印象最深刻的。 你是什么时候开始关注 DeepSeek 呢? 

橘子: 最早关注它是2024年1月。 后来 DeepSeek那篇论文《 DeepSeek-Coder-V2:Breaking the Barrier of Closed-Source Models in Code Intelligence》发了,大家看到DeepSeek开源,效果还更好,都惊呆了,说怎么可以这么厉害? 好像那时候正好是李厂长(百度CEO李彦宏)在说闭源会超过开源。 

那时候我就发现 DeepSeek很不一样。去年四月我从 MiniMax 离开后,五六月去了一趟DeepSeek,和他们的人聊了一下战略,他们坚定做数学和逻辑,目标就是AGI,也不怎么做产品,就专心把模型训好,我就觉得这个团队好纯粹。而且他们还不加班,5 点就下班了,公司当时只有 50 多个人。 

候晓雯: 这还挺神奇的,怎么做到的? 是因为他们战略很清楚? 知道自己该做什么、不做什么,使得资源非常集中,以及没有内卷,也没有无效的投入? 

橘子: 他们战略很清楚,而且招人时都是找那种发过paper的,比如一作是谁,二作是谁,他们挨个找。 招年轻的、做过研究且有成果的。 

候晓雯: 我看他们招人的标准是应届生或者是毕业1 ~ 2 年、基础好、有潜力,但不需要证明你成功过。 

橘子: 我就好奇他们为什么 MoE 能做得好? 他说 MoE 那篇论文的三个作者,一个在DeepSeek、一个在阶跃星辰、一个好像在美国,他们真的能把人招过来。 而且去年上半年听说字节想去抢 DeepSeek 的人,但抢不到,因为大家都觉得 DeepSeek 给的钱很多,比字节还多,DeepSeek还更理想主义一些。 不像字节,就是赛马。 

候晓雯: 你能明显感受到DeepSeek 人的精神面貌会更纯粹一些吗? 

橘子: 我没有跟研究员聊,但公司整个交流下来是这样的感受。 我说你们现在完全没有用户,就没有数据飞轮,不担心吗? 他们说不担心,也不是不做产品,是等 ready 或者看到有机会的时候再做。 不会为了竞争,靠投放去获取百万用户。 

候晓雯: 那你怎么看待 DeepSeek 在春节带来的认知变化呢? 开源、闭源肯定是一个巨大的认知变化。 大家不再去讨论或者不再需要去证明开源模型是否具有能力的短板,或者比闭源模型更弱,反而看到了生态的价值和流量。 

橘子:最重要的一个认知就是技术仍然是一个最大的变量。 ChatGPT 已经领跑两年,现在5000 万日活很高了,但 DeepSeek 用了不到一个月就 4000 多万日活了,很快就可以超过 ChatGPT。这个世界就是这样,技术好还是最关键的。 

另外就是R1和R1-Zero这个范式我觉得非常重要,R1-Zero相当于大模型的 AlphaGo时刻,它是一个纯的没有做 SFT 的强化学习模型,如果它本身的能力就可以很强,那未来给我们带来的想象空间会非常大。第一次让我们觉得大模型从人类教它变成了它可以超过我们,通过自己的思考来超越我们人类,这个意义非常大。 

候晓雯: ChatGPT 出来两年了,在这两年过程中,大家在想象 AI-Native 产品应该长什么样子,发现其实对话这种方式还是一个核心的产品形态。 这种产品形态是不是需要更新,需要迭代? 比如做硬件的尝试,或者做多模态语音输入的尝试。 

我发现,DeepSeek 出来之后,对 prompt 的改变非常大。 比如在 AI 来之前,我们使用高级数据库的方式是通过提问,比如谷歌、百度;而在过去两年,prompt 可能从一句话变成了一段话,从一段话甚至变成了一篇文章的长度。 

但是在 DeepSeek 之后,这种 AI 的交互又能变成一句话、一段话,当然原因可能是因为DeepSeek 只是一个语言模型,它还没有做更多模态的,比如没有图片、没有音频。但“六小虎”(AI六小虎通常指智谱、阶跃星辰、MiniMax、Kimi、零一万物和百川智能)已经在做多模态模型的探索,这是我的一个想法。 

你的文章发出来之后,包括你在各个平台冲浪,有看到一些什么有趣的讨论或者观点吗? 

橘子: 讨论非常深入,非常多面。 刚刚你说 prompt 一开始变得越来越长, DeepSeek之后好像也不用那么长,简单一点就可以。 从原理上来说,你给它更多的上下文和思考时间,它就会提高能力。 之前,通过我们写 prompt ,给它写很多上下文,它思考的过程本质上就会成为它的上下文,所以就提升了能力,这也是原来范式的一种延伸。 说到大家的讨论,有一个争议点,就是R1 到底是复现了一个OpenAI o1,还是一个全新的模型? 

我觉得没有定论,我个人相信R1-Zero其实是一个范式改变,因为大家用 R1的时候也能感受到明显是没有做很多安全对齐的,它会很奔放,能说出一些超出普通模型安全边界的话,对于 OpenAI 来说是不可能接受这种情况的。 

候晓雯: 是否是因为商业模型? 因为开源和闭源相比,本身对于模型安全要求不同,他们在这方面工作做得不同。 我记得之前和创业者交流,有创业者是从闭源模型切到开源模型,他们提到了很大的一个顾虑,就是希望有更多模型安全公司出来,因为发现开源模型确实是更不受约束的。 

橘子: 是这样的,只要提供商业服务,就要加一层安全过滤。 

候晓雯: 所以对齐的工作是不是做得不一样? 

橘子: 模型层面,比如 OpenAI 、Claude 和国内的模型相比,安全程度可能确实是不一样的,好像 Claude 是最严格的。 DeepSeek 这块放得最松,这和开源、闭源倒是没有那么大关系。 

候晓雯: 我印象特别深刻,在 2022 年 11 月底出来 ChatGPT 的时候,大家就讨论过,ChatGPT 是否是一个范式? 那时候一部分人会说它不过就是个对话框,另一部分人说它在使用方面是一个范式的变化,它使得普通人可以通过 prompt 这种方式接触到智能。 在技术层面,GPT 3.5 的分支做了一些工程优化,所以认为是一种技术范式。 

DeepSeek 现在也有这样的讨论,它在技术层面,比如架构还是 Transformer 的延续;工程上,比如 RL 可能引起了大多数人的重视,发现真的有用,还有蒸馏等偏技术方面的讨论。 

其实我更关心的,还是 DeepSeek 现象级破圈这个事,因为它使得 AI 进一步走进了大众。 虽然之前豆包用流量和硬件推得很厉害,但还是没有出圈,而现在甚至老家的亲戚春节时也在讨论DeepSeek,你怎么看呢? 

橘子:本质上就是因为技术更厉害了,解锁了更多的场景,或者让更多的场景从六十分提升到了八九十分,甚至是满分,这样自然就会扩大到更多人群,而且口口相传一直很有效,因为用钱买口碑很难,买的只是一个曝光而已。

候晓雯: 豆包、Kimi 一系列的 AI 产品,是从零构建出来的,理论上应该给大家的惊喜程度不小。 但 DeepSeek 在春节呈现出来的破圈效益显著高了很多个量级。 

橘子: 我们之前做海螺AI,观察到一个现象: 大部分人对于AI第一个提问的回答非常care,如果你第一个问题回答得很好,他会觉得这是一个智能。而DeepSeek可能每一个问题都能回答得很好,它的思考很惊艳,就让人觉得智商超过了我们。

候晓雯: 首先它非常真实,它的思考过程就像另一个人脑子里的东西被你读出来一样。 其次非常聪明。 你怎么看待它在海外引起的破圈,甚至是恐慌? 

橘子: 一开始DeepSeek还没有那么夸张,在排行榜是二十多名。 当时海外的好多KOL用了之后说这个模型很不一样,包括Midjourney 的 CEO David Holz,他跟DeepSeek聊的是中国古代的哲学和文化,他说它这方面特别强,而且他们用英文聊的,说明这个模型很厉害。 那时候大家还没有太关注成本,只是觉得效果好。 V3 其实一个月前就发了,当时那个论文没有人讨论,后来发现 R1 是基于 DeepSeek-V3-Base 训练的,一对比发现可能跟美国的成本差了有两个数量级,然后逐渐发酵,英伟达还因为这个事情股价跌了。 

候晓雯: 如果我们称之为一次事件,英伟达股价下跌是这个事件的巅峰,可能会引发对英伟达估值叙事逻辑进行重新审视。 

橘子: 我觉得没有改变,但是影响了至少可能 5%~10% 的认知信仰。 

候晓雯: 最近我在跟一些中美的同行交流,他们也提到一个可能令人担忧的点,就是在DeepSeek之前,美国对中国 AI 的重视程度是不够的。 但是现在被DeepSeek 震撼到了,他们非常担心中国弯道超车。 

橘子: 因为股价其实是一个放大器,把DeepSeek从技术圈直接放到了金融圈,甚至政界。 

候晓雯: 这可能会影响到中国的创业者在海外做市场探索,只是现在还没有明确的事件。 

橘子: Anthropic CEO Dario Amodei写的《论DeepSeek与出口管制》遭到了无数美国人的抨击,他说 V3 的成本那么低,是不是证明美国的出口管制失败了? 明显是失败了,就是人家都弯道超车了,然后你这儿还在说这个政策没有生效。 但是 Dario 的观点是说其实没有失败,就是代表我们之前控制得不够,我们要把 H20 也禁了。 其他人就说DeepSeek模型是开源的,开源本质上是一个世界。 你可以禁中国,但全世界别的国家也会用这个东西去继续超过你,那管制就没有用。 

候晓雯: 我身边朋友们也在讨论DeepSeek,即便它主观上没有想要这样,但客观上成为了一个国运的事件,使得中美关系发生一些变化。 我觉得创业者更需要在其中寻求一个空间,在技术层面,开源生态更好,有更好的 Infra 的资源也罢; 在市场层面可能未来需要面临更棘手的问题,这是我隐隐约约会担心的。 

橘子: 像DeepSeek这样走 AGI 路线的产品,担心上升到这个层面是合理的,但对应用层的产品来说其实没有必要。 

因为你仔细想想,一个AGI级别的模型或者 ASI 级别(Artificial Superintelligence,人工超智能)的模型,它应该是哪个国家的?这最后是一个政治相关的问题,没有解法。假如有一天我们每个人手机上都可以跑一个开源模型,也会有安全问题,肯定需要有监管。那时候大家要么就是全世界协作,一起来保证这个模型的安全。至少在美国的科技界,大家觉得以竞争视角来看这件事情,是把事看小了,未来应该是大家协作,因为人类很难去监管一个比自己聪明的东西,我们不一起协作还要先去对抗,有点幼稚。 

候晓雯: 接下来我们聊聊,你作为创业者,现在在做的事情。 

橘子:我们一开始的定位是想让用户直接消费 AI 生产的内容。AI 去年写的东西还没有那么好,但它未来一定会越来越好。那我们就提前布局,让 AI 写的内容直接能走消费这个方向。DeepSeek 出现后,我就感受到我们这个方向的成功率会越来越高,技术上其实已经没有门槛了。

此外,我们认为文本的消费是一个起点,后面还有音频的消费,音频的模型越来越好,到时直接可以消费 ,视频可能就稍微慢一点,因为它成 本也比较高一些。我们的路线规划就是文本、音频、视频,先做文本和音频。 

候晓雯: 我看到春节期间你做了一个呼兰脱口秀的内容尝试,还挺出圈的。 

橘子: 我在春节期间刷小红书,大家说DeepSeek写的脱口秀段子真的还不错,我就尝试一下,把 prompt 一字不改放了进去,让DeepSeek用呼兰的风格写了一个段子。 

呼兰曾经是程序员,但我不想限定在这个内容,我把主题设定为人工智能取代人类,想看DeepSeek的泛化能力怎么样,结果写出来之后觉得非常不错。我就把全文复制粘贴到了一个 TTS 里面,然后一遍输出,中间复刻了一下呼兰的声音,也就花了十几分钟,配了一张呼兰的图,都没有剪辑,就导出来一份给我家属听,她说缺一些笑声,然后我就剪了一些笑声放进去,就发布了。 

候晓雯: 我之前给朋友放的时候说: “这个脱口秀的视频,只有图片不是 AI 生成的”,但其实还有笑声是人工输入的。 

橘子: 我在第一遍看那个文字的时候,没有觉得那么好,但配上呼兰的声音之后再听真的觉得还挺好的。 一般脱口秀听第二遍的时候就没意思了,但我反而在听第二遍的时候发现了新的点,就是DeepSeek设计的点。 因为它写脱口秀时,会首先分析呼兰的风格、以前讲过的段子都有什么,它会知道怎么制造冲突,告诉我为什么这样写,这个地方模仿了呼兰什么段子,讲得可好了。 

后来一个朋友把这个视频发给了呼兰。我说呼兰老师肯定看不上,会对我们嗤之以鼻,结果呼兰回了一句说:“哎呀,不给我们人类留活路啊!” 

候晓雯: 应该跟呼兰说,脱口秀界需要什么新的 AI 工具吗? 我们可以给你们提供。 

橘子: 比如我可以帮他写段子,他觉得哪个好再用。 赚钱的是他的现场,他的人。 

候晓雯: 他的个人 IP 在那 里,这真的很重要。 接下来让 AI 去做内容,会有什么新的变化吗? 比如 AI 在其中占的比例? 

橘子: 我们一开始可能60%是AI、人是30%,现在AI 能到 90% 以上。 

候晓雯: 最近飞书也把DeepSeek嵌入进去了,我看你也在用飞书跑,未来AI 整个 involve 进来后,人们创作和消费内容会发生什么变化吗? 

橘子: 影响因素整体会比较复杂。 首先它把创作的门槛降到无限低,有志向成为创作者的人,他们在今天已经没有门槛了。 以前可以说自己不会写小红书文案,但你在今天不能这样说了。 只是看你有没有意愿,有没有灵感?但这个世界上愿意去表达、有灵感的人并没有变多,这是一个变量。

此外,人们对内容的消费,以前是有一些创作者做好了,然后我通过推荐算法找到这些创作者、内容去消费,是一个三者的闭环。但今天可能就变了,比如我现在订阅了 10 家媒体的新闻,它们的风格各不一样,但我可以让 AI 全部重写一遍,写成我喜欢的风格,比如我就喜欢呼兰,就要脱口秀加新闻,我可以做一个这样的东西。 

候晓雯: 相当于人们消费内容的方式可以进一步更个性化,甚至不是信息的内容获取方便了,而是根据口味来定制。 

Notebook LM 在去年之所以能火,也是在这方面呈现出来一些可能性。不管什么样的内容,全都以两个人播客对话的形式呈现,如果我倾向于这种接收信息的方式,还是挺愉快的。 

橘子: 对,而且它会让内容消费这件事情变得很多维,比如当你有时间去看的时候,你就可以看文字; 没有太多时间,你可以看摘要; 不能看的时候,可以听音频。 内容不再由创作者来决定形式,而是由消费者来决定,这件事情就很不一样。

候晓雯: 可能在一年前我还不相信,未来一年中我消费的内容,70% 来自于AI。 但现在我觉得其实挺好的,因为它的质量确实挺高,甚至朱啸虎都说看到了潜力。 除此之外,接下来的创作者基于 AI 会有什么新的模式吗? 他们会怎么创作内容呢? 

橘子: 其实变化才刚开始,我觉得创作的过程本质上是一个先吸收再输出的过程,在吸收方面,有这种特例模型以及search能力之后,包括 Open AI 推出Deep Research,可以把主题学习得更深入、更全面,吸收得更好。 

另外一方面,写一篇文章其实很累脑子,现在只要把选题找到,信息收集完,然后让 AI 来写,人只需要在它写的基础上修改一下就够了,就很轻松。现在记者做一个综述类的报道,要用一个礼拜的时间去收集各种信息,然后一个人花很久时间才写出来。那今天只要这个信息在网上,理论上几分钟就写出来了。 

核心没有变的是选题,真正找到了一个很重要的选题,而且你还要能够找到这个选题里的差异点。 比如 DeepSeek 有1万个人聊过,为什么我聊的会和别人不一样?关注的角度是什么?怎么把这个差异点放大?选题就是对创作者很高的要求。需要自己的认知、品味很高才可以,这个没有变。 

这其实是一个人对事情认知的积累。就像春节期间有很多自媒体写DeepSeek的文章爆了,但他后面写的文章其实是接不住这个流量的。 

候晓雯:就像拍电影一样,这就是创作的离散性,创作者在单个问题上可能抓到了一个很好的视角,但是没有办法连续抓到。

橘子: 海外有一个产品叫 Stratechery ,就是有一套自己的框架。 不管什么问题,都能持续高质量的输出,很厉害。 本质上来说,一个人的IP 也好,品牌也好,是他如何去理解这个世界,然后输出自己观点的一种方式。

候晓雯: 最近你们团队围绕DeepSeek在思考什么新的问题吗? 

橘子: 以前我们觉得AI 是在学习人类,是人类在教AI。 人类把越来越高质量的标注数据放进去,然后提高模型能力。 AI做得不好的候,我们就把这个问题拿下来,然后做数据再填进去,使它变好,直到我们没有可以教的东西了。 

但现在范式反过来了,AI 可以自己去找到一些角度,比如DeepSeek回答的角度其实非常新奇、非常全面,真的超过人类了,那这时候,需要我们再去重新思考一下这件事情。 

候晓雯: 是说人与 AI 之间进化的关系吗? 还是指数据层面? 

橘子: 一方面, 我们要准备好接受知识输出可能是反向的了。 另外,文学的突破只是其中的一个方面,那接下来会有很多突破,包括医学或者其他学科。 

我们会变得很乐观,以前觉得 AGI 可能是未来5~10 年的事情,但是现在明显感觉加速了,尤其春节之后,我感觉实现AGI就是今年的事情了。

春节期间看到DeepSeek的一位研究员说 R1-Zero还在训练,增长曲线非常陡峭,很可怕的,它没有停,大家都没有放假。其实我感觉本质上DeepSeek已经超过 OpenAI 的 o3了。之后Claude 也要发一个新模型,他们也说超过o3 了。其实 o3 已经很厉害了,它的Deep Research在“Humanity's Last Exam”(人类的最后考试,包含 3000 个问题,由数百位领域专家开发,用于追寻人类知识推理的边界。)的准确度能增至 26.6%,如果今年能到五六十那很可怕了。 

候晓雯: 所以是否可以这么理解: 对于应用创业者来说,大家其实是普遍乐于见到智能的突破的? 

橘子: 我觉得所有人都更乐于见到,包括“六小虎”最近融资的估值都因此上升了。 这两年其实最大的竞争对手不是“六小虎”彼此,而是大家怀疑每年这么大投入,商业化收入有限,ROI 算不过来。 但现在不一样了,不用算了。 

候晓雯:之前从业者都在赌一个共同的假设, 我印象特别深刻,我们投第一个 AI 项目的时候,我在写投资memo时,总结最大的风险其实不是这公司没成,而是AGI 是否是一个hypothesis,还是真的有不一样? 我觉得这一直是从业者最大的恐惧。 所以最大的假设可能在步步验证,只是在今年春节,大家对此有了更进一步的共识了。 

橘子: 已经不是共识了,已经快进到说我们未来要怎么打仗,就是一定会实现,反正圈子里的人应该对AGI是有百分百的信心了。 

我在2022 年就宣布我是降临派,中间也是起起伏伏,特别是去年底,“六小虎”可能跑得没那么好,大家都有点疲。但现在打开了新的空间,以前大家觉得从 1 到10很快,从 10 到 20 的时候很慢,包括GPT5.0也没出来,就有点担心会不会卡在这?然后现在一下冲到了一百。 

候晓雯: 在这样一个巨大的智能变化情况下,你们自己创业、产品设计的节奏会有什么变化吗? 会受到影响吗? 

橘子: 其实我们的节奏一直挺快的。 

候晓雯: 我2022 年接触一些应用创业者,那个时候 AIGC 有一些已经被“拍死”在沙滩上了,产品经理在做产品时候其实是设想比现在要强 5 ~ 10 倍,再基于这个去设计,如果没有达到,再用一些产品的训练来弥补。 你刚说预期今年AGI就能够到来,或者今年 AI 的质变会极大地发生。 这对你们做产品设计的节奏会有影响吗? 

橘子: 有一些不一样的点的变化,以前我们会说,如果这个技术变了,我们该怎么办啊? 那我们就把一个细分场景、一个细分人群做很好,通过各种工程手段优化,然后获得商业回报,这是一种方式。 但现在发现我们可以做得更通用一些, 因为 AI 能力会越来越强、越来越泛化,我们不用做这么细。

候晓雯: 这波 AI-Native APP 都普遍面临的挑战,就是基础模型的能力在提高的过程中是否会有溢出效应? 比如 GPT4.0 出来的时候,一波产品可能就受到了这样的挑战,那现在比如智能应用进一步地提高,是否需要回答这个问题呢? 

橘子: 看起来智能会把某些应用干掉,但其实不是这一波,比如今天套壳类的应用又火了,增长都是那种特别陡峭的。 当整糕整体变大的时候,每个人都是受益者。技术本身在上升是没问题的,如果你之前就有一些用户,你能服务好他们,那会变得更好。这倒是不用太担心。

候晓雯: 你接触AI创业者比较多,大家对DeepSeek的爆火都怎么看? 

橘子: 该蹭就得蹭,连飞书、百度、腾讯都在蹭,都在接DeepSeek。 

候晓雯: 对,这是一个趋势。 我接触的一些早期创业者,他们流量涨得很好。 我问他们用户为什么要用这个产品,他说是因为这个产品用了DeepSeek 比较稳定,所以我觉得是有流量溢出效应的。 除此之外,大家会焦虑吗? 会困惑吗? 

橘子: 我觉得没有焦虑和困惑,大家都很开心。 连 Kimi 都很开心。 

候晓雯: 如果把你们定义为一个新的内容平台,还有什么领域是你特别期待的吗? 

橘子: 我比较期待的是 AI编程,而且确定会越来越好。 

候晓雯: 确实,因为这是一个收敛的问题,所以可优化。 

橘子: 医学我也很期待,我比较相信医学会变得更好。 比如流感的特效药很贵,以前因为它研发成本能高,如果降下来,人类是非常受益的。 

候晓雯: 那在交互上面,你觉得AI硬件今年会有一些新的可能性吗? 

橘子: 硬件一直是一个比较确定的东西,但是这代模型它有个缺点,就是比较慢,硬件好像要稍微再往前一下才能结合到一起。 比如机器人也是一个很确定的赛道,也很依赖智能。 

候晓雯:这样听下来感觉 2025 年是一个新的元年——AGI 元年。

橘子: 推理硬件,就是华为那个显卡,终于能用了,包括硅基流动,春节那波数据都已经到 100 万日活了,马上就要超过阿里云,这很可怕。 AI时代,如果有公司日活能超过阿里云,就不可忽视。

橘子: 上个月的时候杨攀(硅基流动增长副总裁)说他要去硅基流动。 节前的最后一个工作日,有个投资人来找我,我们就在聊说DeepSeek 这波好像是个国运级别的机会,没想到第二天冯骥(游戏科学创始人、CEO、《黑神话: 悟空》制作人)就发了一条微博也这么说。 我就跟那个去硅基流动的朋友说,你们一定要接住这个国运级的机会。 

候晓雯: 袁老师的朋友圈特别有意思,他是个非常实诚的人,说自己之前还是保守了。 

橘子: V3 推出的时候,梁文峰就跟袁老师说你们部署一套吧,袁老师算了一下要大几百万太贵了,那时就没部署,后来他们春节一直在加班,也是第一个接住了这波流量。 

候晓雯: 我当时听到硅基流动的数据都震惊了。 

橘子: 所以当每个C端用户都有 API 的时候,这是多么大的动力。 

候晓雯: 真的太神奇了。 我过去更多关注面向于开发者的 infra,没有见过这种普通用户的热情。 我之前在小红书刷到几个宝妈的视频,她们就在教大家如何用硅基流动、DeepSeek,然后加API,我觉得非常神奇。 

橘子: 其实这个东西在海外没有那么神奇,比如Notion等软件, C端用户的使用和 B 端没有那么大的差异。 

只是中国的软件厂商,比如阿里云、火山云的界面就不是给普通C端用户用的。但硅基流动一开始就按国外的 SaaS 开发,界面很简单,每个人都可以用,文档写得也很好,一下就爆了。 

候晓雯: 但我仍然没有想到会这么爆,因为我感觉中国没有这样的土壤,普通的用户可能过去是 Kimi 、豆包的用户,还不知道Dify,不知道Coze,突然开始研究硅基流动了。 

橘子: 我在公号的文章里放了一个硅基流动的链接,第二天一看账户里已经有1万元了,但其实我的粉丝好多都已经注册了,真没想到,这太疯狂了。 

候晓雯: 我甚至在小红书刷到了很多人问这个钱能提现吗? 所以这也是泼天的流量。 

橘子: 人家就真的接住了,还是有底蕴在。 

候晓雯: 作为硅基流动的投资方,我们也非常幸运。 我们在内部讨论时,海燕(华创资本管理合伙人)就曾说过: 

实际上,我们早就关注DeepSeek了,它在开源社区里一直是一个非常独特、引人关注的存在,可惜没有投资机会。而硅基流动作为推理加速引擎云平台,是众多开源模型和AI应用之间的“连接器”,从某种意义上,也让我们实现了支持国产开源模型和AI应用生态的初衷。 

我们在2024年12月过会,决定投资硅基流动,当时的逻辑是:Scaling Law放缓、开源模型追上闭源模型、应用生态逐步成熟、AI应用将在2025年迎来爆发。在当时,提出上述几条观点,还是需要很多解释和讨论的。等到2025年1月下旬,随着DeepSeek V3、DeepSeek R1的爆火和出圈,连父母辈70多岁的人都在关注和谈论了,“开源模型追上闭源模型”突然不证自明了。在此期间,硅基流动作为推理云,联合昇腾快速将DeepSeek的最新模型部署在国产GPU集群上,迎接了一波注册和调用高峰。 

袁老师(硅基流动创始人兼CEO袁进辉)也在《财新》的文章中,提到他们三天完成了 6 个月的目标,超前完成了自己全年的用户目标,他们也在思考这些新的流量应该如何更好地去服务和发展新的业务逻辑。 

我们相信开源推理模型的活跃会带来更多比如 AI Agent 的落地,更多 AI-Native 应用被构建出来的机会。

最后一个问题,不知道橘子对于现在跃跃欲试,也相信 AI 即将会发生质变,但是还没有迈出行动的潜在的创业者包括 AI 从业者,有什么建议吗? 

橘子: 建议就是如果你之前还没有准备好 all in AI 的话,那现在就是时候了。 连朱啸虎都相信AGI了,你还在犹豫什么? 如果需要融资,第一个可以找华创。 

候晓雯: 非常感谢橘子来做客,很高兴听到你这么乐观,我们也非常兴奋和开心,因为创业者的乐观是我们持续关注 AI 投资的一个非常大的压舱石,你们的乐观是我们乐观的子集。 

欢迎大家继续关注「牛白丁」AGI系列,我们下期见。 

本文来自微信公众号“华创资本”,作者:CGCVC,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek AGI AI 创业 人工智能
相关文章