原创 与AI同行的 2025-02-24 15:05 北京
DeepSeek开源持续加码,它引起的连锁反应亦在行业里延宕。作为近年来科技创业和科投资的重要方向,AI的创投叙事又会发生怎样变化?身处其中的创业者、投资人感知到了怎样的变化?
近期由云启出品的科技播客「Attent!on」邀请到两位深耕AI领域的创业者——肖涵(Jina AI创始人&CEO)、Shaun(Heyriva联合创始人&CEO),和云启投资副总裁Emily共同展开精彩讨论。本文为你带来部分精华内容。
欢迎扫描上图二维码或在小宇宙关注「Attent!on」收听本期节目
· 对话嘉宾介绍:
肖涵,Jina AI 创始人&CEO
Jina AI成立于2020年,是一家领先的搜索AI公司,搜索底座平台包含向量模型、重排器和小语言模型,可帮助企业构建可靠且高质量的生成式AI和多模态的搜索应用。
Shaun,Hey Revia联合创始人&CEO
Hey Revia成立于2024年,base湾区,面向提供服务医疗保健供应商的AI呼叫助手。
Emily,云启副总裁
云启科技组投资人,长期关注AI领域前沿科技、创新项目,ex硅谷创业者。
Linda,云启董事总经理 (主持人)
以下是本期播客的节选内容(部分文字经编辑)
技术破局:
DeepSeek破圈背后
Linda,云启董事总经理
首先我们从DeepSeek 模型本身聊起,在这波出圈之前DeepSeek给你们留下了怎么样的印象?这次发布的R1其实也是已经做了一段时间了,只是在那个时间点选择了发布。请各位聊聊对你们来说有哪些惊艳的地方?
肖涵,Jina AI创始人
我很长一段时间在海外。从海外的观感来看呢,DeepSeek阿里的和通义千问之前一直都属于国内数一数二的大模型。它给大家留下来的印象非常低调,因相比于千问和其他公司来说没有做很多的 PR;第二点是它的模型的性能和成本效益非常优秀。
但是之所以之前不突出呢,因为目前来讲大模型都在呈指数往上去爬的阶段,虽然说有些人一直说hit the wall(撞墙),但实际上还是有提升性能的空间。然后所以大家对于那些模型性能上表现比较中庸的模型并没有投入特别大的热情。所以这是DeepSeek发布V3之前大家的观感。
这次R1发布时间点选择得非常好,当然我们从外面是不知道他们是有意还是无意的去选择这个时间点,但是为OpenAI从去年9月份发布o1的preview版本的时候AI圈里传播的一个信号就是说 training time (训练时间)scaling已经到头了,将会转变成test time(测试时间) scaling。就是说推理的逻辑链更多地消耗在测试时间,而不是发生在训练时间。就是让模型不断地反思,不断地去思考,产生更好的结果。
openAI 花了两到三个月把这个信号传递给大家了之后,大家都比较认可,意识到确实是该关注测试时间了。但是问题在于OpenAI一直遮遮掩掩的,从来不公布这到底是怎么实现的,因为它怕别人去逆向工程它。那 DeepSeek R1直接一鸣惊人复现了一个东方版本,就给整个 AI 产业带来非常大的震撼。
Shaun,Hey Revia 联合创始人&CEO
我最早听说DeepSeek是去年他们放出成本仅为Llama的十分之一甚至百分之一的API,当时就是有很多我身边的朋友第一时间就切到了 DeepSeek 。因为很多人要做的事情非常的基础,并不需要一个非常大、非常智能的模型。所以如果说这个成本能够是比如1%或者千分之一的话,所以很多人其实是愿意尝试。
DeepSeek这个模型的从去年到今年最大的变化是它的开源方式,它开源的是它的paper 。就是其实整个硅谷里边,无论是 OpenAI 还是Anthropic,在他们在讨论技术文献的时候都说得遮遮掩掩的,他经常不会告诉你他们怎么去实现的。像 R1 它的这篇 paper 发出来之后,很多人其实在用更小的模型来复现它的能力,然后也达到了很多很好的效果。所以其实整个业界对于一个可以知道它是如何训练的模型非常感兴趣。
而且它应该是第一个开源的 thinking 模型。之前传统的模型,无论V3、Llama 还是千问,都不是 thinking 模型,就是正常的一个基座模型。但是通过这个模型就让大家真正感觉到这 AI 感觉变得更智能了,你能够看到整个 AI 是怎么去思考的,这其实让很多的湾区的开发者也非常的兴奋。多了一个 thinking 过程之后,你其实可以不但可以 prompt 它的本身解决的问题,同时还可以 prompt 它的 thinking 的过程,使最终效果非常好。
Emily,云启投资人
首先我非常赞同肖涵还有Shaun说的两个点吧。第一,即使到今天,deepseek 还是第一梯队模型里面唯一的开源,而且它这个开源是比较有诚意的,不仅有 MIT 的 license paper,相对来说把它整个训练的过程、数据的方法介绍得也比较详尽。即使到今天,虽然SOTA 模型还在卷,但有这个魄力开源的人还是非常少,这是一个非常具有冲击性的举动。
第二点就是所谓的训练和使用模型的成本。其实这是我们在云启一直比较坚信的,这也是为什么我们比较早开始投应用层,因为我们觉得在这个有限的算力下这并不是一个问题,一定会有创新的方法可以来提高算力的应用,不管是采取更高效的模型架构,还是更有效的训练方法。那事实证明,成本下来的速度比我们想象中还要惊人。
第三个点是可能我们今天没有讨论到的,就是整个 DeepSeek 的团队的架构和组织方式也给了我们很多启示。创业的团队包括人才方面非常的本土化和年轻化,这也是颠覆了大家以前的一个共识吧,因为以前可能大家都觉得 ok 只有硅谷或者硅谷的一些 core labs(核心实验室)出来的人可能有一个比较领先的优势。但后来会发现,其实在做大模型或者是深度学习中信念感这个东西也很重要。我看到 DeepSeek 梁总很早以前的一篇分享,他也提到了这个观点,但我觉得这个观点还是没有被足够的人认识。就是说在做大模型训练这种比较深度学习的过程中,因为它本身是 black box,所以你有信念感非常非常重要,就是你一定要相信这个事情能力可以达到,你才会愿意不断地去实验,因为这个过程其实是很艰辛的。
产业涟漪:
浅谈被DeepSeek改变的AI生态
Linda,云启董事总经理
首先我们从DeepSeek 模型本身聊起,在这波出圈之刚刚其实提到一个很重要的点是开源,确实的开源非常有诚意,而且直接把价格打下来,这些其实都是很重要的因素。所以接下来其实也蛮想请两位创业者来聊一聊,这些特征对各自的这个业务带来了哪些机会,可能也会带来哪些挑战,这个我不知道。
肖涵,Jina AI创始人
从成本和这种商业模式来讲,对DeepSeek来说没有太多可分析的,它的商业模式的重点不在于这里,至少目前来讲也不需要去关心说这块赚不赚钱。
对于 AI 环境中的其他玩家而言,相对来说处于同一个模型层面的,比如像Together AI、Cohear、Mistral等等,这些模型厂商可能就会感觉到压力比较大。因为他们自己的模型性能不如 DeepSeek,还收那么贵的钱,这个时候他们就会调整自己的定价策略。
那对于很多云厂商来说其实不受DeepSeek冲击,相反的话,因为他们看到其实有很多企业内部的需求,需要在企业环境内部署。所以从整个生态上来讲呢,我觉得是有人欢喜有人忧吧。欢喜的就是可能是那些本来就不是处于同一平面的那些玩家,要么在上游,要么在下游的推理平台,可能会比较开心一些。苦的就是同处于同一平面,做相同的这种 AI 大模型的,他们可能会更加卷。
对于Jina本身,2025年可能又是一个搜索元年,每年都是搜索的元年哈哈,我们每年都想今年不一样。2024年讲的是RAG,2023年讲的是向量数据库,2025年又是一个搜索元年,叫 agenic search ,基于代理智能体的 search。同时要一直深挖,我们刚出了一个deep search的功能 ,就是基于逻辑链在 search 的同时不断进行推理。
为什么今天可以做这个事情,而2024年、2023年不可以做这个事情?其实还有一点就是多谢 Open AI 和 DeepSeek ,他们把人们的观念从搜索只能几百毫秒之内完成带到可以允许你一分钟之内完成这么一个价值观。Sam Altman 和 Noam Brown 开始说 test time compute 之后,大家逐渐的接受了 ok 模型推理可以慢,但是你慢到最后你要给我一个直接可用的结果。这种搜索的理念就完全是这种自动驾驶的搜索,这是2025年的一个非常重要的趋势。
现在百度、微信都接入了DeepSeek来加持搜索功能,Perplexity、OpenAI、Google都在更早发布了自己的Deepsearch产品。从Google 这样的市场领导者的角度来看,这是一个充满危机的时间。我一直跟我们同事说,今天就是“造谷歌反”最好的时间了。
Shaun,Hey Revia 联合创始人&CEO
我们处在AI Agent赛道里边,对我们来说DeepSeek的突破意味着可以用更低的成本调用更高水平的 intelligence。比如传统来说,我要 cover 我的成本,我最多可以取代十美元一小时的这些人。我才能做他的事情,因为我一旦要把 compute 拉起来之后,我成本不划算了。现在把这个成本一下就拉了,即使是取代时薪3-4美元的这些人,我也可以赚到钱了,这个和以前是不一样的。
(Q:在多步骤任务的处理上有没有很大的提升?)
比如说医疗管理中一个比较标准的场景,是跟有医疗管理需求的人沟通的时候给对方创建一个ticket,现在的AI Agent也基本上是在这个ticket系统里面跟人“抢活儿”。比如面对一个有减重需求的病人,你要给他开药的话,需要他证明说之前用过是否用过同款药物,这需要通过面对面沟通、拍照证明等很多个步骤来完成,整个周期也会非常久。现在基本可以1-2天搞定这件事。
但health care整体是一个比较传统的行业,其实有一些客户对于 R 1是有顾虑的,他们有一些观点认为R1使用的时候肯定有“后门”,有的时候不太容易解释。所以即便R1的成本更低,客户可能也更愿意使用其他更受认可的模型。
Linda,云启董事总经理
Emily可以给我们分享一下有哪些印象深刻的DeepSeek的应用案例,和相应的启发?
Emily,云启投资人
关于就是能力上限提高事情,确实是非常非常惊艳,也正因如此,我们以前可能觉得它做不到的事情。一个比较明显的应用案例是金融领域,我最近经常让DeepSeek分析投资项目,我觉得基本上可以达到一个 junior analyst 的水平,因为它在信息搜索概括和分析上可以做到非常非常的不错的。
第二我个人觉得非常有意思的点是,DeepSeek用下来,我发现它其实是一个情商还蛮高的工具。它对于心理学,对人物的性格和语言的分析的能力非常非常强的。我不知道是不是训练数据里有很多这样的部分,
所以说回来就是从我们偏投资和创业的角度来讲,从product market fit来说,就是对模型的能力的上限还是要有一些信念感,找的领域一定要找这种就是能够leverage模型上限更高的场景吧。之前其实我们在投一些项目或者包括跟创业者 brainstorm的时候也会面临一个很难的问题:你到底是做 copilot 还是fully automated agent。那今天我们来回过头来看,肯定觉得还是要做 fully automated agent 。包括选择的领域或行业要有比较高的附加值,就是因为这样的行业相对来讲商业化的压力会轻一点,因为大家愿意付费的能力更强。可能你作为一个创业企业前面一年会跑得相对轻松一点,因为在这么卷的情况下,大家会对公司的整个落地的速度有更高的要求。
竞争升级:
Grok 3 如何搅动行业格局?
Linda,云启董事总经理
最近马斯克又放大招了,刚刚发布的Grok3在推理、编程能力、多模态能力上都有很显著的提升。也想听听两位创业者对这个模型的看法。
Shaun,Hey Revia 联合创始人&CEO
Grok3发布第一天我就在尝试了,它现在放的功能应该是 thinking ,还没有放出那个 deep search。至少我上次 check 的时候是这样。其实我自己的感觉没有觉得它比之前的版本有好很多,当然我可能也是习惯了已经最近习惯用 deep research。当然我可以可能还需要多尝试一下。至少Grok出来的时候让大家就意识到我们还没有 hit the wall ,增加更多的算力、更多的机器,跑更长的时间、需要更多的energy,这是没有问题的。包括他们说的现在还在在加更多的机器,后面还有更多大招要不停地往上往上往上放。总的来说就是,卡是大家都是还要囤的。
我其实稍微对比了一下它的这个 deep research 和它现在Grok的这个 thinking,我觉得Grok think 的东西更多一点,当然它后面会把Deep search也放出来。但是我其实对它的 coding 能力还有一些质疑,就是我看到的一些 post 并没有像他说的这么厉害,当然也还是可能需要多试一下。
肖涵,Jina AI创始人&CEO
从模型层面来讲,大家竞争越激烈越好。因为对于应用层来说主要是看哪个模型在性能比较好的同时比较实惠。我之前比较关注的是Google Gemini 的2.0 flash,这实际上是一个非常好的一个模型,但是可能因为 google 之前比较低调吧,他们发布的几个模型其实有些确实还挺不错的,但是可能大家觉得你都是 google 了,对它的期望会更高一些,所以对它没有太多的关注,但是我们本身实际上用 Google 的模型用的非常多,我们主要是看中的是大模型的上下文的窗口,一定要长,因为我们做搜索的。包括现在很多 Agent 做reasoning model 之后,要把 reasoning chain 加到一些代理智能体的这个 prompt 中,这个本身就是一下就多了几千个字。要不断地去做 reason 的话,这实际上对于模型本身的上下文“大海捞针”的这种能力实际上是要求非常高的。
随着 reasoning 的模型起来之后,很多设计范式也会发生变化。比如说之前我之前在 twitter 上提了一个问题:现在有多少 chat app。把 think 这个事儿单独渲染是吧?其实我上周去问这个事的时候,就是几个大的本地版本的 chat app,其中50%都没有拿 think 这个东西去单独渲染。那think这个东西其实就是从应用层来说有可以很多可以做的,从模型的设计层也有可能有很多可以玩的。包括 prompt 的设计、包括大模型上下文检索的能力,其实都可以往里插进很多东西。我认为2025不管 Grok、 Open AI还是Llama,大家都会越来越多往think的reasoning model 的能力去走。但是可能到5、6月份,大家对于 think 这种东西玩腻了之后,可能会有一些回归,会觉得这种think的过程这种能不能就别弄出来了,可能看着好玩而已。
本期完整内容,欢迎通过小宇宙app订阅「Attent!on」频道收听~
播客时间轴
Part 1 技术破局:DeepSeek破圈背后
00:05:12 经济实惠的DeepSeek,为什么现在才火?
00:07:03 DeepSeek R1发布时点的选择,暗藏玄机?
00:10:32 “被动出圈”的必杀技:诚意开源、诚意thingking
00:12:37 DeepSeek冲击波,硅谷圈怎么看?
00:14:57 从成本到团队,被更新的投资人认知
00:19:34 硅谷创业者视角:反向技术输出实现了吗?
Part 2 产业涟漪:浅谈被DeepSeek改变的AI生态
00:20:56 上下游冲击:模型厂商、云厂商、托管平台……谁喜谁忧?00:24:37 从RAG到Agentic Search,又一个“搜索元年”要来了?
00:31:11更高维的智能VS客户层的担忧:应用层的机会和挑战
00:36:39金融、心理、情感……DeepSeek应用潜能,被开发到什么地步?
00:41:31创业启示:“信仰”模型能力上限、深耕行业domain认知
00:44:19马斯克 Grok3 如何搅动大模型“战局”?
Part3 浅谈趋势:2025的关键赛点
00:52:04 投资人视角:2025 AI 生态三个看点(多模态能力提升、alignment、AI+硬件)
00:56:31 AI 创业者生存法则:
对卷有心理预期;敏锐捕捉AI技术迭代速度和能力上限;把事情做得lean(精简高效)更mean(出色)