钛媒体:引领未来商业与生活新知 14小时前
从“不敢想”到“能做到”,专属模型能成为行业共识么?| 2025 ITValue Summit前瞻之AI落地指南系列①
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

在AI技术浪潮下,企业正从通用大模型转向训练专属模型以提升应用效果。壹生检康通过与钉钉共创,成功将妇科大模型准确率提升至90.2%,并通过了国家妇产科卫生高级职称考试。这得益于其在数据分布均匀性、高质量精标数据以及高效训练流程方面的突破,形成了专属模型训练的“铁三角”。钉钉作为“AI基础设施提供者”,通过全链路工具链降低了企业训练门槛。AI的落地正经历从知识管理到经营决策,最终指向生产工艺流程自动化的三个层次演进,专属模型成为释放AI潜力的关键路径,其形成得益于技术可行性、商业合理性及生态完备性。AI的未来趋势是大数据小模型,企业应聚焦数据与行业专家结合,以实现AI的真正价值。

🎯 **专属模型成为AI落地新共识**:随着通用大模型能力边界显现,企业认识到智能体上限在于模型能力,纷纷转向训练专属模型以实现高精度应用。壹生检康通过与钉钉合作,成功将妇科模型准确率从70%提升至90.2%,证明了中小企业也能训练出高精度模型。

📊 **“铁三角”构筑高精度模型训练路径**:高质量的专属模型训练依赖于三个关键要素:均匀的数据分布,确保模型在各个细分领域都有足够样本;高质量的精标数据,为模型提供准确的训练依据;以及高效的训练流程,优化训练效率和效果。这三者共同构成了专属模型训练的“铁三角”。

🚀 **钉钉赋能企业AI训练生态**:钉钉定位为“AI基础设施提供者”,通过提供全链路的专属模型打造工具链,降低了企业从零开始搭建技术底座的门槛。其“按效果付费”的商业模式,以及与客户共创的文化,为企业AI落地提供了坚实支持,尤其是在算力、训练环境和方法论方面。

💡 **“术”与“道”的辩证:智能体与行业模型**:智能体(Agent)更侧重于“术”的层面,提升应用体验的丝滑度;而行业模型则关乎“道”的本质,通过深度挖掘和利用行业数据,释放AI的真正潜力。企业在AI时代应重视行业模型训练,以实现数据价值的最大化。

📈 **AI落地分层与未来趋势**:企业应用AI正从知识管理、经营决策,逐步走向生产工艺流程自动化。AI的下半场趋势是“大数据小模型”的时代,核心在于数据与行业专家的结合,以及不断迭代优化的训练方法,从而实现AI价值的持续释放。

当人工智能从实验室走向产业应用,我们正见证着一场静默却深刻的范式革命。

在钛媒体2025 ITValue Summit前瞻之AI落地指南系列的首场直播中,钉钉CTO朱鸿、壹生检康创始人王强宇与钛媒体联合创始人刘湘明的对话,核心命题直指AI落地的本质:专属模型能否成为行业共识?

从“不敢想”训练自己的模型,到如今“能做到”90%准确率的妇科行业专属模型,王强宇的回答揭示了技术演进的必然逻辑——当通用大模型的能力边界逐渐清晰,企业开始意识到智能体的上限本质上是模型能力的天花板。这种认知转变并非一蹴而就,而是经历了从prompt工程到RAG技术,最终走向自训练模型的螺旋式上升过程。

特别值得注意的是,壹生检康将妇科大模型准确率从70%提升至90.2%的实践,同时还通过了国家妇产科卫生高级职称(正高)考试,不仅证明了中小企业也能训练高精度模型,更展示了一条可复制的技术路径:均匀的数据分布、高质量的精标数据、高效的训练流程,这三者构成了专属模型训练的“铁三角”。

朱鸿提出的“AI下半场是问AI要效果”的观点,进一步深化了这场技术革命的内涵。他敏锐地指出,企业应用AI正经历三个层次的演进:从知识管理到经营决策,最终指向生产工艺流程的自动化。

这种分层认知揭示了AI落地的渐进性——它不是一蹴而就的技术颠覆,而是逐步深入业务骨髓的渐进改造。

钉钉定位为“AI基础设施提供者”的战略选择,恰恰回应了这一需求:通过全链路工具链降低专属模型训练门槛,让企业无需从零开始搭建技术底座。

对话中最具启发性的讨论聚焦于专属模型训练的现实挑战。王强宇坦言过程中多次“练不下去”的困境,这些技术卡点包括训练数据质量不佳、训练流程不规范、强化学习效果不稳定等。这些因素促使他们找到了解决方案——与钉钉团队深度共创。

这种合作模式打破了传统甲乙方关系,形成了算法专家与行业know-how的化学反应。朱鸿特别强调的“信任建立”与“目标共识”,道出了AI落地中最容易被忽视却至关重要的因素:技术实现必须与业务目标对齐。当企业清楚定义“什么是足够好的模型”时,技术团队才能有的放矢地优化训练策略。

关于智能体与行业模型的争论,实质上反映了AI应用的不同哲学取向。王强宇“智能体更多是‘术’,行业模型才是‘道’”的观点,引发了关于AI价值创造方式的深层思考。这种观点并非否定智能体的价值,而是强调数据驱动的行业模型才是释放AI潜力的根本。

展望未来,对话传递出一个明确信号:专属模型正在成为AI落地的共识路径。这种共识的形成源于三个关键因素:技术可行性(基础大模型+大数据的有效组合)、商业合理性(按效果付费的商业模式创新)、生态完备性(平台型企业的基础设施支持)。

附上本期直播时间轴,帮你快速跳转感兴趣的部分

00:45 智能体上限是模型能力,自训练模型成为出路

14:21 AI下半场,可能是大数据小模型的时代

29:00 专属模型训练,卡点在哪

40:03 只做Agent不做行业模型,相当于只做“面子”不做“里子”

以下为对话实录,经编辑整理:

智能体上限是模型能力,自训练模型成为出路

刘湘明:各位观众大家好,欢迎来到钛媒体举办的AI落地指南系列的直播的第一场。今天也特别高兴邀请到了两位嘉宾,他们是钉钉CTO朱鸿(一粟)、壹生检康创始人王强宇。

去年9月份,强宇在钛媒体三亚的IT价值峰会上面有一个很重要的发布,过去一年,产品做了哪些升级迭代?

王强宇:其实最重要的迭代就是我们从做Prompt和RAG,变成是自己训练一个妇科大模型。因为我们逐渐发现,尽管我们做了很复杂的Prompt,智能体的准确率到了70%左右,再往上走就非常难。

我们从今年1月份开始考虑自己训练模型,当时正好也是DeepSeek比较火的时候。DeepSeek的开源给了我们训练模型的新思路。在三月底四月初的时候,我们和钉钉团队做了一些交流,他们很快就提出来说可以支持我们,支持中小企业创业公司来做模型的训练,我们就在钉钉的专属训练平台上做了很多共创。

早期主要是从SFT需要的环境和卡的算力去考虑,之后也是把数据标注的问题做了重新的梳理,包括训练的整个流程,我们最新发布版本的妇科大模型准确率,在六个症状上面可以达到90.2%。我们也用在了我们自己的“闺蜜医生”产品上,一个32B的小模型只需要2张4090卡就可以跑通(含推理)。

这说明,小模型完全可以训练出来,也完全可以跑得起来。闺蜜医生是个toC的应用,解决了很多15-25岁女生遇到的各种妇科问题,所以我们觉得这个路径完全可以走得通,这也是我们这次和钛媒体一起来聊这个话题的原因。

刘湘明:你在钛媒体上发了两篇文章,效果都非常好,都是这种非常深度的技术,你提到关键的优化,包括针对一些合成数据,高质量的数据,对这种诊断的准确率提升有很大关键的作用,到底是做的哪些事情呢?

王强宇:主要做了这么几件事情。

首先就是数据的准备工作,从数据的清洗到数据的分布,我想先解释一下什么叫精标数据,对于医学来说,其实我们说的妇科的六大症状就是从月经不调到异常出血,到外阴瘙痒,到白带异常等六个症状。我们过去的数据其实没有很均匀地分布在这六个症状,所以首先我们把数据做了一个很均匀的分布;

第二,我们把数据从症状信息到思考过程,到诊断的结论,做了一次非常认真的标注,从几万条数据中提取出来几千条精标数据;

第三,我们跟钉钉团队共创。钉钉也有支持我们的算法团队一起共创和研究pipeline(流水线并行),因为在有了算力以后,需要有一个步骤去分步去训练这个模型,我们把过去二十多个小时的训练时间压缩到了7个小时,这个过程其实就离不开钉钉对我们非常具体的共创和支持。

我们每次训练都会做迭代和数据优化,准确率逐渐从70%多到83%,最后几天才到90%。

当然这里面还有一件事情我觉得比较重要,就是从管理监督学习的SFT到算法专家调整奖励参数、函数等,有了钉钉这样的一个平台,我们创业公司就有一个更好的底座和基础来训练。

所以其实我觉得最大的一个收获,toC应用有数据和算力还不够,需要有行业专家来一起来做这件事情,过程还是比较曲折的,中间有几次都练不下去了,在训练环境上,在数据的标注的方法上,在训练的整个的流程上面,其实都有很多地方是有一些know-how的。

刘湘明:听强宇刚才的介绍,其实你们跟钉钉的合作,其实跟原来甲方乙方的合作好像不太一样了,一粟能不能介绍一下?

朱鸿(一粟):随着通用大模型能力越来越强,好像公众都已经普遍在接触AI了,我们发现AI技术逐渐成熟,尤其像强化学习这样的技术,能够大幅降低训练成本。

我们的基本判断就是,AI大模型的下半场就是问AI要效果,70分可能只是及格,我们要实现具体任务的高准确度,一定要通过科学的训练方法,产生出一个有效果保障的模型,这是钉钉需要去做的事情。

确实如强宇所讲,训练模型实际上也是真的是需要勇气,因为未知的东西太多。训练模型本身并不是一个高度确定性的事情,尤其是我们现在还在几十张卡的训练环境,如果我们走向百卡、千卡甚至万卡的训练,预计挑战会更多。

关于这件事情的价值,就是进入到企业级AI领域,我们也有一些思考,企业用AI一般分成三个层次。

第一个就是做企业知识的管理,提升信息检索或企业内部问答的效率,门槛也不会很高,我走访了可能几十家企业,90%的企业都已经在内部开始实施知识库的应用。

第二个层次就是经营决策类的辅助,对经营管理做出一些辅助决策,优化资源的配置,比如说像电商里的销量预测,价格的一些优化,或者搭建大数据的看板。我们也做了一些尝试,在招聘领域做简历的初查,这些应用也开始在各行各业里面产生一些新的效果,但是Agent的能力上限,其实就是模型的创新,模型的能力有多少,Agent很难去超越,所以我们就有这个决心去和行业共创垂直行业大模型。

我们也希望能够更快进入到企业应用AI的第三个层次,就是生产工艺流程的自动化,融入到企业的核心流程里,推动像制造行业的智能制造、供应链的优化、库存的智能调度,包括我们看到一些行业多模态模型的应用,老师傅的经验可以被训练到模型里,比如在产线听到锅炉或者发动机的声音异常,老师傅一听就知道可能出问题了。

但如果没有非常昂贵的监测系统的话,实际上我们可以用非常廉价的这种设备,结合一些新的标注,让老师傅来成为这个模型的训练师标注师,通过训练模型的方式,能够产生一个AI识别锅炉的声音的功能,诊断下是否有安全隐患。

类似于这样的小模型,其实也能够在企业经营、生产管理上产生效果。所以钉钉大模型的下半场,我们的定位就是为千行百业做专属模型,认真做好AI的基础设施,提供全链路的专属模型打造工具链,做好服务,也是要跟我们的客户行业标杆一起,探索AI能够为企业未来带来什么样的价值,我们做好赋能的工作。

AI下半场,可能是大数据小模型的时代

刘湘明:强宇刚才也介绍了很多,那么,做行业模型这件事的源泉和逻辑是什么?

王强宇:我非常认同一粟讲的观点,智能体的上限是模型的能力。我们去年9月份参加了钛媒体的数字价值峰会,但走到12月份的时候,我们已经发现,其实靠智能体已经走不下去了。

我觉得行业模型的训练是智能体走下去的一个必然、一个终局的选择。当然正好也出现了通义QWEN,能力很强,又出现了DeepSeek,确实也有关系,昨天晚上我跟一个朋友在聊,他们也说到,可能下半场是大数据小模型的时代。

行业模型就是我们认为的大数据小模型的时代。从我们自己训练模型的体会,我们最深刻地体会,可能还是深度共创,钉钉是具备这样的土壤和环境的。所以我其实很感谢钉钉,既非常敏锐地看到了这样的一个机遇,又非常开放地给垂直公司这样的机会。

因为对于中小创业公司来说,有几个很大的瓶颈。第一个就是算力资源,我们都很清楚,由于地缘政治的原因,算力资源对中小企业来说是非常难的,不是光有钱的问题,可能有钱也不一定买得到。

第二,就是训练环境的搭建。钉钉团队给了我们非常大的支持。因为他们有一些做过行业训练或者做过基模训练的工程师和专家,可以帮助我们快速搭建行业模型的训练环境。这看起来好像没有那么难,但是实际上自己要摸索蛮长时间。

第三,就是训练方法,有数据是不是就能训练出一个高准确度的模型?不一定,因为你需要有一个正确的训练方法,这就是我们经常说的算力、算法和数据的关系。打个比方,数据相当于做菜的原材料,光有原材料是不是就能做一桌好菜,你还要有很好的烹饪的方法,烹饪的流程,这个就是钉钉提供的东西,所以这几个东西其实钉钉都能够很好地提供。

钉钉又是很懂行业的一个应用,所以我觉得这才是未来中小企业释放数据活力的场景。

刘湘明:一粟有什么补充么?

朱鸿:我简单补充一下。强宇讲得很好,从成本上来讲分三部分:第一部分是数据,第二部分是整个算力以及工程链路,第三块是算法的人才成本。

钉钉希望能够为企业实现一个按效果付费的训练,按需付费的推理。

在AI技术发展的早期,这个投资大家也不确定,投下去到底能产生多少的价值,钉钉愿意为各行各业去提供一个效果导向的专属AI工厂,送进来的就是很好的原料,数据是企业的私有,以及企业的业务专家人才。

我们是算法,对这些数据的质量以及训练的目标做测试,确定投入下去有效果,整个训练过程有可能产生一些问题,这些问题都是钉钉去解决。我们希望在双方投入下去之前,就对模型的能力就有一个共识,基于这个共识,我们一起努力地把这个专属模型有效地生产出来,所以钉钉希望在AI的这个时代,实现AI按效果付费的商业化的解决方案。

刘湘明:特别好。因为大家现在到AI时代都在谈按效果付费,钉钉好像第一个把这个大旗举起来,我想追问一句,就是你说按效果付费,你们的底气来自于什么地方?因为刚才也谈到了,其实之前我们过去几十年,大家都想走这条路。

朱鸿:这个底气,第一来自于阿里云,尤其像大模型的训练过程中,积累沉淀下来的知识,以及最大的算力供给。我们可以在非常短的时间内去调度百卡甚至千卡的算力。我们也期望未来每家企业都有不止一个专属模型,并且能够通过钉钉上的数据闭环链路,实现一个模型可以每天迭代。就像我们现在开发钉钉的应用,快速迭代适应业务的一些不确定性。

整个阿里集团,包括钉钉积累的经验、知识、人才,以及钉钉已经连接了中国最广泛的企业,尤其是像制造行业、零售行业的标杆客户。他们有这样的意愿和我们共创。

这也是钉钉一直以来坚守的产品文化,我们不去定义太多,不是站在自己平台的角度去定义产品,而是跟我们的客户去共创。

产品来源于真实的场景需求,将阿里的技术普惠化,让技术和业务比较深入地去结合,以最终效果为导向去衡量。当然最重要的就是客户的信任,才有这样的一个底气。

刘湘明:话题回到强宇这边,你们有没有估算过效果是什么样的?

王强宇:这其实也是我想聊的话题,从六月底达到90%准确度之后,我们很快就已经部署到闺蜜医生这么一个to C应用上。刚刚我们和美年大健康的合作伙伴还在演示我们的产品,我们其实就部署了几张4090的卡,回答的速度和准确度,跟DeepSeek已经在体验上没什么差别,我们也有一个功能是深度思考的,叫问症状的功能。

每天几千个、上万个用户已经在用,我们的客户已经都在用这个妇科大模型,效果还是令人满意的。

第二,我们现在已经准备向一些医院开放这样的能力了,特别是一些专科医院,妇科的医院。我们其实也在跟医院聊,通过医院的数据训练医院的专科大模型。

中国其实有很多这样的专科医院,我们觉得应用场景非常广阔,很多医院的数据拿出来训练以后,可以很快这个专属模型达到医院的顶尖水平。

相当于每一个患者来这里预问诊的时候,就等于是医院最好的专家来帮他做问诊,再分解到线下的问诊,极大可以释放医院数据的能量和能力。

第三,我们跟钉钉也在继续训练妇科模型,下一步的目标就是从妇科到妇产科,另外我们的目标是通过妇产科的正高考试,目前最新的情况已经到60多分了,已经及格了,我们希望能到75分以上。

刚才一粟讲的按效果付费,我们不知道其他行业怎么样,就我们这个行业,我觉得完全是有机会的。

刘湘明:刚才提到了准确率,你可能需要跟观众做一些科普,在医疗行业里面普遍的诊断准确率大概是什么状态?

王强宇:这个数字听众听了以后,可能会比较失望。我们通过非官方的数据看到,三甲医院的估准率可能在30%到40%左右。当然这是非官方数据,不太准确哈。

那么出现这样问题的原因是什么?

第一,医生的就诊时间太短,我们都看过专家门诊,医生他也是人,他也不是神仙,在没有完全读到你的病历之前,他就要给你做判断,这个非常难。

第二,现在中国医院的数据还没有打通,你在A医院看的这个病,到B医院可能它是不连接的。医生没有办法像AI汇总数据,来判断你的疾病,所以这也造成了误诊的问题。

所以90%的准确度其实已经很高了。当然,这指的是医生判断的第一概率的疾病是什么,他跟真正专家线下标准来比较,可以到90%的匹配度。

AI的本质是普惠人民,就是让更多的人在医生不需要工作的情况下,把自己的症状放给医生,医生大概判断你可能是一个什么样疾病,这肯定可以极大提高人民群众的就诊的体验。

专属模型训练,卡点在哪

刘湘明:刚才你也提到一个很关键的问题,说有几次训练搞不下去了。直播间的人很多是行家,有人在问这个到底卡在哪儿,能不能跟大家交流一下细节?行家们都关注细节。

王强宇:第一个细节就是,我们在训练的过程中,有一段时间发现准确度怎么也上不去了,到了70它就掉回来了。我们就很困惑为啥上不去,算力也够,就是跑不通,就是上不去。

后来我们就发现,问题出在数据上,我们后来跟一粟团队的算法专家一起讨论,首先数据在六大领域是要均匀的,我记得是好像是外阴瘙痒这个症状,我们数据就很少,可能只有几千条数据,所以碰到这个症状的时候,机器就不懂,他就训不出来。我们后来很快花了很多时间去调整数据的分布,做精标数据的分布。

第二卡点,训练流程可能不一定对,模型需要一个很正确的pipeline训练步骤。你先要去做什么样的训练,后面再做什么。我们在钛媒体发的文章,基本上都核心的know-how说出来了,基本上没有怎么做保留。

后来我们和一粟团队建立流程之后,其实很快就找到了一条正确的道路。按照这个流程准备数据,准备数据了以后分步来训练,然后就看到准确率就逐渐地提高了。当然在强化学习上面可能还有一些困难和问题还没有完全解决。

因为我们后来发现,强化学习真的要让它出现好的结果,可能你需要的数据质量,包括分布可能有更高的要求。所以我们现在通过奖励函数去做更深的共创和研究。

刘湘明:一粟还有什么补充么?

朱鸿:我觉得第一个挑战还是一开始的信任。双方在第一周的合作里面,共同地建立起工作目标的认知,我们就是要做到高分,而且是有时间要求,我觉得这是第一个挑战。

前面讲到的数据问题,数据的配方确实是模型产生真正能力的关键,在这方面下了不少的功夫,那今天的技术人员在这个模型能力上不去的时候,诊断到底哪里有问题。这还是基于模型训练的专业知识,专家经验来判断能够给出定位问题,快速反馈以及双方一起再把这个问题解决,如果设置目标很低,其实他并不满足行业的生产的要求。

刘湘明:我们在去年在三亚也讨论过,大家很容易达到一个好像看着不错的分值,有的人说是三四十分,有的人说是六七十分。但是真正达到可用的优秀状态,其实中间有一个很难突破的瓶颈。也想请两位分享一下,你觉得到底是什么地方是卡点,怎么去突破这个瓶颈。

王强宇:深度共创其实还蛮难的。我觉得钉钉在这一点上我特别认可,刚才一粟也说了,钉钉是千行万业的钉钉,钉钉的定位有普惠的思想,一个大公司很难跟一个创业公司在一起做很深度的共创。

无招回到阿里之后,他还是把这个共创的大旗和文化重新树立起来了。大家都其实看过无招第一段创业,如果没有那家公司,可能钉钉的诞生至少要晚几年。

所以我觉得共创的文化和共创的精神,是解决卡点的精神和文化内因。我们跟一粟团队之间也非常亲密无间在合作。我们没有说这个数据不能给你看,你不能来了解我的这个know-how,一粟也没有觉得这个算法不是我的事,我为什么要替你去研究这个事。

回到模型训练这个事,连大模型都能训练出来,行业模型训练不出来么,肯定训练的出来。我作为一个创始人的角度,我理解就是说技术的困难确实有,但你做这件事情的精力够不够?是不是真的愿意把这些数据问题拿出来。

毕竟行业模型也不需要去做一个基模的创新,这些问题从理论上来说,其实都是有方案可以解决的,只是说能解到什么程度。钉钉很快补充了和吸引了很多算法人才进来,这可能也是解决问题的另外一个原因,这部分可能一粟可以更多讲一下。

朱鸿:行业模型要成功,关键的就是大模型算法或者工程技术人员和懂这个行业的人,大家互相信任,能够结合在一起训练模型。

我们可以看到,今天在行业里面,通用大模型的能力在不断提升,它实际上是利用了公开的几乎所有的知识,把它压缩到了一个大模型里。现在跑出来的模型应用,最多的是代码生成的模型,AI产品可以帮助工程师更快掌握全栈技术,了解技术原理,因为AI把互联网上学到的技术文档、知识,代码都学习了。

随着AI的技术发展,我觉得懂AI的行业人才也会越来越多,在行业里面的大模型更多被应用,被训练出来,被生产出来,所以要达到今天这个效果,我认为还是要让AI技术更加普及,能够到各个行业里去,跟行业的专家一起把行业大模型能力定义标准,我觉得AI效果的卡点肯定不是在算力上,一定还是在数据和人才的组合。

只做Agent不做行业模型,相当于只做“面子”不做“里子”

刘湘明:后边一个问题可能是比较有争议性,拆开两部分问:一部分其实是强宇,今年很热的一个话题就是Agent智能体,你们去年开始折腾这个事情,然后Agent今天变得非常的热;再回到一粟这边,钉钉其实把很多的关注度放在了行业模型的开发建设上,基本没有谈智能体。你们怎么看待智能体和行业模型未来的发展,沿着你们的思路,未来会有哪些机会?

王强宇:这个话题我也是挺想说一说的,智能体今年其实确实很热,包括MCP,包括智能体的一些公司Manus等,我是很认同一粟的观点,智能体的上限是模型的能力。

如果说是一个辩论大赛的话,我肯定是支持行业模型和垂直模型才是更好的AI下半场的未来的观点,因为智能体做得再好,你可能能做的事情就是把它的应用做得更丝滑、做得更方便,比如说MCP形态,可以把这个事情做得完成度更高。

但是如果我们不能把行业的数据挖掘出来,其实等于放着一个金矿,你没有去采。而是天天研究怎么能把门面做得更好看一点,门面做得好看,数据的威力发挥不出来,那么AI的算法算力怎么能够发挥作用。

我们作为行业应用公司,肯定是要把数据的力量真正发挥出来,让数据用到该到的地方去,我非常支持钉钉在行业数据这一块的研究,而且从千行万业的角度来看,行业模型训练才是最大能释放中小企业和各个行业公司生产力的机会。

因为智能体可能影响的就是这些PaaS的公司,但是我觉得还不是特别根本。所以我其实有一个观点,这个观点有点偏执,我觉得智能体更多的就是“术”方面的事情,“道”的问题还是要解决数据和训练的问题。

这个观点对不对,也要未来去验证,但是在今天这个时间点,我们来谈智能体更远的未来是什么,我觉得肯定离不开模型,离不开行业模型的训练,离不开这些数据使用的价值。

AI时代跟上一个数据时代肯定是相关联的,数据才是真正的原材料。如果没有原材料,AI时代怎么能够跑得起来好的应用?这是我的一个观点。

我还想补充一点卡点的问题,我们公司其实也是一个跨界的团队。当你做一个行业的时候,可能你需要跨界,除了算法工程师、应用工程师以外,我们还有一个全职的医学团队,他们都是医生出身,我最近听说蚂蚁有个团队中也有好几十个医生,所以就是说真正要把应用做到很好,创业者可能也要组建一个创业团队,在AI时代才会有机会把行业做得非常深入。

朱鸿:Agent和模型,我觉得是在AI技术发展过程中,大家的侧重点也在不断演进,整个行业里面模型训练的迭代速度越来越快。

从GPT 3.5到现在通义千问的迭代速度,过去可能一年一个模型,现在一个月好几个模型,我当然希望企业自己的模型也能够按日来迭代。只有这样,企业才能真正把AI的技术价值发挥出来

我觉得整个行业从业者都要积极思考,这里面会涉及到非常多的技术。比如去年大家谈很多微调,微调成本也不低的,今年更多就是强化学习,明年会不会有新的技术出来,我想一定会有。

这些技术迅速地被应用起来,原来需要做很多的Agent编排,这个工程工作是不是会被新训练的模型自动解决掉,让整个应用的体验变得更好,我想这一定是一个动态变化的过程。

我相信模型本身的能力会不断加大,但是企业的知识最终都是被训到专有数据库,它不会在一个智能体的编排的流程上。

刘湘明:强宇下定决心把重点从Agent智能体转到行业模型的训练上,这个决心有多难?刚才也谈到了行业模型,你们都觉得是一个更值得关注的趋势,企业尤其中小企业需要做好哪些准备?

王强宇:是这样的,我们当时从Agent转到模型训练,我们自己也在回顾当时的决策流程,其实我觉得当时的决策流程还挺平滑的,很自然地觉得应该去做模型了。

我们就开了一个合伙人的会,我现在回顾可能有几个因素:第一个就是DeepSeek的出现,大家都知道DeepSeek出现了以后,对整个AI行业带来很大的一个冲击,我们就发现原来基模还可以做得更好。

第二,还是智能体的上限是模型的能力,做到百分之六七十的时候,其实要再提高这个准确度,已经很难再往上提高,你自己看到这个瓶颈,所以你就自然会想到,我有数据可以微调,可以后训练。我们也当时看了很多论文,特别是强化学习发展得很快的,DeepSeek在强化学习算法上做了很多创新,才能把训练成本大幅下降。这也是回到模型训练的一个原因,当然我们也有这样的算法专家,能够看到这个趋势。

简单地说,就是两个因素,一个是你的准确度上不去了,但又想追求更好的体验给用户,要给用户更准确的结果,肯定去想新的办法,这很自然。第二个就是说因为类似于DeepSeek这样的模型出现,包括算法的迭代,我记得有位院士说的一段话特别有意思,现在看起来也是在验证那句话。就说AI行业现在发展很有意思,算力、算法在变革,现在看起来数据也可能会变革,它几个要素都在轮流变革,轮流变革就会带动这个行业轮流的创新和发展。

现在看起来真的是按照这个逻辑在走,所以我觉得这一轮为什么我们看好行业模型,我觉得钉钉的选择非常正确,除了使命正确以外,就是帮助中小企业来做普惠创新正确以外,其实数据给了大家这样的机会。

回到刚才那个问题,当时选择做模型训练还挺自然的。一个创业公司最重要的事情是要有自己的独立思考能力。而不是智能体热我就做智能体,模型热我就做模型,我觉得肯定是不对的,应该是依据客户价值和你的方向去做。

刘湘明:最后一个问题留给一粟,你刚才也谈了很多,可能很多企业也跃跃欲试,可能想训练自己的模型。他们在跟钉钉合作之前,需要做好哪些准备呢?

朱鸿:我认为投入做这个事情可能也要一把手决定,客户需要有数据,过去十年以来,很多客户通过钉钉实现从无纸化再到组织在线,很多业务系统都已经完成了数据积累,但是有数据和AI ready的数据,中间还是有些距离,所以我们会去积极评估。

双方的决心还是非常关键的,我们希望周期也不能太长,所以企业在数据准备和决心上如果有这样的共识,实际上我们主要的评估就是否具备一定的示范性。

刘湘明:那对于人才方面有没有什么要求,因为其实AI人才基本上都被大厂抓走了,是吧?

朱鸿:对企业来讲,我们更需要的是去懂这个业务的老师傅,他能够对模型的能力做出正确的评估。只要建立好这样的一个专家库,我们就有信心,把这个模型给确认好。

刘湘明:强宇有什么补充?

王强宇:我觉得钉钉现在正在形成标准,以后可能不需要我这样的人。但是需要老师傅,产品经理,包括对客户很了解的人。其实钉钉一样可以把它拆解出来。

因为钉钉有足够的算法和算力的专家,我甚至还会有外围的咨询公司来建设生态。我觉得完全有可能训练出行业模型。

(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI落地 专属模型 钉钉 行业模型 数据驱动
相关文章