Cnbeta 2024年12月25日
中国人工智能进步速度引美媒关注 AI模型将成为新的技术标签
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

《华尔街日报》报道指出,中国人工智能公司在大模型领域的进展速度超出预期。多家中国AI创业公司,如深度求索、月之暗面等,在模型性能上取得了显著突破,特别是在数学和编程等高难度任务上,部分模型甚至超越了OpenAI的最新模型。这些公司通过强化学习和混合专家模型等技术,在算力资源相对有限的情况下,实现了性能的快速提升。尽管估值和商业化仍面临挑战,但中国AI的崛起已成为不容忽视的趋势,正在构建属于自己的AI技术标签。

🚀 中国AI大模型在性能上取得显著突破,深度求索等公司在数学和编程任务上超越了OpenAI的最新模型。

🧮 月之暗面专注于强化学习,通过模仿人类试错过程,在提升模型性能的同时,降低了对算力的需求。

🧩 混合专家(MoE)模型技术被广泛采用,通过组合多个“专家”模型协同完成任务,腾讯的MoE模型性能可媲美Meta的Llama 3.1,且训练算力消耗更少。

🛠️ 中国AI公司利用自身优势,在擅长领域深耕,如深度求索专注于开源模型,月之暗面则推出擅长长文本处理的聊天机器人Kimi。

据《华尔街日报》报道,中国人工智能(AI)创业公司发布的大模型表明,他们追赶美国领先AI模型的速度要比业内许多人预期的更快。今年11月,深度求索公司(DeepSeek)发布了其最新大语言模型的预览版。该公司表示,该大模型在难度较高的数学和编程任务上超越了OpenAI在9月推出的预览版推理模型o1。

最近几周,其他中国公司也在其大模型性能方面也取得巨大进步。阿里巴巴和腾讯投资的创业公司月之暗面表示,它开发了一个专门研究数学的模型,性能接近o1。阿里表示,公司的一个实验研究模型在数学性能上优于o1预览版。

这些公司尚未发表介绍其模型的论文,因此难以评估这些说法,而目前还没有一个公认的统一测试方法来衡量AI模型的性能。不过,一些美国专家表示,中国公司在AI大模型上取得的进展令人印象深刻。

“中国正在以更快的速度赶上。”前OpenAI研究员、现AI企业家安德鲁·卡尔(Andrew Carr)称。他表示,深度求索的研究人员尝试复制OpenAI的推理模型,“在几个月内就弄明白了。坦白说,我的许多同事对此感到惊讶”。

月之暗面创始人杨植麟表示,公司专注于强化学习,也就是模仿人类的试错过程。这种方法或许能够在提升模型性能的同时不需要那么多的算力。


月之暗面创始人杨植麟

自去年年底以来,AI开发人员越来越多地使用一种名为“混合专家”(MoE,Mixture of Experts)的模型技术。该技术的核心是通过组合多个“专家”模型来协同完成任务。每个“专家”都是一个独立的神经网络,它们各自负责处理不同的数据分布和任务类型。这些“专家”之间通过一种称为“路由”的机制进行交互,路由机制根据任务的特点和需求,将输入数据分配给最适合的“专家”进行处理。

腾讯表示,该公司在11月发布的MoE模型可媲美Facebook母公司Meta在7月推出的Llama 3.1模型。审阅两家公司所发表论文的研究人员表示,腾讯训练模型使用的算力可能只有Meta的十分之一左右。

美国AI创业公司Anthropic的联合创始人杰克·克拉克(Jack Clark)在其博客上称,中国公司的方法就是利用其能够获得的硬件,构建极其优秀的软件和硬件训练堆栈,中国制造将成为AI模型的一个标签,就像电动汽车、无人机和其他技术一样。”他表示。

中国AI创业公司正在自己所擅长的领域深耕。例如,深度求索专注于开源模型,强调数学和编程性能。月之暗面的聊天机器人Kimi类似于ChatGPT,擅长处理长文本,受到中国消费者的欢迎。

不过,中国AI创业公司目前的估值还远低于OpenAI等美国公司,原因是投资者不确定这些公司能否将其技术进展变现。而激烈的竞争中,AI模型供应商之间的价格战也已经出现。

知情人士称,智谱AI已推迟了最早于2025年下半年上市的计划,因为投资银行家告知该公司不太可能获得其期望的估值。智谱AI在本月最新一轮融资中的估值约为30亿美元。今年11月底,智谱AI展示了其AI智能体,并在7月发布了类似OpenAI Sora的视频生成模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI大模型 深度学习 混合专家模型 中国AI 技术追赶
相关文章