OpenAI抨击的“蒸馏”技术很多大型AI公司正争着用

Cnbeta 03月03日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

《金融时报》报道指出，OpenAI、微软和Meta等领先AI公司正在采用“蒸馏”技术，以开发更经济、更易于消费者和企业采用的AI模型，应对全球竞争。该技术利用大型“教师”模型生成数据，训练较小的“学生”模型，从而快速转移大模型的知识和预测能力。专家认为，蒸馏技术对于希望以经济高效的方式开发大模型应用的初创公司来说，将成为福音。借助蒸馏技术，开发者和企业可以以极低的成本获取大模型的能力，使AI模型能在笔记本电脑和智能手机等设备上快速运行。

💡 **蒸馏技术兴起：** 领先AI公司如OpenAI、微软和Meta正积极采用蒸馏技术，旨在开发更经济实惠且易于部署的AI模型，应对日益激烈的全球竞争。

👨‍🏫 **技术原理：** 蒸馏技术通过使用大型“教师”模型生成数据，进而训练较小的“学生”模型，以此高效地将大型模型的知识和预测能力迁移至小型模型。

💰 **成本效益：** 蒸馏技术使得开发者和企业能够以极低的成本获得大型模型的能力，极大地降低了AI应用的开发和部署门槛，尤其对算力有限的设备来说是福音。

🚀 **应用前景：** 专家普遍认为，蒸馏技术将成为寻求经济高效开发大模型应用的初创公司的理想选择，推动AI技术在更广泛的领域普及应用。

当DeepSeek在今年初凭借低成本模型一鸣惊人时，OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道，包括OpenAI、微软和Meta在内的领先AI公司正转用“蒸馏”技术，以便在全球竞争中开发出更便宜、便于消费者和企业采用的AI模型。

大型公司也开始利用蒸馏技术

通过蒸馏技术，企业使用一个被称为“教师”模型的大语言模型生成数据，然后用这些数据训练一个较小的“学生”模型，从而快速将大模型的知识和预测能力转移到较小的模型上。

虽然蒸馏技术已被广泛应用多年，但是近期的进展使得业内专家相信，对于寻求以经济高效的方法来开发大模型应用的创业公司来说，这项技术将逐渐成为他们的福音。

“蒸馏技术相当神奇，”OpenAI平台产品负责人奥利维尔·戈德门特(Olivier Godement)表示，“其本质上是利用一个非常庞大且智能的前沿模型来训练一个较小的模型……使其在特定任务上具备极强的能力，同时成本极低，执行速度极快。”

OpenAI的GPT-4，谷歌Gemini和Meta的Llama等大语言模型需要海量数据和算力来开发和维护。虽然这些公司尚未披露训练大模型的具体成本，但很可能高达数亿美元。借助蒸馏技术，开发者和企业可以以极低的成本获取这些模型的能力，使应用开发者能够在笔记本电脑和智能手机等设备上快速运行AI模型。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签