Cnbeta 01月28日
英特尔前CEO已在其初创公司Gloo使用DeepSeek 而不是OpenAI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek开源AI推理模型R1的发布,以其高性能和低成本迅速引发行业关注。该模型仅用550万美元和两个月时间训练完成,性能却与顶级模型匹敌,对依赖昂贵NVIDIA芯片的AI行业构成挑战。英特尔前CEO Pat Gelsinger高度赞扬其低成本和开放性,并表示其公司Gloo将采用R1模型而非OpenAI。DeepSeek的成功展示了通过工程创新而非单纯依赖硬件投入来推动AI发展的可能性,并引发了关于AI成本、开放性和未来发展方向的广泛讨论。尽管存在一些质疑,但R1的出现无疑为AI领域注入了新的活力。

🚀 DeepSeek R1模型以极低的成本(550万美元)和极短的时间(两个月)训练完成,其性能却能与业界顶尖的推理模型相媲美,这颠覆了人们对AI模型训练成本的认知。

💡 DeepSeek R1的成功揭示了AI发展的新路径,即通过工程创新和优化算法,而非单纯依赖昂贵的硬件和计算资源,也能实现高性能的AI模型,这为AI的普及和发展提供了新的思路。

🌐 DeepSeek的开源策略打破了现有AI模型封闭的格局,其R1模型的开源将有助于推动AI技术的普及和创新,并对依赖闭源模型的公司形成挑战,加速了AI生态的开放化进程。

💰 DeepSeek R1的低成本特性,使得AI技术更加普及,有望在更多领域得到应用,例如个人设备(如智能手表、助听器)和嵌入式系统(如电动汽车),这将极大地拓展AI的应用场景和市场空间。

DeepSeek 的新开源 AI 推理模型 R1 引发了 NVIDIA 股票的抛售,并使其消费者应用程序飙升至应用商店的榜首。上个月,DeepSeek 表示,它使用一个拥有约 2000 个 NVIDIA H800 GPU 的数据中心,在短短两个月内训练了一个模型,成本仅为 550 万美元。

上周,它发表了一篇论文,表明其最新模型的性能与世界上最先进的推理模型相匹配。这些模型正在数据中心进行训练,这些数据中心花费数十亿美元购买 NVIDIA 更快、非常昂贵的 AI 芯片。

整个科技行业对 DeepSeek 的高性能、低成本模型的反应非常激烈。例如,Pat Gelsinger 兴高采烈地在 X 上发帖说:“谢谢 DeepSeek 团队。”

Gelsinger最近刚卸任英特尔首席执行官一职,他的本职工作是一名硬件工程师,目前担任其自己的 IPO 初创公司 Gloo 的董事长,Gloo 是一家面向教堂的信息和互动平台。他在英特尔工作了四年,并试图用英特尔的替代 AI GPU Gaudi 3 AI 追赶英伟达,去年 12 月离职。

Gelsinger写道,DeepSeek 应该提醒科技行业最重要的三个教训:更低的成本意味着更广泛的采用;在约束下,创造力才能蓬勃发展;“开放才是主流,DeepSeek 将帮助重置日益封闭的基础 AI 模型工作世界,”他写道。OpenAI 和 Anthropic 都是闭源的。

Gelsinger表示,R1 非常令人印象深刻,Gloo 已经决定不采用 OpenAI 并为其付费。Gloo 正在构建一项名为 Kallm 的 AI 服务,该服务将提供聊天机器人和其他服务。

“Gloo工程师今天正在运行 R1,”他说。 “他们本可以运行 o1——好吧,他们只能通过 API 访问 o1。”

相反,两周后,Gloo 预计将从头开始重建 Kallm,“使用我们自己的完全开源的基础模型,”他说。“这令人兴奋。”

他认为 DeepSeek 将使 AI 变得如此实惠,好的 AI 将无处不在。“我希望我的 Oura Ring 中有更好的 AI。我希望我的助听器中有更好的 AI。我希望我的手机中有更多 AI。我希望我的嵌入式设备中有更好的 AI,比如我的电动汽车中的语音识别,”他说。

Gelsinger 的高兴反应可能与其他人的反应不一致,他们不太高兴推理基础模型现在有了性能更高、价格更实惠的挑战者。AI的训练价格一直在上涨,而不是下降。

其他人的反应是暗示 DeepSeek 一定是以某种方式捏造了它的数字,训练成本一定更高。一些人认为,由于美国对中国的 AI 芯片出口限制,它不能说自己用什么方式获得了高端芯片。其他人则在它的性能上挑毛病,发现其他模型表现更好的地方。还有一些人认为,OpenAI 的下一个模型 o3 在发布时将远远超过 R1,现状将得到修复。

Gelsinger 对此不屑一顾。“鉴于大部分工作都是在中国完成的,你永远不用指望有完全的透明度,”他说。“但尽管如此,所有证据表明,他们的训练成本比 o1 便宜 10 到 50 倍。”

DeepSeek 证明,人工智能可以“通过工程创造力,而不是投入更多的硬件能力和计算资源来推动发展。所以这很令人兴奋,”他说。

至于这是一家中国开发商,以及对隐私和审查制度的担忧,Gelsinger 摇了摇头。他说:“中国人提醒我们开放生态系统的力量,对我们的社会、对西方世界来说,可能有点尴尬。”

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R1 AI推理模型 开源 低成本 工程创新
相关文章