Z Potentials 01月13日
速递|伯克利团队450美元训练新推理模型,堪比OpenAI o1预览版
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Sky-T1是加州大学伯克利分校团队发布的开源推理模型,它在多个基准测试中与OpenAI的早期版本具有竞争力。该模型的独特之处在于其完全开源,包括训练数据集和代码,并以不到450美元的成本训练完成,这大大降低了高性能AI模型开发的门槛。Sky-T1的训练数据部分来源于阿里巴巴的QwQ-32B-Preview,并使用GPT-4o-mini进行数据重构。该模型在数学和编码基准测试中表现出色,但在物理、生物和化学等领域略逊一筹。研究团队表示,Sky-T1只是他们开源推理模型开发的起点,未来将致力于提高模型的效率和准确性。

🚀Sky-T1是首个真正开源的推理AI模型,其训练数据集和代码均已公开,允许从头开始复制。

💰Sky-T1的训练成本仅为450美元,远低于以往同等性能模型的数百万美元,这得益于合成训练数据和高效的训练方法。

📊Sky-T1在MATH500和LiveCodeBench等基准测试中表现优异,超过了OpenAI的早期版本,但在GPQA-Diamond测试中稍显不足。

💡Sky-T1的训练过程利用了另一种推理模型生成初始数据,并使用GPT-4o-mini对数据进行重构,最终使用8个Nvidia H100 GPU在19小时内完成了32亿参数的训练。

TechCrunch 2025-01-13 11:54 北京

Sky-T1 似乎是第一个真正的开源推理模型,因为它可以从头开始复制;该团队发布了他们用于训练的 数据集以及必要的训练代码。

图片来源:Unsplash

所谓的推理 AI 模型变得越来越容易——也更便宜——开发。

在星期五,NovaSky,一个来自加州大学伯克利分校天空计算实验室的研究团队,发布了 Sky-T1-32B-Preview,这是一种在多个关键基准测试中与OpenAI 的 o1 早期版本具有竞争力的推理模型。Sky-T1 似乎是第一个真正的开源推理模型,因为它可以从头开始复制;该团队发布了他们用于训练的 数据集以及必要的训练代码。

“值得注意的是,Sky-T1-32B-Preview 的训练成本不到 450 美元,”团队在一篇博客文章中写道,“这表明以经济高效的方式复制高级推理能力是可能的。”

450 美元可能听起来并不那么实惠。但不久前,训练一个性能相当的模型的价格标签 通常在数百万美元之间。合成训练数据,或由其他模型生成的训练数据,帮助降低了成本。AI 公司 Writer 最近发布的 Palmyra X 004 模型几乎完全基于合成数据进行训练,开发成本 reportedly 仅为 700,000 美元。

与大多数人工智能不同,推理模型能够有效地自我核实,这帮助它们避免一些通常会使模型陷入困境的陷阱。与典型的非推理模型相比,推理模型通常需要更长的时间——通常是几秒到几分钟——才能得出解决方案。好处是,它们在物理、科学和数学等领域往往更可靠。

NovaSky 团队表示,他们使用了另一种推理模型,阿里巴巴的 QwQ-32B-Preview,来生成 Sky-T1 的初始训练数据,然后“策划”了数据混合,并利用 OpenAI 的 GPT-4o-mini 将数据重构为更易于使用的格式。训练 32 亿参数的 Sky-T1 大约花费了 19 小时,使用了一组 8 个 Nvidia H100 GPU。(参数大致对应于模型的解决问题能力。)

根据 NovaSky 团队的说法,Sky-T1 在 MATH500 上表现优于 o1 的早期预览版本,MATH500 是一个“竞赛级”数学挑战的集合。该模型在 LiveCodeBench 的一组难题上也超过了 o1 的预览版本,LiveCodeBench 是一个编码评估。

然而,Sky-T1 在 GPQA-Diamond 中比 o1 预览表现差,包含物理、生物和化学相关的问题,这些问题是博士毕业生应该知道的。

还需要注意的是,OpenAI 的 o1 GA 版本比 o1 的预览版本更强大,并且预计 OpenAI 在接下来的几周内将发布一个性能更好的推理模型 o3。

但 NovaSky 团队表示,Sky-T1 仅仅是他们开发具有高级推理能力的开源模型之旅的开始。

“展望未来,我们将专注于开发更高效的模型,以保持强大的推理性能,并探索进一步提高模型在测试时效率和准确性的先进技术,”团队在帖子中写道。“请继续关注我们在这些令人兴奋的计划上的进展。”

本文翻译自:TechCrunch, https://techcrunch.com/2025/01/11/researchers-open-source-sky-t1-a-reasoning-ai-model-that-can-be-trained-for-less-than-450/

编译:ChatGPT

-----------END-----------

我们正在招募新一期的实习生

我们正在寻找有创造力的00后创业

关于Z Potentials

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sky-T1 开源模型 推理AI 低成本训练 人工智能
相关文章