IT之家 01月12日
研究人员开源 Sky-T1 推理 AI 模型,训练成本不到 450 美元
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

加州大学伯克利分校NovaSky团队发布了开源推理模型Sky-T1-32B-Preview,其性能可媲美OpenAI早期版本的o1模型。该模型训练成本仅为450美元,远低于同类模型。Sky-T1的训练数据来自阿里巴巴的QwQ-32B-Preview模型生成,并由GPT-4o-mini重构。它在MATH500和LiveCodeBench等基准测试中表现出色,但在GPQA-Diamond测试中略逊于o1预览版。该模型训练仅耗时19小时,使用了8台Nvidia H100 GPU。NovaSky团队表示,Sky-T1是他们开发开源推理模型的起点,未来将致力于开发更高效、更强大的模型。

🚀Sky-T1-32B-Preview是首个真正开源的推理模型,其训练数据集和代码均已公开,用户可以从零开始复现该模型。

💰该模型的训练成本不到450美元,得益于合成训练数据的广泛应用,大幅降低了训练成本。

💡推理模型具备自我事实核查能力,能够有效避免一些常见错误,在物理、科学和数学等领域具有更高可靠性。

📊 Sky-T1在MATH500和LiveCodeBench等基准测试中表现优异,但在GPQA-Diamond测试中略逊于o1预览版。

⚙️Sky-T1的训练数据来自阿里巴巴的QwQ-32B-Preview模型,并经过GPT-4o-mini重构,训练耗时19小时,使用了8台Nvidia H100 GPU。

IT之家 1 月 12 日消息,本周,来自加州大学伯克利分校 Sky Computing 实验室的研究团队 NovaSky 发布了一款名为 Sky-T1-32B-Preview 的推理模型。该模型在多项关键基准测试中的表现可与 OpenAI 早期版本的 o1 模型相媲美。值得注意的是,Sky-T1-32B-Preview 似乎是首个真正意义上的开源推理模型,其训练数据集和代码均已公开,用户可以从零开始复现该模型。

NovaSky 团队在博客中透露,Sky-T1-32B-Preview 的训练成本不到 450 美元(IT之家备注:当前约 3306 元人民币),远低于以往同类模型的数百万美元。这一突破得益于合成训练数据的广泛应用,合成数据是由其他模型生成的数据,能够显著降低训练成本。例如,AI 公司 Writer 最近发布的 Palmyra X 004 模型几乎完全依赖合成数据训练,开发成本仅为 70 万美元。

与大多数 AI 模型不同,推理模型具备自我事实核查能力,能够有效避免一些常见错误。尽管推理模型在解决问题时通常比非推理模型需多花费几秒到几分钟,但在物理、科学和数学等领域,其可靠性更高。

NovaSky 团队表示,Sky-T1 的训练数据由阿里巴巴的 QwQ-32B-Preview 推理模型生成,随后经过精心筛选,并利用 OpenAI 的 GPT-4o-mini 对数据进行重构,使其更易于处理。训练这款拥有 320 亿参数的模型仅耗时约 19 小时,使用了 8 台 Nvidia H100 GPU。(参数数量大致对应模型的解决问题能力。)

在性能方面,Sky-T1 在 MATH500(一组“竞赛级”数学挑战)上的表现优于 o1 的早期预览版本,同时在 LiveCodeBench 的编程评估中也表现更佳。然而,在 GPQA-Diamond 测试中(包含物理学、生物学和化学领域的研究生水平问题),Sky-T1 略逊于 o1 预览版。

需要指出的是,OpenAI 已发布的 o1 正式版比预览版更强大,且预计未来几周内将推出性能更优的推理模型 o3。尽管如此,NovaSky 团队表示,Sky-T1 只是他们开发开源推理模型的起点。

团队在博客中写道:“未来,我们将专注于开发更具效率的模型,同时保持强大的推理性能,并探索先进技术以进一步提升模型在测试时的效率和准确性。请继续关注我们在这些激动人心的项目上取得的进展。”

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sky-T1 开源模型 推理模型 合成数据 人工智能
相关文章