IT之家 07月20日 19:03
英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达发布了全新的OpenReasoning-Nemotron推理模型套件,该套件包含四个不同参数规模(1.5B、7B、14B、32B)的模型,均基于Qwen-2.5微调,并源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”技术,英伟达成功将大型模型压缩,降低了部署成本,使得标准游戏电脑也能进行高级推理实验。该套件的核心优势在于强大的数据支持,利用NeMo Skills生成了包含数学、科学和编程的500万个解答数据集,并通过监督学习进行微调。测试结果显示,即使是最小的1.5B模型也在数学竞赛中表现出良好的解题能力。英伟达将此模型定位为科研探索工具,并开放了模型检查点供研究人员进一步实验和定制。支持“GenSelect模式”以提升准确率,在多项基准测试中已超越OpenAI o3-high。

🚀 **模型压缩与易用性**: 英伟达通过“蒸馏”技术,将超大规模的DeepSeek R1 0528大模型压缩为OpenReasoning-Nemotron系列(1.5B、7B、14B、32B),显著降低了部署门槛,使得用户无需昂贵的GPU和云计算资源,即可在标准游戏电脑上进行高级推理实验,极大地提高了模型的可及性。

📊 **数据驱动的微调**: 该模型套件的核心竞争力在于强大的数据支撑。英伟达利用NeMo Skills生成了涵盖数学、科学和编程领域的500万个解答数据集,并采用纯监督学习的方式对模型进行微调,确保了模型在特定领域的专业性和准确性。

🏆 **卓越的数学与编程能力**: 测试结果表明,OpenReasoning-Nemotron模型在数学竞赛中表现出色,32B模型在AIME24中获得89.2分,73.8分(HMMT),即使是1.5B的最小模型也取得了55.5分和31.5分的成绩,展现了其优秀的推理和解题能力,甚至在某些基准测试中超越了OpenAI o3-high。

💡 **支持创新研究与定制**: 英伟达将该模型套件定位为科研探索的有力工具,并将其完整检查点在Hugging Face开放下载,鼓励研究人员进行强化学习等进一步实验,或针对特定任务进行定制优化。支持“GenSelect模式”即时生成多版本解答并筛选最优解,进一步提升了模型在实际应用中的准确性。

⚙️ **纯监督学习的起点**: 值得注意的是,该模型训练全程未引入强化学习,仅采用监督微调,为社区提供了一个干净且处于技术前沿的起点,便于未来开展更深入的强化学习相关研究,为AI领域的进步贡献力量。

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。

据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。

英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英伟达 OpenReasoning-Nemotron AI模型 推理模型 监督学习
相关文章