OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能

Cnbeta 02月01日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

OpenAI正式上线竞品推理模型o3-mini，并首次向免费用户开放。该模型在解决编程、数学、科学等问题上超越了之前的o1模型。o3-mini支持用户调整推理努力程度，分为低、中、高三个级别，从而在速度和准确率之间灵活选择。测试显示，o3-mini在不同努力程度下，准确率显著提升。在AIME 2024测试中，最高努力程度的o3-mini准确率达到87.3%，在博士级科学问题测试中，准确率也达到79.7%。此次免费开放标志着OpenAI在AI模型普及方面迈出了重要一步，同时也提高了付费用户的服务体验。

🚀 OpenAI发布o3-mini推理模型，首次向免费用户开放，标志着其在AI技术普及上的重要进展。

⚙️ o3-mini模型支持调整推理努力程度，分为低、中、高三级，用户可根据需求灵活选择，在速度与准确率之间进行平衡。

📊 在AIME 2024测试中，o3-mini在最高努力水平下准确率达到87.3%，在博士级科学问题测试中达到79.7%，性能显著提升。

💰 ChatGPT Plus和Team用户使用o3-mini的速率限制提升到每天150条，ChatGPT Pro用户可以无限制访问，提升了付费用户的体验。

面对“东方AI力量”的压力，美国OpenAI公司周五正式上线竞品推理模型o3-mini，并首次向免费用户开放推理模型。轻量级推理大模型o3-mini最早于去年12月的直播活动中亮相，一同亮相的还有“满血版”的o3模型。

（来源：OpenAI）

公司宣称，o3具备更先进、近似人类的推理能力，在解决编程、数学、科学等理工科问题方面均超越现役的o1模型。公司曾表示，o3-mini会在1月底先上架，o3则“会在不久之后推出”。

OpenAI介绍称，o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”，而需要效率时优先考虑回应速度。

在周五的新闻稿中，OpenAI披露，在2024年美国数学邀请赛（AIME 2024）的测试中，低推理努力的o3-mini准确率（60%）与o1-mini差不多，但速率更快；而在中等努力下，o3-mini准确率能够提升到79.6%，与o1模型相当。在最高努力水平时，o3-mini的准确率则能进一步提升至87.3%。

在博士级科学问题（GPQA Diamond）方面，三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。

横向对比，DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%，而在GPQA Diamond测试中的准确率为71.5%。

当然，DeepSeek的一大功劳，就是让OpenAI突然之间变大方了。

OpenAI宣布，从周五开始，免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3-mini模型，这也是公司的推理模型首次向免费用户开放。

对于付费用户，o3-mini将在模型选择器中替代o1-mini。作为升级的一部分，每月花费20美元左右的ChatGPT Plus和Team用户，速率限制也从o1-mini的每天50条，提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户，能无限制地访问o3-mini。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签