Cnbeta 02月01日
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI正式上线竞品推理模型o3-mini,并首次向免费用户开放。该模型在解决编程、数学、科学等问题上超越了之前的o1模型。o3-mini支持用户调整推理努力程度,分为低、中、高三个级别,从而在速度和准确率之间灵活选择。测试显示,o3-mini在不同努力程度下,准确率显著提升。在AIME 2024测试中,最高努力程度的o3-mini准确率达到87.3%,在博士级科学问题测试中,准确率也达到79.7%。此次免费开放标志着OpenAI在AI模型普及方面迈出了重要一步,同时也提高了付费用户的服务体验。

🚀 OpenAI发布o3-mini推理模型,首次向免费用户开放,标志着其在AI技术普及上的重要进展。

⚙️ o3-mini模型支持调整推理努力程度,分为低、中、高三级,用户可根据需求灵活选择,在速度与准确率之间进行平衡。

📊 在AIME 2024测试中,o3-mini在最高努力水平下准确率达到87.3%,在博士级科学问题测试中达到79.7%,性能显著提升。

💰 ChatGPT Plus和Team用户使用o3-mini的速率限制提升到每天150条,ChatGPT Pro用户可以无限制访问,提升了付费用户的体验。

面对“东方AI力量”的压力,美国OpenAI公司周五正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。轻量级推理大模型o3-mini最早于去年12月的直播活动中亮相,一同亮相的还有“满血版”的o3模型。


(来源:OpenAI)

公司宣称,o3具备更先进、近似人类的推理能力,在解决编程、数学、科学等理工科问题方面均超越现役的o1模型。公司曾表示,o3-mini会在1月底先上架,o3则“会在不久之后推出”。

OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。

在周五的新闻稿中,OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。


在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。


横向对比,DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%,而在GPQA Diamond测试中的准确率为71.5%。

当然,DeepSeek的一大功劳,就是让OpenAI突然之间变大方了

OpenAI宣布,从周五开始,免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3-mini模型,这也是公司的推理模型首次向免费用户开放

对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户,能无限制地访问o3-mini。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI o3-mini 推理模型 免费开放 AI
相关文章