热点
"FrontierMath" 相关文章
AI七个月突破数学家“围剿”反超人类,14位数学家深挖原始推理token:不靠死记硬背靠直觉
36kr 2025-06-09T12:19:22.000000Z
What’s next for AI and math
MIT Technology Review » Artificial Intelligence 2025-06-04T08:58:22.000000Z
o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守
智源社区 2025-05-28T09:02:56.000000Z
o4-mini暴击六大数学天团 攻破陶哲轩难题 4.5h激战人类阵地失守
Cnbeta 2025-05-28T08:17:30.000000Z
o4-mini暴击六大数学天团,攻破陶哲轩难题,4.5h激战人类阵地失守
36氪 - 科技频道 2025-05-28T00:59:21.000000Z
40位数学家组成8队与o4-mini-medium比赛,6队败北
机器之心 2025-05-24T07:51:24.000000Z
Don't over-update on FrontierMath results
少点错误 2025-03-11T20:49:16.000000Z
o3数学成绩作弊大瓜!提前让测试机构给真题,60多名数学大牛全被蒙在鼓里
量子位 2025-01-21T17:09:43.000000Z
OpenAI 最强模型被曝造假!提前获取测试题,顶级数学家被蒙在鼓里
APPSO 2025-01-21T16:59:59.000000Z
o3数学成绩作弊大瓜!提前让测试机构给真题,60多名数学大牛全被蒙在鼓里
智源社区 2025-01-21T11:02:41.000000Z
o3被曝成绩「造假」,60多位数学泰斗集体被耍!OpenAI暗中操控,考卷提前看光
智源社区 2025-01-21T04:07:08.000000Z
因延后披露受 OpenAI 资助事实,AI 基准测试组织 FrontierMath 被质疑行为不当
IT之家 2025-01-20T14:22:26.000000Z
OpenAI 最强模型被曝造假,提前获取测试题,顶级数学家被蒙在鼓里
36氪 - 科技频道 2025-01-20T09:08:21.000000Z
o3被曝成绩“造假”,60多位数学泰斗集体被耍
虎嗅 2025-01-20T07:07:28.000000Z
OpenAI o3数学成绩作弊大瓜,提前让测试机构给真题,60多名数学大牛全被蒙在鼓里
36kr-科技 2025-01-20T06:37:40.000000Z
o3数学成绩作弊大瓜!提前让测试机构给真题 60多名数学大牛全被蒙在鼓里
快科技资讯 2025-01-20T06:06:12.000000Z
OpenAI 最强模型被曝造假!提前获取测试题,顶级数学家被蒙在鼓里
爱范儿 2025-01-20T05:46:15.000000Z
OpenAI最强模型被曝“造假”,发生了什么?
虎嗅 2025-01-20T05:07:06.000000Z
o3被曝成绩「造假」,60多位数学泰斗集体被耍,OpenAI暗中操控,考卷提前看光
36kr-科技 2025-01-20T04:05:16.000000Z
Some lessons from the OpenAI-FrontierMath debacle
少点错误 2025-01-20T03:03:53.000000Z