热点
"Putnam-AXIOM" 相关文章
斯坦福揭秘o1-preview软肋!数学竞赛题稍作修改,准确率骤降30%
新智元 2025-02-01T16:15:32.000000Z
斯坦福揭秘o1-preview软肋!数学竞赛题稍作修改,准确率骤降30%
智源社区 2025-02-01T14:45:43.000000Z
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
量子位 2025-01-06T07:54:25.000000Z
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
智源社区 2025-01-06T05:07:08.000000Z
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
36kr 2025-01-06T03:03:27.000000Z