中美 AI 挑战东京大学入学考试：双双合格，英语优异，数学欠佳

IT之家 04月07日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

日本经济新闻联合研究显示，中美两国的新型生成式AI在东京大学入学考试中展现出惊人的潜力。其中，OpenAI的“o1”和中国DeepSeek的“R1”两个模型均超过了理科3类的合格分数线。尽管在英语方面表现出色，但在数学等科目中仍存在论证错误等问题。此次测试引发了对AI在教育领域应用以及未来人才需求的深入思考，预示着AI在学术领域的进一步发展。

🧠 测试结果显示，OpenAI的“o1”和DeepSeek的“R1”两个模型在东京大学入学考试中表现出色。在理科3类的考试中，o1获得了374分，R1获得了369分，均超过了合格最低分数线368.7分。

✍️ 在英语科目中，两个模型的得分率均超过75%，远超东大考生的平均水平。负责英语的久恒秀雄讲师表示，模型在单词和语法方面几乎没有错误。

📐 在数学科目中，模型虽然能够正确解答大部分问题，但在图形和论证问题上，出现了论述错误和说明不足的情况。o1在数学科目中获得了38分，R1获得了49分，远低于合格者的平均分。

💡 国立信息学研究所的新井纪子教授认为，此次测试是AI成长的重要里程碑，但同时也强调了需要能够正确判断和熟练使用AI输出的人才。

IT之家 4 月 7 日消息，据日经新闻 4 月 5 日报道，日本经济新闻与民间企业、大型补习班的联合研究发现，中美两国新型生成式 AI 已具备通过日本最难关东京大学理科 3 类入学考试的“学力”。两个模型在考察语言能力的英语中取得高分，但在数学中多次出现论证错误等问题。

此次测试让美国 OpenAI 的“o1”和中国 AI 初创公司 DeepSeek 的“R1”两个基础模型解答 2025 年度的东大入学考试题。AI 初创公司 Life Prompt（东京・新宿）输出了答案，并由大型预备学校河合塾的讲师进行评分。

大学入学共通考试和二次考试合计的理科得分（IT之家注：满分 550 分）中，o1 获得了 374 分，R1 获得了 369 分，两者均超过了东大在 3 月 10 日公布的理科 3 类合格最低分数线（368.7 分）。

R1 在理科 1 类和理科 2 类的共通考试中未达到合格最低分数线，但在其他科类中，与 o1 一起包括文科在内都“合格”了。

在二次考试中，得分率较高的是英语，o1 和 R1 的得分率均超过了 75%。河合塾负责英语的久恒秀雄讲师表示：“几乎没有单词和语法的错误，远远超过了东大考生的平均水平。”

数学方面，虽然最终答案正确的问题较多，但在图形和论证问题上多次出现论述错误和说明不足的情况。理科数学中，o1 在 120 分满分中得了 38 分，R1 得了 49 分。负责数学的香坂季京讲师指出：“这比合格者的平均分要低很多。”

自 2011 年开始的“机器人能否进入东京大学（东 Robo）”项目的负责人、国立信息学研究所的新井纪子教授对此次考试结果评价道：“这是 AI 成长的一个重要里程碑。不过，AI 有时会给出相当糟糕的答案，需要能够正确判断并熟练使用 AI 输出的人才。”

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签