一、事件:Openai的实验性推理LLM在国际数学匹克(IMO)中达到金牌表现 1、答题过程:不联网&不借助外部工具(禁止使用计算器、编程环境(如 Lean)或访问互联网)、纯自然语言推理(读取PDF后用纯文本自然语言证明)、考试规则完全一致(两天,每天 4.5 小时)。 2、解答效果:6题完成5题解答,未来能否完成第6题成为下个关键节点。 3、重大意义:通用强化学习完成(普适性提高)、测试时计算扩展(深度思考多种路径、多种答案,输出最有证明) 4、乐观观点:AI通过训练自己加速进化的世界 5、