谷歌Agent深夜颠覆数学界！陶哲轩联手，解决300年难题或迎"AlphaGo时刻"

原创小鹿 2025-05-15 14:55 北京

今天凌晨，Google DeepMind 重磅推出了耗时一年半研究的智能体—— 「AlphaEvolve」，一个由 Gemini 驱动的通用科学智能体。

不止能解决 300 年数学难题，还用于发现新算法、改进芯片设计。

数学家陶哲轩也参与了这项工作：

发布后，网友给出超高评价：这是“AlphaEvolve 是数学界的 AlphaGo‘第 37 步’时刻”！

何为 AlphaGo 的‘第 37 步’时刻”?

2016 年，谷歌 DeepMind 开发的 AlphaGo 和世界围棋冠军李世石进行对决。在第二盘比赛中，AlphaGo 在第 37 手下出了人类围棋高手前所未见的一步（即“Move 37”）。这一手完全跳出了传统围棋棋手的思维，被许多围棋专家当场认为是“失误”或“怪手”。但随着比赛进程，这步棋展现出了极高的深度和远见，成为了 AlphaGo 最终获胜的关键转折点。

所以，“第 37 步时刻”象征着 AlphaEvolve 在数学上已经开始展现出类似 AlphaGo 当年那种突破性的创造力，能够做出人类未曾想到的、甚至是重大意义的发现。

DeepMind 科学负责人 Pushmeet Kohli 也在 x 上猛猛宣传了下 AlphaEvolve：

除了用来解决数学难题，公司已经将 AlphaEvolve 应用到了实际工作中。比如，优化了新一代 AI 芯片（TPU）的设计方案，以及提高了 Google 全球计算资源的利用效率，节省了约 0.7% 的总资源消耗。它产生了显著的实际效果

AlphaEvolve 目前的战绩如何呢，据 DeepMind 研究团队自述：

目前 AlphaEvolve 被用于攻克数学分析、组合学、几何学等领域的开放性难题。

75% 的情况下，AlphaEvolve 能够重现已知的最优解；

在 20% 的情况下，甚至能够发现超越现有记录的全新最优方案，

在其余 5% 的案例中，其生成的解法则略逊于已知最优水平。

除了推进数学和算法发现的前沿，AlphaEvolve 在真实场景中也开始发光发热了，谷歌目前已将 AlphaEvolve 应用于其计算生态系统（数据中心、硬件、软件），来提升整体效率：

数据中心调度： 发现一种启发式算法，将全球计算资源利用效率平均提高 0.7%。

硬件设计： 提出 Verilog 重写方案优化 AI 加速器（TPU）电路，已集成到即将发布的 TPU 产品中，加速定制芯片设计。

AI 训练与推理：

优化矩阵运算，将 Gemini 架构关键内核加速 23%，缩短 Gemini 训练时间 1%，节省计算成本并减少工程时间。

优化低级 GPU 指令，将 FlashAttention 内核加速高达 32.5%

矩阵乘法，56 年来首次进步

AlphaEvolve 非常贴近“科学家智能体”的概念，因为其能主动提出解决复杂数学难题的新思路。

首次，将 4x4 矩阵乘法从 49 次运算减少到 48 次，是 56 年来首次实现，超越了 Strassen 于 1969 年提出的、长期以来被认为是标杆的经典算法，

在计算机科学中，矩阵乘法是最基础且计算密集的运算之一，为了证明推动前沿的能力，研究团队让 AlphaEvolve 试图优化矩阵计算。

传统的矩阵计算对于两个 n×n 的矩阵 A 和 B，需要 O(n^3)次标量乘法（例如，2×22×2 矩阵需 8 次乘法）。当矩阵规模较大时，这种计算复杂度在时间效率上存在瓶颈。

1969 年科学家 Volker Strassen 发现，通过分治策略和减少乘法次数，可以降低矩阵乘法的时间复杂度。于是，他提出了一种递归算法：

将两个 2×22×2 矩阵的乘法从传统的 8 次乘法减少到 7 次，同时通过增加加法和减法的计算来弥补这一差异。

这一思想被扩展后，最终矩阵计算的时间复杂度降低至 O(nlog⁡27)≈O(n2.81)O(nlog27)≈O(n2.81)，成为首个突破立方时间复杂度的矩阵乘法算法。

而在此任务中，AlphaEvolve 经过系统性探索后成功发现了一种用于计算 4x4 复数矩阵乘法的高效算法—仅需 48 次标量乘法。

如下表所示：

表中总结了计算 𝑚×𝑛 矩阵与 𝑛×𝑝 矩阵乘积所需的标量乘法次数上限，即对应三维张量的秩。AlphaEvolve 针对多种矩阵维度组合⟨𝑚, 𝑛, 𝑝⟩进行了迭代分析测试，对于所有测试的参数组合且 𝑚, 𝑛, 𝑝 ≤ 5 的情况，AlphaEvolve 发现的算法要么匹配、要么超越了当前已知的最优解决方案。

对于诸如⟨3,4,7⟩、⟨4,4,4⟩以及⟨4,4,8⟩等特定维度组合，AlphaEvolve 发现的算法创新性地运用了复数乘法原理，这些算法不仅适用于复数矩阵，也可高效应用于实数矩阵的精确乘法。

这一成果显著超越了 Strassen 于 1969 年提出的、长期以来被认为是标杆的经典算法，刷新了该领域的已知最佳结果。

300 年的接吻数问题

接吻数问题（Kissing Number Problem）是离散几何领域的一个经典难题，难点在于确定在 N 维欧几里得空间中，最多有多少个互不重叠的单位球可以同时与一个位于中心的单位球相切。

这个问题自 17 世纪提出以来，已困扰数学界长达三百余年。

在 d 维空间中，这个最大数量被称为 d 维接吻数（d-dimensional kissing number）。对于 d = 11，此前已知的最佳下界是 592 。

为了证明 11 维接吻数的下界比 592 更多，AlphaEvolve 找到了一组由 593 个 11 维向量构成的集合，这些向量经过适当的缩放后，满足成为有效接吻构型中心点的几何条件：

所有点到原点的距离（范数）相等，记为 C：||p_i|| = C，对所有 i 成立。

任意两点之间的距离严格大于这些点的范数：min_i≠j ||p_i - p_j|| > C。

基于这一发现，通过将所有点以 2/C 的比例进行缩放，得到新的点集 {q_i = (2/C) * p_i}。

此时，新的点满足 ||q_i|| = (2/C) * ||p_i|| = (2/C) * C = 2，且 min_i≠j ||q_i - q_j|| = (2/C) * min_i≠j ||p_i - p_j|| > (2/C) * C = 2。这样就获得了 593 个 11 维点 q_i，它们距原点距离为 2，且相互之间的距离均大于 2。