Google DeepMind 推出了 AlphaEvolve,这是一个 AI 编码智能体,它利用 Gemini 模型(Flash 和 Pro)生成并演化程序,从而解决各类复杂问题。该系统使用候选程序数据库和一个评估函数来指导进化过程。它可以解决的问题由用户指定的评估函数定义,该函数提供标量指标。AlphaEvolve 已经展示了显著的成果,重新发现了数学领域最先进的算法,并在 Google 的内部系统(如 Borg 任务编排器和 AI 训练操作,例如内核平铺和 FlashAttention)中发现了更高效的解决方案,从而实现了计算资源回收和训练性能加速。虽然该研究成果尚未完全开源,但它突显了在进化算法中使用 LLM 的潜力,在科学研究和工程实践中具有广泛的应用前景。在 Hacker News 和 X 等平台上的社区反应普遍对结果持积极态度,但一些专家对 DeepMind 有限的代码开源历史表示担忧,这影响了结果的可验证性。
Google DeepMind 发布 AI 编程智能体 AlphaEvolve
Google DeepMind 近期发布了一篇论文,介绍了其全新 AI 编程智能体 AlphaEvolve。这一智能体利用大型语言模型(LLMs)在硬件设计、数据中心运营和 AI 训练等多个领域中发现和优化算法,展现了强大的通用性和潜力。
AlphaEvolve 核心功能与应用
AlphaEvolve 通过集成多个大型语言模型(包括 Gemini Flash 和 Gemini Pro)生成并优化程序,以解决用户定义的问题。用户需提供一个评估函数,返回一组标量指标,用于衡量程序性能。AlphaEvolve 在多个领域取得了显著成果:
- 数学问题:在超过 50 个数学问题中,AlphaEvolve 在 75% 的案例中重新发现了当前最优解,并在 20% 的案例中找到了更优的解决方案。例如,它发现了一种更高效的 4x4 矩阵乘法算法。数据中心优化:AlphaEvolve 为 Google 的 Borg 任务调度系统开发了一种新的启发式函数,性能优于深度强化学习方法,帮助 Google 回收了全球 0.7% 的计算资源。AI 训练加速:在内核平铺(kernel tiling)和 FlashAttention 操作中,AlphaEvolve 分别实现了 23% 和 32% 的性能提升。
“AlphaEvolve 的通用性使其可应用于任何能以算法描述且可自动验证的场景。我们相信它将在材料科学、药物发现、可持续发展和更广泛的技术与商业领域中带来变革。” —— Google DeepMind
AlphaEvolve 架构与工作原理
AlphaEvolve 的核心在于利用 LLMs 生成和优化代码。其架构如下:
图片来源:AlphaEvolve 白皮书
- 工作流程:
- 系统维护一个候选程序数据库,存储生成的高性能程序。将候选程序作为上下文输入 LLM,结合描述程序演化方式的提示词(Prompt),生成新程序。通过用户提供的评估函数对新程序进行评分,优质程序存入数据库。循环迭代,直到找到最优解。
这一流程使 AlphaEvolve 能够持续优化代码,适配不同技术栈和场景需求。
社区反响与争议
Hacker News 上的讨论对 AlphaEvolve 普遍持正面评价,并提及 Google 在 AI 领域的深厚积累:
“人们常忘记 Google 是 MuZero 的缔造者。MuZero 是本十年最重要的 AI 论文,展示了模型如何学会搜索,远超 Transformer 的影响力。” —— Hacker News 用户
然而,牛津大学 AI 研究员 Simon Frieder 在 X 平台上指出,DeepMind 的开源策略存在不足:
“DeepMind 的发布在科学上很有趣,但开源代码的历史不佳。例如,AlphaFold2 未提供训练脚本,AlphaGeometry 存在 bug,导致社区开发了 OpenFold 和 Newclid 等替代品。AlphaEvolve 可能也隐藏 bug,影响结果可信度。尽管有自动评估器,但在复杂场景下验证结果仍具挑战性。”
当前状态与未来展望
目前,AlphaEvolve 尚未公开,学术研究者可申请早期访问权限。Google 表示,其通用性使其不仅局限于数学和计算领域,还可扩展到材料科学、药物发现等跨学科应用。
AlphaEvolve 的发布标志着 AI 在算法优化领域的又一突破,为开发者提供了从前端到复杂工程问题的新工具。然而,其开源程度和结果可验证性仍是社区关注的焦点。未来,随着更多垂直领域的应用和开源支持,AlphaEvolve 有望推动 AI 与编程的深度融合。
关键词:AlphaEvolve, Google DeepMind, AI 编程, 算法优化, 大型语言模型, 前端开发, 数据中心, AI 训练