量子位 6小时前
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了当前大模型在解决数学问题方面的最新进展,包括DeepSeek Prover V2的发布、陶哲轩的AI数学直播以及谷歌的AlphaEvolve。文章还提到了FormalMATH基准测试,用于评估AI的数学推理能力。此外,还预告了一场关于大语言模型形式化证明前沿探索的直播活动,邀请了来自DeepSeek Prover、FormalMath、Kinima等项目团队的成员,共同探讨AI完成自动定理证明的表现与挑战,以及形式化证明能力对大模型应用的影响。

🚀 大模型“解数学题”的能力已成为衡量AI「智能天花板」的一种方式,吸引众多团队争相挑战。

📊 FormalMATH基准测试备受关注,旨在更好地评估AI完成数学推理的能力。

🧑‍💻 5月29日晚20:00将举办直播,邀请DeepSeek Prover、FormalMath、Kinima等项目团队成员,讨论大语言模型形式化证明前沿探索。

关注前沿科技 2025-05-27 11:53 重庆

本周四晚20:00,一起来聊AI数学~

林樾 发自 凹非寺量子位|公众号 QbitAI

就在5月,前有DeepSeek Prover V2发布,后有陶哲轩的AI数学直播,还有谷歌最新发布的AlphaEvolve

大模型“解数学题”的能力已经是衡量AI「智能天花板」的一种方式,正吸引着无数团队争相挑战。

为了更好地评估AI完成数学推理的能力,近期发布的FormalMATH基准测试也备受关注。

现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化证明的能力,又将对大模型应用带来怎样的影响?

为了回答这些问题,5月29日20:00,我们与2077AI开源基金会共同邀请到了来自DeepSeek ProverFormalMath、Kinima等项目团队的成员,一同来讨论大语言模型形式化证明前沿探索

点击下方按钮,一键预约直播 

直播嘉宾

辛华剑,爱丁堡大学博士生,DeepSeek Prover 项目第一作者

刘威扬,香港中文大学博士生导师,资深学者

付杰,上海人工智能实验室研究员,人工智能领域专家

郁昼亮,香港中文大学博士生,FormalMath 项目第一作者

王海明,月之暗面(Moonshot AI)技术负责人,Kinima 项目技术领衔人

刘征瀛,月之暗面(Moonshot AI)技术负责人,资深技术专家

李祎哲,浙江大学博士生,数学领域青年研究者

刘明皓,资深算法工程师,2077AI核心发起人、贡献者

直播议程

本周四晚20:00,一起来聊聊AI数学吧~

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~

一键关注 👇 点亮星标

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI数学 大模型 形式化证明
相关文章