因延后披露受 OpenAI 资助事实，AI 基准测试组织 FrontierMath 被质疑行为不当

IT之家 01月20日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

一个名为FrontierMath的AI数学基准测试组织，在近期披露了其接受OpenAI资助的事实，引发了AI社区对其公正性的质疑。该基准用于评估AI的数学能力，并被OpenAI用于展示其新AI模型o3。虽然Epoch AI承认未能及时公开与OpenAI的合作，但强调基准的完整性未受影响。然而，一些专家认为，OpenAI的参与可能影响了基准的公正性，并质疑其是否拥有优先访问权。目前，Epoch AI尚未独立验证OpenAI在FrontierMath上的表现，并承诺未来将更加注重透明沟通。

💰FrontierMath是一个用于评估AI数学能力的基准测试，由Epoch AI组织开发，并被OpenAI用于展示其新AI模型o3。

🤝Epoch AI在去年12月公开承认接受了OpenAI对FrontierMath基准创建的资助，并且OpenAI还参与了基准问题的审核，但此前并未公开。

🤔一些AI社区人士担忧OpenAI的参与可能影响FrontierMath基准的公正性，并质疑OpenAI可能获得了优先访问权，导致部分贡献者不满。

📢Epoch AI承认未能及时公开合作信息，影响了透明度，但强调FrontierMath的完整性未受破坏，并承诺未来将加强沟通。

🔬尽管OpenAI的成绩看起来合理，Epoch AI的首席数学家表示，至今尚未独立验证OpenAI在FrontierMath上的表现，仍需进行独立评估以确认其准确性。

IT之家 1 月 20 日消息，据 TechCrunch 今日报道，一个开发 AI 数学基准的组织直到最近才披露其收到了 OpenAI 的资助，这引发了部分 AI 社区人士对其行为不当的质疑。

FrontierMath 测试用于评估 AI 的数学能力，并且是 OpenAI 在展示其新人工智能 o3 时使用的基准之一。

Epoch AI 是一家主要由 Open Philanthropy 资助的非营利组织，该基金会专注于研究和资助项目，去年联手 60 多位数学家推出了数学推理测试 FrontierMath。

去年 12 月 20 日，Epoch AI 透露，OpenAI 对 FrontierMath 基准的创建提供了支持。据IT之家了解，FrontierMath 是一个包含专家级难题的测试，旨在衡量 AI 的数学能力，它是 OpenAI 在展示即将推出的“旗舰产品” o3 时使用的基准之一。

在社交媒体上，一些用户对这项合作表示担忧，认为 OpenAI 的参与可能影响 FrontierMath 基准的公正性。除资助外，OpenAI 还曾参与审核基准中的问题与解答，但这一点直到 12 月 20 日才被公开。斯坦福大学数学博士生 Carina Hong 指责 OpenAI 通过与 Epoch AI 的合作，获得了对 FrontierMath 基准的优先访问权，这让一些贡献者感到不满。

Epoch AI 副主任 Tamay Besiroglu 在回应时表示，虽然他们在 o3 发布前受限于合同不能透露这一合作，但他承认未能及时公开相关信息，影响了透明度。他强调，尽管如此，FrontierMath 的完整性没有被破坏，未来将更加注重与贡献者的沟通。

然而，Epoch AI 的首席数学家 Ellot Glazer 表示，至今他们尚未独立验证 OpenAI 在 FrontierMath 上的表现。他认为 OpenAI 的成绩看起来合理，但只有完成独立评估后，才能确认其准确性。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签