机器之心 2024年12月24日
o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近日,Reddit上一则热帖宣称OpenAI o3的智商(IQ)估计高达157,引发广泛关注。这一数值远超GPT-4o等其他模型,甚至超过了绝大多数人类。该数据基于Codeforces编码评级估算得出,并与挪威门萨智商测试结果进行了初步验证。尽管如此,许多人对这一结论持怀疑态度,认为编码能力并不能等同于智商,且该数据可能存在炒作成分。文章还展示了GPT模型在AIME数学竞赛中取得的显著进步,但强调需要进一步验证o3的智商水平。

🧠OpenAI o3 的智商(IQ)据估计高达 157,远超其他模型和绝大多数人类,引发热议。这一数值意味着 o3 的智商水平达到了人类中 0.0075% 的水平。

📊该智商数据基于 Codeforces 编码评级估算得出,通过假设程序员排名前15%来进行推断,并给出了GPT-4o、o1 preview、o1、o1 pro、o3 mini 的智商对比数据,显示o3遥遥领先。

🧪尽管有挪威门萨智商测试结果对o1的智商进行了验证,但许多人质疑使用编码表现评估智商的合理性,认为这可能是一种炒作行为,并指出智商测试本身就是为评估人类而设计的,不能简单套用在AI身上。

📈文章还提到,GPT模型在2024年AIME数学竞赛中表现出显著进步,从13.4分提升到96.7分,表明AI在特定领域的能力正在快速提升。

2024-12-24 12:22 北京

至于可靠性,有待后续验证。

机器之心报道

机器之心编辑部

从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。


OpenAI o3 的智商(IQ)竟然已经这么高了吗


今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。


这意味着什么呢?人类中的 0.0075% 才能达到这个智商水平。更具体地说,每 13,333 个人中才出来一个这么高智商的。


对比之下,GPT-4o 的 IQ 为 115、o1 preview 为 123、o1 为 135、o1 pro 为 139、o3 mini 为 141。


同样更具体地讲,GPT-4o 每 6 人中有一个、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。


这些 IQ 是如何计算出来的呢?疑似原作者表示,他根据 Codeforces 编码评级来粗略地估计 IQ,并假设报名时竞争程序员排名前 15%,最后得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 和 o3 的 IQ 以及在人类中的排名。


图源:X@i_dg23

此前还有人整理了 GPT-4o 与 o1 preview、o1、o3 在 2024 年 AIME 数学竞赛题目测试(AIME 2024)中的结果,从 13.4 到如今的 96.7,七个月的时间,数学能力实现了飞跃式提升。


图源:X@zbgoodwin

仅从以上数据来看,AI 大模型的进步速度着实令人震惊。不过,毕竟开局一张图,o3 的 IQ 真的如表格中那么高吗?


有人找到了「Tracking AI」中 o1 在挪威门萨智商测试(Mensa Norway)IQ 测试中的结果(为 133,与上面表格中估计的 135 相差不大),一定程度上验证了 o3 估计智商的可靠性。


图源:X@facundo_fagalde

图源:https://www.trackingai.org/home

因此,未来等 o3 正式发布以后,它的挪威门萨智商测试结果将更加值得期待。


图源:X@AILeaksAndNews

o3 IQ 如此之高,瞬间引爆了大家伙的评论热情。


网友热评


有网友直呼:「这张图是我见过最愚蠢的东西之一,这些数据根本不能代表智商。他们用编码表现的 z 分数代表智商。但编码不是智商测试,尤其是对于参加编码测试的 LLM 来说,它们对所有在互联网上分享的代码具有完美的数字记忆。o3 甚至无法解答我 6 岁和 8 岁的孩子可以解答的问题。」


也就是说,如果 LLM 针对编码测试进行训练,那么用编码表现分数代表智商是毫无意义的。


但另一位网友表示:「并非如此,这是一种基于相关性的『转换』,但首先相关性有点弱,其次它转化为机器智能的效果尚不明确,即人工智能模型可能擅长编码,但在其他领域却不行。」


网友指出:「IQ 本身就是用来评估人类的指标。它评估与智力相关的特定技能,并理所当然地认为人类应该拥有许多其他特征。而这张图通过考虑人工智能可以擅长的单一指标来假设广义智能,他们甚至没有使用智商测试来得出这个结论,而是根据与智商相关的指标来推断。」


总的来说,人们对于所谓的「o3 智商高达 157」并不认可。或许,这又是一场炒作吧。


参考链接:https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI o3 智商 人工智能 编码能力 模型评估
相关文章