智源社区 前天 16:27
AI遭遇灵魂拷问!这道题所有模型集体翻车,网友:我也不会啊
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一篇关于AI图像推理能力的文章引发了广泛讨论,焦点集中在AI解决复杂推理问题的能力。文章探讨了在给定部分立方体的情况下,AI推断完整大立方体所需小立方体数量的难题。不同大模型给出了差异巨大的答案,原因是它们对大立方体规格的理解不同。文章还提到了网友提出的解决方案,以及人类在面对类似问题时也会产生的困惑。最后,文章强调了清晰的问题表述和更科学的训练方式对AI的重要性。

🤔 问题核心:文章的核心问题是评估AI在图像推理方面的能力,具体表现为解决“补充立方体”难题的能力。

📐 模型差异:不同大模型在解决该问题时给出了不同的答案,这源于它们对最终大立方体规格的理解差异,例如5x5x5、4x4x4或3x3x3。

💡 解决方案:网友通过多次尝试和提示,帮助AI逐渐找到正确答案。这表明,AI可以通过记忆和学习来改进其推理能力。

🧐 人类困惑:文章指出,即使是人类,在面对这类问题时也会产生困惑,例如对问题要求的理解、立方体排列方式的理解等。

🚀 未来展望:文章暗示,清晰的问题表述和更科学的训练方式对提升AI的图像推理能力至关重要,这也会成为未来的研究方向。

拷打AI的难度还在升级?这不,图像推理又出现了新难题。

该问题在Reddit上引起热议:目前没有任何AI能真正解决复杂推理问题

问题定义其实非常简单——在下图中还需要添加多少个小立方体能形成一个完整的大立方体?

针对这一难题,国内外支持图像输入的大模型纷纷给出了不同的答案。

其中,o3给出的答案是45个,Gemini 2.5Pro给出的答案仅有10个。

而国内大模型,如DeepSeek、Qwen3的答案分别为14和9。

出现这些不同答案的原因是什么呢?请往下看。

为什么会出现不同的答案

核心原因:大模型对组成的大立方体的规格理解不同

o3将最终组成的大立方体的规格理解为5x5x5,但它对于缺失的小立方体的数目仍旧给出了错误答案,用人类视觉来看,要形成5x5x5的大立方体需要125个小立方体,而图中已经给出了46个,所以答案应该为79。

而AI的错误源于它对图片中小立方体的结构和数目的分析错误。

Gemini 2.5 Pro将最终组成的大立方体的规格理解为4x4x4。

而DeepSeek和Qwen都将最终的大立方体规格设定为了3x3x3。

对于最终要组成的大立方体的规模理解不同,各大模型自然而然就会给出不同的答案。

不过,结合提示多次尝试,也有大模型能够渐渐找准方向

网友针对这些错误答案提供了一些解决办法:

例如用o3进行测试,在前两次尝试时给出一些小提示,虽然这样也得到错误答案,但第三次,即使没有提示也得到了正确的结果。

网友认为是由于ChatGPT的长期记忆功能,让它记住了前两次尝试的提示(比如考虑最长运行中有多少个立方体,专注于严格计数而不是估计),考虑到了失败的经验,并将它们全部整合在一起。

因此,可以说o3会通过记忆来学习。而这道难题也会成为未来的训练数据。

网友:人类也会困惑

有人说,这根本就不是一个推理问题,而是一个视觉理解问题。

出现作者认为的错误答案是由于问题表述不清楚导致AI的分析过程出现了偏差。

甚至人类面对这种问题也会出现类似的困惑,比如题目的要求到底是以原来的排列结构为基础还是可以打乱结构重新排列?

并且,如果能够更清晰地为AI解释图片内容(告知其图片中小立方体的排列结构):

那么o3得到的答案也是正确的:

无论是3x3x3、4x4x4还是5x5x5,或者是NxNxN,人类自己都无法统一答案的问题,对AI来说是不是太难了点!

网友:

AI:或许我需要一个更科学的训练方式!

参考链接:
https://www.reddit.com/r/singularity/comments/1kc2po7/not_a_single_model_out_there_can_currently_solve/?rdt=36638

—  —

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~


一键关注 👇 点亮星标

科技前沿进展每日见

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!


内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 图像推理 立方体 大模型 推理能力
相关文章