夕小瑶科技说 06月22日 13:04
我找到一个case,让AI绘图,全军覆没。。包括GPT-4o
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了当前AI绘图模型在处理“左撇子”相关图像时的表现。通过一系列测试,作者发现包括Grok、Gemini 2.5 Pro、豆包和可灵在内的多家AI绘图工具,在生成左撇子喝水、写字等动作的图像时均遭遇失败。即使是表现较好的GPT-4o,虽然能够正确区分左右手,但在生成左撇子图像时也遇到了困难。文章分析认为,这可能与左撇子人口比例较低、训练数据中细节标注不足以及AI对物理规律的理解有限有关,揭示了AI在图像生成领域的局限性。

🤔 测试结果显示,多数AI绘图模型难以准确生成“左撇子”图像。作者测试了包括Grok、Gemini 2.5 Pro、豆包和可灵在内的多种模型,它们在“左撇子喝水”和“左手写字”等任务上均告失败。

🧐 即使是能够区分左右手的GPT-4o,也无法稳定生成左撇子相关的图像。这表明AI在理解和生成细节动作方面存在困难,即使在能够辨别左右手的情况下,也无法正确描绘左撇子的行为。

💡 问题的根本原因在于训练数据。由于左撇子人口比例较低,AI训练数据中“左撇子”图像数量相对较少。此外,训练数据中通常缺乏对“左手拿杯子喝水”等细节的标注,导致AI更多地依赖统计概率,而非真正理解物理规律。

原创 zJz 2025-05-27 20:08 北京

前几天在论坛上看别人激烈辩论 AI 是否会取代工程师,突然有人在回复中冷不丁的抛出一个评论:

别说那么多废话,先让 AI 画个左撇子出来。

这是个什么问题?

我第一直觉对这个表示怀疑,强如 GPT-4o,连刘强东都能画的和真的一样,怎么会画不出来左撇子。

但在好奇心的驱使下,我还真的试了一下,发现这个问题没这么简单。

提示词很简单:

“画左撇子喝水的图”

Grok这一上来,就失败的干干脆脆。

有没有可能是偶发?我又多试了几次:

果然是稳定的失败。

Gemini 2.5 Pro好好好,Gemini 也不行。

那目前最强的 GPT4o 总没问题吧?

GPT 4o没想到 GPT4o 也不行,真的是打了我的脸。

外国 AI 不行,我们再来看看国内的:

豆包可灵 AI试了好几次,都是这个效果,只能说:

即梦即梦偶尔有概率生成左手拿杯子的,但也就是非常“偶尔”而已。

整体来说,目前我们能接触到的 AI 绘图工具,在这个项目上几乎全军覆没。这是我万万没想到的。

这个“离谱”的测试结果,会不是因为“左撇子”表述有歧义,“喝水”这个项目是个特例?

为了消除这两个怀疑,我重新构建了提示词:

“画一个用左手握笔写字的人。”

大家直接看结果:

上面分别为 Grok,GPT4o 和豆包,全军覆没。

其它模型结果我就不贴了,结论也是一样。

那是不是 AI 分不出左右?

用下面的图进行测试,让 AI 回答下图是哪个手。

上面三张图分别是 Grok,Gemini 和豆包,确实是左右都分不清。

只有 GPT-4o 答对了。

为了防止 GPT4o 蒙对,再给它加测一题:

依旧正确的判断出拿杯子的手是左手。(其它模型我也测了,它们依旧失败)

结论这个简单的测试,直接暴露了现在几乎所有 AI 绘图模型都左右不分。

Gemini,Grok 和豆包、可灵是完全不分左右,它们画不出来,倒也情有可原。

GPT4o 是在能分清左右的情况下,依旧无法生成“左撇子”有关的内容,这就很有意思了。

所以,它们依旧不懂物理规律。

产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%,因此绝大多数训练图像都右撇子。

而且训练 AI 的数据集中,一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。

因此,AI 会简单的认为:喝水=右手动作。

只是根据其数据集的统计概率生成图像,不是真正的理解。

所以,AI 就是稳定的无法画出“左撇子”的任何动作?

至少对 GPT4o 来说,实际情况比这个更复杂。

不信?你可以让 GPT-4o 画下面这个图:

“左撇子拿书。”

欢迎在评论区分享你的答案!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI绘图 左撇子 GPT-4o 图像生成
相关文章