我找到一个case，让AI绘图，全军覆没。。包括GPT-4o

夕小瑶科技说 06月22日 13:04

我找到一个case，让AI绘图，全军覆没。。包括GPT-4o

本文探讨了当前AI绘图模型在处理“左撇子”相关图像时的表现。通过一系列测试，作者发现包括Grok、Gemini 2.5 Pro、豆包和可灵在内的多家AI绘图工具，在生成左撇子喝水、写字等动作的图像时均遭遇失败。即使是表现较好的GPT-4o，虽然能够正确区分左右手，但在生成左撇子图像时也遇到了困难。文章分析认为，这可能与左撇子人口比例较低、训练数据中细节标注不足以及AI对物理规律的理解有限有关，揭示了AI在图像生成领域的局限性。

🤔 测试结果显示，多数AI绘图模型难以准确生成“左撇子”图像。作者测试了包括Grok、Gemini 2.5 Pro、豆包和可灵在内的多种模型，它们在“左撇子喝水”和“左手写字”等任务上均告失败。

🧐 即使是能够区分左右手的GPT-4o，也无法稳定生成左撇子相关的图像。这表明AI在理解和生成细节动作方面存在困难，即使在能够辨别左右手的情况下，也无法正确描绘左撇子的行为。

💡 问题的根本原因在于训练数据。由于左撇子人口比例较低，AI训练数据中“左撇子”图像数量相对较少。此外，训练数据中通常缺乏对“左手拿杯子喝水”等细节的标注，导致AI更多地依赖统计概率，而非真正理解物理规律。

原创 zJz 2025-05-27 20:08 北京

前几天在论坛上看别人激烈辩论 AI 是否会取代工程师，突然有人在回复中冷不丁的抛出一个评论：

别说那么多废话，先让 AI 画个左撇子出来。

这是个什么问题？

我第一直觉对这个表示怀疑，强如 GPT-4o，连刘强东都能画的和真的一样，怎么会画不出来左撇子。

但在好奇心的驱使下，我还真的试了一下，发现这个问题没这么简单。

提示词很简单:

“画左撇子喝水的图”

Grok这一上来，就失败的干干脆脆。

有没有可能是偶发？我又多试了几次：

果然是稳定的失败。

Gemini 2.5 Pro好好好，Gemini 也不行。

那目前最强的 GPT4o 总没问题吧？

GPT 4o没想到 GPT4o 也不行，真的是打了我的脸。

外国 AI 不行，我们再来看看国内的：

豆包可灵 AI试了好几次，都是这个效果，只能说：

即梦即梦偶尔有概率生成左手拿杯子的，但也就是非常“偶尔”而已。

整体来说，目前我们能接触到的 AI 绘图工具，在这个项目上几乎全军覆没。这是我万万没想到的。

这个“离谱”的测试结果，会不是因为“左撇子”表述有歧义，“喝水”这个项目是个特例？

为了消除这两个怀疑，我重新构建了提示词：

“画一个用左手握笔写字的人。”

大家直接看结果：

上面分别为 Grok，GPT4o 和豆包，全军覆没。

其它模型结果我就不贴了，结论也是一样。

那是不是 AI 分不出左右？

用下面的图进行测试，让 AI 回答下图是哪个手。

上面三张图分别是 Grok，Gemini 和豆包，确实是左右都分不清。

只有 GPT-4o 答对了。

为了防止 GPT4o 蒙对，再给它加测一题：

依旧正确的判断出拿杯子的手是左手。（其它模型我也测了，它们依旧失败）

结论这个简单的测试，直接暴露了现在几乎所有 AI 绘图模型都左右不分。

Gemini，Grok 和豆包、可灵是完全不分左右，它们画不出来，倒也情有可原。

GPT4o 是在能分清左右的情况下，依旧无法生成“左撇子”有关的内容，这就很有意思了。

所以，它们依旧不懂物理规律。

产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%，因此绝大多数训练图像都右撇子。

而且训练 AI 的数据集中，一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。

因此，AI 会简单的认为：喝水=右手动作。

只是根据其数据集的统计概率生成图像，不是真正的理解。

所以，AI 就是稳定的无法画出“左撇子”的任何动作？

至少对 GPT4o 来说，实际情况比这个更复杂。

不信？你可以让 GPT-4o 画下面这个图：

“左撇子拿书。”

欢迎在评论区分享你的答案！

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI绘图左撇子 GPT-4o 图像生成

相关文章

Top 40+ Generative AI Tools in 2024

Generating Ground-Level Images From Overhead Imagery Using GANs with Yi Zhu - TWiML Talk #172

今天发布的GPT-4o以及ChatGPT产品的快速总结：#ai# #openai# ?GPT-4o（“o”代表“全能”）它可以接受任意组合的文本、音频和图像作为输入，并生成任意组合...

OpenAI Released GPT-4o for Enhanced Interactivity and Many Free Tools for ChatGPT Free Users

OpenAI新AI多模模型GPT-4o提供所有ChatGPT用戶，速度更快，價格減半

AI generates high-quality images 30 times faster in a single step

OpenAI Launches ChatGPT Desktop App: Enhancing Productivity for Mac Users

OpenAI Announces a New ChatGPT Desktop App for MacOS

New generative media models and tools, built with and for creators

谷歌发布文生图工具Imagen 3