豆包 AI 图片解读能力简单试：差强人意

动点科技 2024年12月04日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

字节跳动旗下AI助手豆包近期上线了图片理解功能，用户可以通过上传图片让豆包识别图片内容，包括元素、特征等信息，并可以询问图片相关问题，例如景点的地理位置或角色的影视作品出处。测试结果显示，豆包对一些常见图片的识别较为准确，例如可口可乐瓶和风景照，但对于影视剧照的识别准确率还有待提升，有时无法给出正确答案。总体来说，豆包的图片理解功能尚处于发展阶段，但为AI助手增加了新的实用功能，未来有望通过持续优化提升可靠性。

🤔豆包AI助手新增图片理解功能，用户可上传图片识别图片内容，包括元素、特征等信息，例如识别可口可乐瓶、风景照等。

📷用户还可以通过该功能询问图片相关问题，例如询问某景点的地理位置或某个角色出自哪部影视作品。

⚠️在测试中，豆包对一些图片的识别较为准确，但对于影视剧照的识别准确率还有待提升，有时无法给出正确答案。

💡豆包图片理解功能的加入为AI助手增加了新的实用功能，但仍需持续优化，提升识别准确性和可靠性。

字节跳动旗下 AI 助手豆包日前上线了图片理解功能，在电脑端或 App 端上传图片后即可识别图片内容。

据了解，豆包的“图片理解”功能可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。好奇这个功能具体表现如何，那就继续往下看。