动点科技 2024年12月04日
豆包 AI 图片解读能力简单试:差强人意
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

字节跳动旗下AI助手豆包近期上线了图片理解功能,用户可以通过上传图片让豆包识别图片内容,包括元素、特征等信息,并可以询问图片相关问题,例如景点的地理位置或角色的影视作品出处。测试结果显示,豆包对一些常见图片的识别较为准确,例如可口可乐瓶和风景照,但对于影视剧照的识别准确率还有待提升,有时无法给出正确答案。总体来说,豆包的图片理解功能尚处于发展阶段,但为AI助手增加了新的实用功能,未来有望通过持续优化提升可靠性。

🤔豆包AI助手新增图片理解功能,用户可上传图片识别图片内容,包括元素、特征等信息,例如识别可口可乐瓶、风景照等。

📷用户还可以通过该功能询问图片相关问题,例如询问某景点的地理位置或某个角色出自哪部影视作品。

⚠️在测试中,豆包对一些图片的识别较为准确,但对于影视剧照的识别准确率还有待提升,有时无法给出正确答案。

💡豆包图片理解功能的加入为AI助手增加了新的实用功能,但仍需持续优化,提升识别准确性和可靠性。

字节跳动旗下 AI 助手豆包日前上线了图片理解功能,在电脑端或 App 端上传图片后即可识别图片内容。

据了解,豆包的“图片理解”功能可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。好奇这个功能具体表现如何,那就继续往下看。

AI 理解图片

我们尝试让豆包识别玻璃瓶可口可乐、一张风景照和两张影视作品剧照,结果如下:

在 PC 端上传图片后,对话框内会自动显示“解释这张图片”快捷按钮。可口可乐照片、风景照的解读令人满意。

“牛魔王”识别这次结果可用,但并不是期待中的那样

而在询问剧照出处时,第一次在 PC 端尝试,豆包并没有给出有用答案;第二次在 App 端得到了反馈,但结果错误。这张其实是《重启人生》的剧照。

第一次尝试
第二次尝试

最后,我们通过豆包拍照功能拍摄了一个机器人手办,其识别表现尚可。

总结

不断增加新 AI 能力,对 AI 助理产品来说终归是好事。此次豆包新加入的图片解读能力,总体来说表现中规中矩,有时候会出现没法给出答案的情况。希望字节跳动继续优化相关功能,让未来的 AI 能力变得更可靠。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

豆包 AI助手 图片识别 AI能力 字节跳动
相关文章