海外AI: Grok4实测

韭研公社 07月10日 23:57

海外AI: Grok4实测

本文分析了GROK4在多模态识别能力测试中的表现，与OpenAI和谷歌进行了对比，揭示了GROK4在复杂图像识别和人数统计方面的优缺点。

全文摘要 1、GROK4多模态能力测试与对比 ·北京烤鸭调料盘测试：针对复杂菜品图的多模态识别能力测试，选北京烤鸭调料盘作测试图，该图信息量大，多数大模型读图仅能读出少量信息。测试目标是识别图中菜品，OpenAI与谷歌能准确识别；GROK4本次仅描述为‘调料’，未指出是北京烤鸭调料，但曾有详细分析记录，反映其多模态识别能力不稳定。 ·数人图识别测试：数人图识别测试目标为识别图片中人数，真实答案15人。OpenAI将图片切分后搜索，谷歌固定一人按圈搜索，均能准确计数。GROK4工具调用失败，猜测人

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GROK4 多模态识别 OpenAI 谷歌图像识别

相关文章

SRG：2024年第一季度全球企业云支出超过760亿美元同比增长21%

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

How popular is ChatGPT? Part 1: more popular than Taylor Swift

OpenAI set to unveil AI-driven challenger to Google Search

OpenAI faces complaint over fictional outputs

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

苹果据悉接近与OpenAI达成协议，将ChatGPT应用于iPhone

OpenAI据悉正开发AI语音助手

Comment on Import AI 316: Scaling laws for RL; Stable Diffusion for $160k; YOLOv8. by Import AI 332: Mini-AI; safety through evals; Facebook releases a RLHF dataset | Import AI

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Government-issued digital money gets closer - The World News Papers