热点
"AI评测" 相关文章
6大模型决战高考数学新一卷:豆包、元宝并列第一 OpenAI o3竟惨败垫底
Cnbeta 2025-06-08T06:47:35.000000Z
6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底
36kr 2025-06-08T01:44:12.000000Z
斯坦福大学:DeepSeek R1医疗大模型评测胜率66%领先
互联网数据资讯网-199IT 2025-06-03T14:07:11.000000Z
[数 智] 中国电信研究院发布AI终端评测体系
中国科技报 2025-06-02T20:27:26.000000Z
SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究
量子位 2025-05-29T10:00:12.000000Z
用红杉最新试题测试“无限流”Agent ,Flowith Neo能不能打?
钛媒体:引领未来商业与生活新知 2025-05-28T12:11:30.000000Z
速递|AI排行榜独角兽诞生:LM Arena获1亿美元融资,估值6亿美元能否洗刷"刷分"指控?
Z Potentials 2025-05-22T04:41:44.000000Z
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
智源社区 2025-05-17T05:23:16.000000Z
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
量子位 2025-05-16T07:10:19.000000Z
Study accuses LM Arena of helping top AI labs game its benchmark
TechCrunch News 2025-05-01T00:16:26.000000Z
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
智源社区 2025-04-29T14:14:46.000000Z
速递|不站队的AI裁判要赚钱了?Chatbot Arena转型公司化运营且计划融资
Z Potentials 2025-04-21T09:41:20.000000Z
从「表面真实性」到「内在真实性」,南洋理工S-Lab与上海AI Lab联合推出VBench-2.0:面向视频生成新世代的评测框架
我爱计算机视觉 2025-04-05T12:51:59.000000Z
从「表面真实性」到「内在真实性」,南洋理工S-Lab与上海AI Lab联合推出VBench-2.0:面向视频生成新世代的评测框架
我爱计算机视觉 2025-04-05T12:51:58.000000Z
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
IT之家 2025-04-04T04:23:40.000000Z
实测:Gemini-2.5-Pro 大战 Deepseek-V3-0324
机器学习初学者 2025-04-02T05:21:49.000000Z
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
智源社区 2025-03-31T02:57:56.000000Z
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
智源社区 2025-03-31T02:57:55.000000Z
《我的世界》成为AI新「考场」?高三生用游戏评测AI:DeepSeek-R1位列第三
36氪 - 科技频道 2025-03-25T12:44:07.000000Z
实测AI大模型:腾讯混元T1 vs DeepSeek 哪家强?
云中江树 2025-03-23T09:50:39.000000Z