热点
"LMArena" 相关文章
Claude时代终结?LMArena实测DeepSeek R1编程得分超Opus 4,但月暗称其新模型更胜一筹
AI前线 2025-06-17T09:36:22.000000Z
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥
智源社区 2025-05-02T15:39:42.000000Z
AI圈顶级榜单曝黑幕,Meta作弊刷分实锤?
虎嗅 2025-05-01T07:53:17.000000Z
速递|不站队的AI裁判要赚钱了?Chatbot Arena转型公司化运营且计划融资
Z Potentials 2025-04-21T09:41:20.000000Z
Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌,此前被质疑刷榜作弊
IT之家 2025-04-14T07:28:08.000000Z