热点
"模型测评" 相关文章
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
智源社区 2025-04-21T14:23:56.000000Z
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
新智元 2025-04-09T10:06:21.000000Z
【NLP】「科学推理」基准榜单出炉!DeepSeek-R1 登顶,推理等级7级,o1紧随其后
机器学习初学者 2025-01-24T07:37:13.000000Z
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
IT之家 2024-09-20T05:38:28.000000Z
实测 OpenAI 新模型 o1 :做题王者,实战青铜
36kr-科技 2024-09-13T10:22:40.000000Z
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
虎嗅-AI 2024-08-16T11:07:36.000000Z