热点
关于我们
xx
xx
"
基准评估
" 相关文章
Allen Institute for AI (AI2) Releases OLMo 32B: A Fully Open Model to Beat GPT 3.5 and GPT-4o mini on a Suite of Multi-Skill Benchmarks
MarkTechPost@AI
2025-03-14T22:47:10.000000Z
一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」
智源社区
2025-01-11T07:04:17.000000Z
Flock of Finches: RWKV-6 Mixture of Experts
Recursal AI development blog
2024-12-13T05:08:41.000000Z
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
智源社区
2024-11-22T05:37:14.000000Z
Which AI Safety Benchmark Do We Need Most in 2025?
少点错误
2024-11-18T15:06:46.000000Z
长序列预测 & 时空预测万字长文:一文带你探索多元时间序列预测的研究进展!
集智俱乐部
2024-11-04T15:41:24.000000Z