基准评估_Fishai

热点

"基准评估" 相关文章

KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding

cs.AI updates on arXiv.org 2025-06-30T04:14:26.000000Z

Allen Institute for AI (AI2) Releases OLMo 32B: A Fully Open Model to Beat GPT 3.5 and GPT-4o mini on a Suite of Multi-Skill Benchmarks

MarkTechPost@AI 2025-03-14T22:47:10.000000Z

一篇推文看一年！Jim Fan力荐2025必读清单：50篇论文，扫盲「全领域AI实战」

智源社区 2025-01-11T07:04:17.000000Z

Flock of Finches: RWKV-6 Mixture of Experts

Recursal AI development blog 2024-12-13T05:08:41.000000Z

史上最严“中文真实性评估”：OpenAI o1第1豆包第2，其它全部不及格

智源社区 2024-11-22T05:37:14.000000Z

Which AI Safety Benchmark Do We Need Most in 2025?

少点错误 2024-11-18T15:06:46.000000Z

长序列预测 & 时空预测万字长文：一文带你探索多元时间序列预测的研究进展！

集智俱乐部 2024-11-04T15:41:24.000000Z

Copyright © 2019 FISHAI.All Rights Reserved