热点
"模型评测" 相关文章
GLM-4.5 发布,50块钱包月爽玩。真实测评:六大模型混战,谁能一键生成“真·可用”的应用?
掘金 人工智能 2025-08-02T03:10:09.000000Z
0 融资、10 亿美元营收,数据标注领域真正的巨头,不认为合成数据是未来
智源社区 2025-07-30T12:51:34.000000Z
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval
机器之心 2025-07-23T08:11:41.000000Z
Kling V2.0 图像生成模型评测 —— 4 月发布的模型,如今是否仍宝刀未老?
掘金 人工智能 2025-07-23T02:28:22.000000Z
Qwen3-Embedding:原理解读和检索场景测试
掘金 人工智能 2025-07-20T09:44:28.000000Z
DeepSeek终于丢了开源第一王座 但继任者依然来自中国
Cnbeta 2025-07-18T09:57:29.000000Z
2025年7月全球大模型最新排名发布!企业与个人该如何选择最适合你的 AI 得力助手?
掘金 人工智能 2025-07-17T01:10:59.000000Z
马斯克最贵 AI 首批实测炸了!Grok 4 一边封神一边翻车,网友:2 万块就这?
APPSO 2025-07-11T18:51:08.000000Z
2025年最佳开源视频生成模型排名:8款顶级AI产品深度对比【独家全面】
掘金 人工智能 2025-07-01T02:35:01.000000Z
[程序员] 关于 claude code: opus 模型 对比 sonnet 模型, 5x 价格值得吗?
V2EX 2025-06-29T10:53:09.000000Z
2025 上半年 AI 生图王者之争:302.AI 集结全明星阵容,TOP5 模型实测揭晓!AIGC 爱好者必读
掘金 人工智能 2025-06-23T06:17:37.000000Z
2025全面评测:Flux AI图像生成器6大模型全解析【专业测评】
掘金 人工智能 2025-06-21T09:33:47.000000Z
全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%
智源社区 2025-05-31T10:43:30.000000Z
不吹不黑,9道题实测DeepSeek-R1-0528的小更新
机器学习初学者 2025-05-30T05:32:11.000000Z
可灵2.1刚刚上线,价格降了65%,更快、更听话、也更强。
数字生命卡兹克 2025-05-29T04:17:39.000000Z
Qwen3 X ModelScope工具链: 飞速训练 + 全面评测
魔搭ModelScope社区 2025-05-08T07:58:15.000000Z
Personal evaluation of LLMs, through chess
少点错误 2025-04-24T07:17:54.000000Z
2025.4 海外LLM 的一个实际案例benchmark
孔某人的低维认知 2025-04-19T07:01:53.000000Z
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实
36kr-科技 2025-04-18T12:18:59.000000Z
多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
量子位 2025-02-24T01:13:50.000000Z