热点
"大模型评测" 相关文章
我花了2天,找到了我觉得翻译质量最好的AI大模型。
数字生命卡兹克 2025-03-13T04:59:38.000000Z
DeepSeek和OpenAI、xAI、Anthropic哪家强?FlagEval智源评测
智源社区 2025-03-05T14:20:26.000000Z
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
智源社区 2025-03-05T07:41:35.000000Z
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
量子位 2025-03-04T10:09:30.000000Z
AI大模型权威评测:豆包中文对话最强,OpenAI o1推理和数学占优
2025-01-06T07:48:45.000000Z
模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子
硅星人Pro 2024-12-25T02:55:16.000000Z
模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子
硅星GenAI 2024-12-23T13:01:05.000000Z
智源研究院“百模”评测结果:字节跳动多项第一 大厂AI整体领先
Cnbeta 2024-12-23T06:15:22.000000Z
智源发布FlagEval「百模」评测结果,丈量模型生态变局
机器之心 2024-12-20T10:09:21.000000Z
智源发布FlagEval“百模”评测结果 丈量模型生态变局
智源社区 2024-12-20T08:06:56.000000Z
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉
新智元 2024-12-20T07:01:14.000000Z
CompassArena上新!JudgeCopilot与新一代Bradley-Terry模型重塑大模型竞技体验
魔搭ModelScope社区 2024-12-19T13:24:17.000000Z
智源发布FlagEval“百模”评测结果 丈量模型生态变局
智源研究院 2024-12-19T09:58:55.000000Z
活动报名丨智源评测秋冬发布会暨大模型辩论表演赛前瞻
智源社区 2024-12-17T12:07:17.000000Z
智源「百模」评测结果出炉,PixVerse 位列文生视频全球TOP3
爱诗科技 AIsphere 2024-10-28T00:09:56.000000Z
大模型评测技术研讨会暨国际标准IEEE P3419第二次工作组会议成功召开
智源研究院 2024-10-24T17:00:57.000000Z
OpenAI o1系列成色如何?SuperBench9月综合榜单揭晓
智源社区 2024-10-03T16:54:12.000000Z
大模型评测技术研讨会暨国际标准IEEE P3419第二次工作组会议成功召开
智源社区 2024-07-19T10:51:33.000000Z
专治大模型“刷题”,贾佳亚团队新基准让模型只挑错不做题,GPT-4得分不到50
36kr-科技 2024-07-18T07:34:11.000000Z
大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待
智源社区 2024-07-12T07:35:55.000000Z