热点
关于我们
xx
xx
"
数据污染
" 相关文章
ICML 2025 | 用“人类考试法”戳破AI泡沫:构建能力导向的自适应测评新范式
PaperWeekly
2025-05-27T06:22:33.000000Z
Large Language Models Are Memorizing the Datasets Meant to Test Them
Unite.AI
2025-05-16T13:37:37.000000Z
How Generative Models are Ruining Themselves
Communications of the ACM - Artificial Intelligence
2025-04-18T17:37:37.000000Z
大模型混入0.001%假数据就「中毒」,成本仅5美元!NYU新研究登Nature子刊
硅星人Pro
2025-02-07T16:24:37.000000Z
大模型混入0.001%假数据就「中毒」,成本仅5美元!NYU新研究登Nature子刊
智源社区
2025-02-05T14:44:38.000000Z
大模型混入0.001%假数据就「中毒」,成本仅5美元,NYU新研究登Nature子刊
36kr-科技
2025-02-05T03:02:46.000000Z
大模型混入0.001%假数据就「中毒」,成本仅5美元!NYU新研究登Nature子刊
新智元
2025-02-04T16:15:29.000000Z
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
量子位
2025-01-06T07:54:25.000000Z
阿里开始抓工牌;DeepSeek 新模型误认身份被疑套壳?谷歌被爆军心不稳,仅 AI 部门士气高涨 | AI周报
AI前线
2025-01-06T07:48:44.000000Z
国产大模型DeepSeek疑翻车:自称是ChatGPT
快科技资讯
2024-12-31T03:12:02.000000Z
自动评估基准 | 技巧与提示
智源社区
2024-12-28T05:01:57.000000Z
自动评估基准 | 技巧与提示
Hugging Face
2024-12-27T11:01:40.000000Z
自动评估基准 | 基础概念
智源社区
2024-12-26T03:51:56.000000Z
限定120分钟科研挑战,o1和Claude表现超越人类
36kr-科技
2024-11-25T11:33:41.000000Z
SMART Filtering: Enhancing Benchmark Quality and Efficiency for NLP Model Evaluation
MarkTechPost@AI
2024-11-04T08:20:35.000000Z
「世界开源新王」Reflection 70B 跌落神坛?重测跑分暴跌实锤造假
IT之家
2024-10-07T08:24:33.000000Z
ChatGPT们能讲人话后,AI污染互联网将变本加厉
虎嗅-AI
2024-09-25T08:38:30.000000Z
9年开源项目宣告停更,创建者怒斥OpenAI、Google:互联网被AI污染了,我鄙视你们
36kr
2024-09-24T11:04:08.000000Z
现在的大模型榜单,真就没一个可信的
虎嗅
2024-09-12T03:23:22.000000Z
AI绘图太超前了,它们把下一任美国总统都内定了
虎嗅
2024-08-15T14:07:30.000000Z