热点
"MathIF" 相关文章
推理能力飙升,指令遵循暴跌?MathIF基准揭示大模型“服从性漏洞”
PaperWeekly 2025-06-09T09:27:36.000000Z
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
智源社区 2025-05-27T05:23:03.000000Z