热点
"数学推理" 相关文章
103K「硬核」题,让大模型突破数学推理瓶颈
机器之心 2025-06-12T02:38:47.000000Z
103K「硬核」题,让大模型突破数学推理瓶颈
机器之心 2025-06-11T06:38:29.000000Z
数学圈地震!o3 靠直觉刷爆人类顶尖难题,14 位专家集体破防
掘金 人工智能 2025-06-10T02:39:26.000000Z
数学圈地震,o3靠直觉刷爆人类顶尖难题,14位专家集体破防
36kr 2025-06-09T12:19:21.000000Z
SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化
PaperWeekly 2025-06-08T06:37:42.000000Z
奖励是假的,能让Qwen提升25%性能却是真的
36kr-科技 2025-05-30T02:43:11.000000Z
Incorrect Answers Improve Math Reasoning? Reinforcement Learning with Verifiable Rewards (RLVR) Surprises with Qwen2.5-Math
MarkTechPost@AI 2025-05-28T20:45:50.000000Z
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
量子位 2025-05-24T11:56:19.000000Z
UW&微软|显著提升LLM在数学任务上的表现,单样本强化学习,可至73.6%,代码全开源
智源社区 2025-05-20T04:32:46.000000Z
UGMathBench:评估语言模型数学推理能力的动态基准测试数据集
魔搭ModelScope社区 2025-05-14T14:54:28.000000Z
Kimina-Prover 预览版:基于强化学习的大规模形式化推理模型
月之暗面 Kimi 2025-05-13T16:37:32.000000Z
UGMathBench:评估语言模型数学推理能力的动态基准测试数据集
魔搭ModelScope社区 2025-05-09T20:31:55.000000Z
DeepSeek「五一礼包」来了!新开源模型数学推理能力大提升|附实测细节
APPSO 2025-05-08T07:32:27.000000Z
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
量子位 2025-05-08T07:26:53.000000Z
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
量子位 2025-05-08T02:03:08.000000Z
挑战AI数学推理极限,大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
36kr 2025-05-07T11:44:04.000000Z
DeepSeek公布Prover-V2技术报告,专为数学AI编程语言打造,定理证明达到业内最佳
MIT 科技评论 - 本周热榜 2025-05-04T16:16:43.000000Z
为什么微软的 Phi-4 14B 比 GPT-4o 和 o1 强太多了 —— 看结果就知道了
掘金 人工智能 2025-05-04T09:53:02.000000Z
LLMs Can Learn Complex Math from Just One Example: Researchers from University of Washington, Microsoft, and USC Unlock the Power of 1-Shot Reinforcement Learning with Verifiable Reward
MarkTechPost@AI 2025-05-03T05:30:41.000000Z
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
机器学习初学者 2025-05-02T05:37:10.000000Z