热点
"ProRL" 相关文章
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
智源社区 2025-06-23T05:43:36.000000Z
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
新智元 2025-06-22T23:49:44.000000Z
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
IT之家 2025-06-05T06:39:07.000000Z
NVIDIA Introduces ProRL: Long-Horizon Reinforcement Learning Boosts Reasoning and Generalization
MarkTechPost@AI 2025-06-05T06:15:58.000000Z
英伟达揭示RL Scaling魔力,训练步数翻倍=推理能力质变,小模型突破推理极限
36氪 - 科技频道 2025-06-04T09:49:12.000000Z