热点
关于我们
xx
xx
"
ProRL
" 相关文章
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
智源社区
2025-06-23T05:43:36.000000Z
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
新智元
2025-06-22T23:49:44.000000Z
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
IT之家
2025-06-05T06:39:07.000000Z
NVIDIA Introduces ProRL: Long-Horizon Reinforcement Learning Boosts Reasoning and Generalization
MarkTechPost@AI
2025-06-05T06:15:58.000000Z
英伟达揭示RL Scaling魔力,训练步数翻倍=推理能力质变,小模型突破推理极限
36氪 - 科技频道
2025-06-04T09:49:12.000000Z