ProRL_Fishai

热点

"ProRL" 相关文章

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

智源社区 2025-06-23T05:43:36.000000Z

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

新智元 2025-06-22T23:49:44.000000Z

英伟达推出 ProRL 方法：强化学习训练至 2000 步，打造全球最佳 1.5B 推理 AI 模型

IT之家 2025-06-05T06:39:07.000000Z

NVIDIA Introduces ProRL: Long-Horizon Reinforcement Learning Boosts Reasoning and Generalization

MarkTechPost@AI 2025-06-05T06:15:58.000000Z

英伟达揭示RL Scaling魔力，训练步数翻倍=推理能力质变，小模型突破推理极限

36氪 - 科技频道 2025-06-04T09:49:12.000000Z

Copyright © 2019 FISHAI.All Rights Reserved