热点
关于我们
xx
xx
"
POLAR
" 相关文章
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
智源社区
2025-07-14T07:03:41.000000Z
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
新智元
2025-07-11T11:39:58.000000Z
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
掘金 人工智能
2025-07-11T10:15:46.000000Z
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
新智元
2025-07-11T08:56:53.000000Z
OpenAI去年挖的坑填上了,奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
36kr
2025-07-11T07:21:24.000000Z
奖励模型终于迎来预训练新时代!上海AI Lab、复旦POLAR,开启Scaling新范式
机器之心
2025-07-10T09:03:18.000000Z
奖励模型终于迎来预训练新时代!上海AI Lab、复旦POLAR,开启Scaling新范式
机器之心
2025-07-10T07:21:34.000000Z
-30℃照充不误 鹏辉能源推出户用储能低温电芯:能用15年
快科技资讯
2024-08-29T09:16:35.000000Z