热点
关于我们
xx
xx
"
通用奖励模型
" 相关文章
明日直播|DeepSeek-通用领域奖励模型的推理时可扩展性研究
智源社区
2025-04-22T05:58:20.000000Z
活动报名|DeepSeek&清华,通用领域奖励模型的推理时可扩展性研究,DeepSeek-GRM-27B
智源社区
2025-04-15T09:02:55.000000Z
Generalizable Reward Model (GRM): An Efficient AI Approach to Improve the Generalizability and Robustness of Reward Learning for LLMs
MarkTechPost@AI
2024-07-12T05:46:28.000000Z