热点
"大模型RL训练" 相关文章
吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,破解强化学习训练部署难题
智源社区 2024-11-02T11:08:23.000000Z