热点
关于我们
xx
xx
"
GRPO训练
" 相关文章
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
智源社区
2025-03-10T11:10:38.000000Z
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
量子位
2025-03-09T08:04:25.000000Z
0元!使用魔搭免费算力,基于Qwen基座模型,复现DeepSeek-R1
魔搭ModelScope社区
2025-02-09T16:31:13.000000Z