热点
关于我们
xx
xx
"
Open Reasoner Zero
" 相关文章
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
量子位
2025-02-24T01:13:50.000000Z
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
智源社区
2025-02-23T12:37:14.000000Z
1/30 训练步骤复刻 DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法
IT之家
2025-02-22T09:51:25.000000Z