热点
关于我们
xx
xx
"
训练加速
" 相关文章
在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电
掘金 人工智能
2025-04-01T10:57:46.000000Z
标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
智源社区
2025-03-04T10:13:02.000000Z