热点
关于我们
xx
xx
"
CoCoMix
" 相关文章
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
智源社区
2025-03-03T05:07:14.000000Z
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
新智元
2025-03-02T06:16:47.000000Z
模型预训练模式“变天”?Meta推出预训练框架,训练token减少21.5%
DeepTech深科技
2025-02-20T16:24:41.000000Z
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
机器之心
2025-02-16T08:07:41.000000Z
Meta AI Introduces CoCoMix: A Pretraining Framework Integrating Token Prediction with Continuous Concepts
MarkTechPost@AI
2025-02-13T20:30:45.000000Z