热点
"模型能力提升" 相关文章
A Practice of Post-Training on Llama-3 70B with Optimal Selection of Additional Language Mixture Ratio
cs.AI updates on arXiv.org 2025-07-29T04:22:41.000000Z
Energy-Based Transformers are Scalable Learners and Thinkers
cs.AI updates on arXiv.org 2025-07-04T04:08:30.000000Z
多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
智源社区 2024-11-02T10:53:35.000000Z
新模型、常用语、语音交互、引用溯源|Kimi 上新
月之暗面 Kimi 2024-10-28T09:39:00.000000Z