热点
关于我们
xx
xx
"
蒸馏
" 相关文章
R1时代,RAG-Retrieval技术总结与展望~
PaperAgent
2025-06-01T13:28:09.000000Z
大模型算法架构:DeepSeek技术演进及剖析
掘金 人工智能
2025-05-28T02:18:17.000000Z
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
AI科技评论
2025-05-21T12:07:45.000000Z
强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏
智源社区
2025-04-27T09:48:02.000000Z
86 条 DeepSeek 的关键思考 |Best Ideas 开源
海外独角兽
2025-04-09T10:06:17.000000Z
DeepSeek-R1解读:纯强化学习,模型推理能力提升的新范式?
智源社区
2025-01-29T03:07:12.000000Z
确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率
机器之心
2025-01-18T07:54:56.000000Z
国产白酒比进口红酒更健康—甲醇对比。
虎扑-热帖
2024-12-30T19:05:25.000000Z
OpenAI 新货详解:强化微调
赛博禅心
2024-12-07T12:51:32.000000Z
NeurIPS 2024|单步生成:让扩散模型实现高速无损的内容生成
我爱计算机视觉
2024-11-19T12:10:46.000000Z
微軟AI主管談AI趨勢:大小模型將「齊頭並進」,「規模法則」遠沒有到極限
富途牛牛头条
2024-11-03T06:20:03.000000Z
大模型相关的产品化路径思考|奇绩大模型笔记 #3
奇绩创坛
2024-10-28T14:26:24.000000Z
Optimizing Artificial Intelligence Performance by Distilling System 2 Reasoning into Efficient System 1 Responses
MarkTechPost@AI
2024-07-27T09:34:18.000000Z
将慢思考蒸馏进快思考,Meta 把 Llama2 跃升至 GPT-4 水平
智源社区
2024-07-17T03:21:50.000000Z