热点
"知识蒸馏" 相关文章
52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解
智源社区 2025-04-29T14:30:22.000000Z
52 页 PPT,谷歌 Gemini 预训练负责人首次揭秘!扩展定律最优解
掘金 人工智能 2025-04-29T03:22:54.000000Z
52页PPT,谷歌Gemini预训练负责人首次揭秘,扩展定律最优解
36kr 2025-04-28T11:43:57.000000Z
WWW'25 | 大模型深度赋能搜索广告:相关性大模型多维知识蒸馏
智源社区 2025-04-24T12:43:57.000000Z
The Rise of Small Reasoning Models: Can Compact AI Match GPT-Level Reasoning?
Unite.AI 2025-04-05T18:42:14.000000Z
通过DeepSeek现象思考大模型落地的正确路径
安全村SecUN 2025-04-05T08:06:09.000000Z
95后博导张林峰专访:6年前提出自蒸馏算法,高效AI助推大模型时代丨独家
智源社区 2025-03-26T04:33:39.000000Z
无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
机器之心 2025-03-20T05:13:31.000000Z
参数即权力?小模型如何用“减法逻辑”重构AI基础设施|DeepTalk对话清华大学韩旭
DeepTech深科技 2025-03-20T05:11:59.000000Z
GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能
机器之心 2025-03-12T09:52:25.000000Z
明日直播|大语言模型的知识蒸馏,一站式解释方法、技能和应用
智源社区 2025-03-11T08:02:11.000000Z
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
智源社区 2025-03-10T11:10:38.000000Z
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
新智元 2025-03-09T07:03:29.000000Z
热门报告|大语言模型的知识蒸馏,一站式解释方法、技能和应用
智源社区 2025-03-08T08:21:23.000000Z
ICLR 2025 | 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型
PaperWeekly 2025-03-07T13:06:37.000000Z
Accelerating AI: How Distilled Reasoners Scale Inference Compute for Faster, Smarter LLMs
MarkTechPost@AI 2025-03-04T01:35:16.000000Z
大模型"蒸馏"是什么?
云中江树 2025-03-03T09:23:59.000000Z
6000字深度思考,有关DeepSeek、科技竞争、AGI的一切
36kr-科技 2025-02-18T03:36:54.000000Z
LLM Model Pruning and Knowledge Distillation with NVIDIA NeMo Framework
Nvidia Developer 2025-02-16T15:07:08.000000Z
ICLR-2025|如何在ImageNet-1K上训练视觉基础模型
我爱计算机视觉 2025-02-14T14:11:27.000000Z