热点
"稀疏激活" 相关文章
活动报名丨"懒惰神经元": 大模型中的自发稀疏激活现象及应用
智源社区 2025-07-23T01:20:34.000000Z
什么是MoE?MoE 架构详解
掘金 人工智能 2025-07-19T02:37:11.000000Z
一文看懂 MOE 模型:让大模型像医院看病一样高效工作
掘金 人工智能 2025-07-18T06:08:18.000000Z
大模型中的“超级专家会诊”:深入解读MoE架构
掘金 人工智能 2025-07-18T02:53:52.000000Z
This AI Paper from Microsoft Introduces WINA: A Training-Free Sparse Activation Framework for Efficient Large Language Model Inference
MarkTechPost@AI 2025-05-31T22:45:51.000000Z
只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软
智源社区 2024-07-19T05:06:38.000000Z
只激活3.8B参数,性能比肩同款7B模型,训练微调都能用,来自微软
36kr-科技 2024-07-18T07:34:13.000000Z
Training on a Dime: MEFT Achieves Performance Parity with Reduced Memory Footprint in LLM Fine-Tuning
MarkTechPost@AI 2024-06-12T09:01:28.000000Z