热点
"量化" 相关文章
技术前沿:MCP如何重塑大模型性能架构
掘金 人工智能 2025-06-11T09:34:02.000000Z
微软再放LLM量化大招,原生4bit量化,成本暴减,性能几乎0损失
36kr 2025-06-03T03:55:06.000000Z
微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失
新智元 2025-06-01T06:29:26.000000Z
炸裂!DeepSeek 8B 量化版降临:告别显存焦虑,你的 3080 Ti 也能玩转顶级大模型了!
掘金 人工智能 2025-05-31T03:03:04.000000Z
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍
新智元 2025-05-26T06:37:06.000000Z
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩 7 倍
掘金 人工智能 2025-05-26T03:53:01.000000Z
大模型微调实战进阶:从原理到单卡训练LLaMA-7B实战
掘金 人工智能 2025-05-20T09:08:00.000000Z
TensorFlow模型转换与优化:流程解析
掘金 人工智能 2025-05-16T10:28:15.000000Z
大语言模型的训练后量化算法综述 | 得物技术
得物技术 2025-05-14T12:27:57.000000Z
ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
机器之心 2025-05-06T07:41:38.000000Z
向量搜索:从入门到“踩坑”——工程师必须避开的 8 个陷阱
掘金 人工智能 2025-05-02T02:34:19.000000Z
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
智源社区 2025-04-30T12:44:24.000000Z
LLMs Can Now Retain High Accuracy at 2-Bit Precision: Researchers from UNC Chapel Hill Introduce TACQ, a Task-Aware Quantization Approach that Preserves Critical Weight Circuits for Compression Without Performance Loss
MarkTechPost@AI 2025-04-22T07:05:37.000000Z
Gemma 3支援QAT技術,消費級GPU就可執行270億參數大模型
AI & Big Data 2025-04-21T06:57:58.000000Z
25.4.17 赚了一天
漫漫游资路 2025-04-19T06:53:54.000000Z
不惧关税事件扰动,私募股票仓位创七个月新高,股票策略一季度领跑
深度财经头条 2025-04-13T10:45:45.000000Z
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
PaperWeekly 2025-04-10T13:47:21.000000Z
咱QwQ 32B就够了?Llama4还要2000B?!
算力百科 2025-04-09T11:12:39.000000Z
这个30岁后的顶级混世智慧,会得罪人
36kr 2025-04-09T08:33:46.000000Z
2月私募登记与产品备案环比减少,百亿量化私募备案更显积极
深度财经头条 2025-03-21T01:30:24.000000Z