热点
"混合精度量化" 相关文章
MicroMix: Efficient Mixed-Precision Quantization with Microscaling Formats for Large Language Models
cs.AI updates on arXiv.org 2025-08-05T11:29:07.000000Z
扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法
智源社区 2025-01-19T08:37:08.000000Z
扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法
量子位 2025-01-19T07:39:33.000000Z