热点
"降低量化难度" 相关文章
50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral
智源社区 2024-11-08T12:07:12.000000Z