热点
"1bit LLM" 相关文章
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
智源社区 2025-04-22T04:53:46.000000Z
CPU推理仅29ms,微软开源第一个原生 1 bit 大模型,内存只需Qwen 1.5B的1/15
PaperAgent 2025-04-20T13:18:44.000000Z
微软开源 1.58bit 推理框架:千亿参数模型量化后单 CPU 可跑,速度每秒 5-7 个 token
IT之家 2024-10-22T11:08:43.000000Z