Mac上跑大模型必看：彻底搞懂GGUF与MLX的区别和联系

掘金人工智能 33分钟前

Mac上跑大模型必看：彻底搞懂GGUF与MLX的区别和联系

本文深入探讨了GGUF和MLX这两种技术，它们分别在模型存储和推理方面发挥着关键作用。GGUF作为一种高效的模型存储格式，特别擅长支持量化模型，而MLX是苹果开发的机器学习框架，专为苹果设备优化。文章详细介绍了两者的定义、用途、关键区别，以及如何结合使用以在苹果设备上实现高性能、低内存占用的本地大模型推理，为用户提供了清晰的技术指导。

💡 GGUF是一种高效的模型存储格式，最初用于量化和推理大语言模型，特别适用于本地部署小到中型的LLM，如LLaMA系列。

💻 MLX是苹果开发的机器学习框架，专为苹果设备设计，旨在高效运行机器学习模型，包括大语言模型，并支持GPU加速，尤其针对Apple Silicon芯片进行了优化。

🆚 GGUF和MLX的主要区别在于：GGUF主要关注模型存储格式，尤其是量化模型，而MLX则是一个完整的机器学习框架，用于在苹果设备上进行模型推理。

🤝 GGUF和MLX可以结合使用，将HuggingFace上的标准模型转换为GGUF格式，再进一步转换为MLX格式，最终在Mac等苹果设备上使用mlx框架进行推理，实现高性能的本地大模型推理。

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！

编程严选网

1 定义和用途

1.1 GGUF（原名 GGML）

现称 GGUF（以前是 GGML），最初是一个用于量化和推理大语言模型的格式。

1.1.1 主要作用

提供一种高效的模型存储格式，特别是支持量化模型（如4-bit、5-bit等低精度模型）。

被广泛用于本地化部署小到中型的LLM（如 LLaMA 系列的轻量版本）。

1.1.2 优点

占用内存小，适合在PC运行支持多种推理后端，如 llama.cpp 等。

1.1.3 典型工具/项目

1.2 MLX（Apple Machine Learning eXtension）

由 Apple 开发：专门为苹果设备（Mac、iPad、iPhone）设计的机器学习框架。

主要作用

在苹果生态中高效运行机器学习模型（包括大语言模型）。支持 GPU 加速（Apple Silicon 的 NPU）。

特点

针对苹果芯片优化（M1/M2/M3 等）。可以加载 PyTorch 模型，并进行本地推理。

常见用法

mlx

2 关键区别

特性	GGUF	MLX
类型	模型存储格式（主要是量化模型）	机器学习框架（适用于苹果平台）
是否依赖硬件	否，但常用于 CPU 推理	是，专为 Apple Silicon（M 系列芯片）优化
平台支持	多平台（Windows, Linux, macOS）	苹果平台为主
是否支持 GPU	不直接支持 GPU	支持 Apple GPU/NPU 加速
是否支持量化	是，GGUF 就是以量化模型著称	MLX 可以运行量化模型，但不是其核心特性
常见工具	llama.cpp	mlx（Apple 自研库）
是否开源	是	是

3 是否可以一起使用？

✅ 可以！

GGUF 格式

MLX 格式

mlx

这种组合可以在苹果设备上实现高性能、低内存占用的本地大模型推理。

4 总结

GGUF 是一种高效的模型存储格式（尤其是量化模型），而 MLX 是苹果开发的机器学习框架，两者可以结合使用，在苹果设备上实现高性能本地推理。

本文由博客一文多发平台 OpenWrite 发布！

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GGUF MLX 大模型苹果推理

相关文章

Canalys：2024年全球智能手机市场同比增长10%

2024年3月苹果中国降价促销iPhone出货量飙升12%

回顾我的 prompt 能力从小白到熟练的一些重要节点：防杠叠甲： 1. 仅代表我自己的认知，没啥权威性。 2. 认为提示词那么简单至于搞那么复杂么的朋友，你对 3. ...

SAP大中华区总裁黄陈宏：SAP不做大模型

Teaching Large Language Models to Reason with Reinforcement Learning with Alex Havrilla - #680

Engineering the Future of AI with Ruchir Puri - TWiML Talk #21

This Week in ML & AI – 8/5/16: Apple Acquires Turi, the DARPA Hacker-Bot Challenge and More

This AI Paper by the University of Michigan Introduces MIDGARD: Advancing AI Reasoning with Minimum Description Length

苹果公司美国新泽西州门店员工投票反对成立工会

李开复：现在对中国大模型创业公司盖棺定论为时尚早，ofo式的补贴逻辑不再适用于AI 2.0