本地部署Ollama

ollama

Ollama 是什么？
Ollama 是一个开源工具，专注于在本地计算机上快速、便捷地运行和部署大型语言模型（LLMs），如 Meta 的 Llama 3、Llama 2、Mistral、Gemma 等。它通过简化的命令行工具和 API，让用户无需复杂的配置即可体验和测试最新的生成式 AI 模型，尤其适合开发者和研究者。

为什么使用 Ollama？

以下是选择 Ollama 的核心优势：

本地运行，保护隐私

所有模型和数据均在本地运行，无需依赖云端服务，避免敏感数据外泄。适合对隐私要求高的场景（如企业内部、医疗数据等）。

开箱即用，简化部署

ollama run llama3

支持多种主流模型

Modelfile

开发友好

提供 REST API，方便集成到其他应用或工具链。支持 Python/JavaScript 等语言调用，适合快速原型开发。

资源优化

对内存和显存使用进行优化，部分模型可在消费级 GPU 甚至 CPU 上流畅运行。支持量化模型（如 4-bit 量化），降低硬件门槛。

核心功能特性

跨平台支持

模型管理

ollama list

ollama pull

多模态支持

社区生态

快速入门示例

安装 Ollama

# Linux/macOScurl -fsSL https://ollama.com/install.sh | sh# Windows（预览版）# 从官网下载安装包：https://ollama.com/download

运行模型

ollama run llama3  # 启动 Llama 3 对话

通过 API 调用

curl http://localhost:11434/api/generate -d '{  "model": "llama3",  "prompt": "为什么天空是蓝色的？"}'

适用场景

本地 AI 开发

学术研究

企业 PoC

个人学习

总结

Ollama 是探索和部署本地大型语言模型的轻量级解决方案，尤其适合重视隐私、需要快速迭代的开发者和企业用户。如果你希望低成本体验最新 AI 模型或构建本地化 AI 应用，Ollama 是理想选择。

本地部署大语言模型选择方案

硬件配置	任务需求	推荐模型参数大小	量化策略	内存/显存占用	推荐模型示例	适用场景
无GPU，内存 ≤8GB	轻量级任务（聊天、短文本）	≤3.8B	4-bit	3-5GB	`Phi-3-mini`、`TinyLlama`	移动端、低功耗设备
无GPU，内存 8-16GB	通用任务（写作、问答）	7B-13B	4-bit/8-bit	5-12GB	`Llama3-8B`、`DeepSeek-7B`	个人电脑、基础开发
有GPU（显存 ≤12GB）	高质量生成/代码任务	13B-34B	8-bit	10-20GB（显存）	`CodeLlama-13B`、`Mixtral-8x7B`	开发者、数据分析
高性能GPU（显存 ≥24GB）	复杂推理/多模态任务	≥70B	非量化或混合精度	≥24GB（显存）	`Llama3-70B`、`Qwen-72B`	科研、企业级AI应用
多模态需求	图文理解/生成	7B-13B（专用架构）	4-bit	8-15GB	`LLaVA-1.5`、`BakLLaVA`	教育、内容创作
极低延迟要求	实时交互（如语音助手）	≤3.8B	4-bit	2-4GB	`Phi-2`、`StableLM-3B`	嵌入式设备、边缘计算

关键选择逻辑

硬件优先

无GPU

4-bit

有GPU

8-bit

任务导向

通用任务

Llama3-8B

专业领域

CodeLlama

LLaVA

量化权衡

4-bit

非量化

部署验证步骤

硬件检测

# Linux查看内存/显存free -h          # 内存lspci \| grep VGA  # GPU信息

模型测试

ollama run <模型名>:<量化版本>  # 例如 ollama run llama3:8b-4bit

性能监控

nvidia-smi

radeontop

总结

选择模型的核心公式：
合适模型 = 任务复杂度 × 硬件能力 ÷ 量化容忍度
通过表格对照快速定位候选模型，优先测试小参数量化版，逐步升级至硬件极限。

WINDOWS Ollama自定义安装

1.进入OllamaSetup .exe的目录下2.cmd3.输入命令：OllamaSetup .exe  /DIR=自定义文件路径4.设置大模型路径  进入高级系统配置，设置环境变量里的系统变量，新建  OLLAMA_MODELS:models的路径  确定后重启电脑5.cmd 输入ollama查看ollama

ollama

为什么使用 Ollama？

核心功能特性

快速入门示例

适用场景

总结

本地部署大语言模型选择方案

关键选择逻辑

部署验证步骤

总结

WINDOWS Ollama自定义安装

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签