适配 Windows 系统全覆盖日常使用、开发、离线、可视化场景一、命令行终端方式原生基础必掌握核心特点无需额外软件系统 CMD/PowerShell 直接操作轻量高效适合快速调试、批量管理模型常用管理命令bash运行# 下载模型 ollama pull llama3:8b # 交互式对话运行 ollama run llama3:8b # 查看本地已下载所有模型 ollama list # 查看当前正在运行的模型进程 ollama ps # 停止运行中的模型 ollama stop 模型名 # 删除本地模型释放空间 ollama rm 模型名 # 查看模型参数详情 ollama show 模型名 # 查看版本 ollama --version退出对话输入/bye即可结束会话二、REST API 接口调用开发集成核心特点默认本地端口11434兼容 OpenAI 接口格式可被 Python、软件、机器人、网页调用后台静默运行模型基础调用示例聊天接口bash运行curl http://localhost:11434/api/chat -d { \model\:\llama3:8b\, \messages\:[{\role\:\user\,\content\:\介绍Ollama\}] }文本生成接口bash运行curl http://localhost:11434/api/generate -d { \model\:\llama3:8b\, \prompt\:\写一段简短文案\ }适用场景代码项目对接、第三方软件接入、自动化脚本调用三、Modelfile 自定义封装模型定制专属模型核心特点基于已有模型自定义人设、温度、上下文长度、回答风格打包成全新私有模型操作步骤新建无后缀文件Modelfileplaintext# 基于原有模型 FROM llama3:8b # 创作随机性 0严谨-1发散 PARAMETER temperature 0.6 # 上下文记忆窗口 PARAMETER num_ctx 4096 # 固定AI人设指令 SYSTEM 你是专业技术助手回答简洁易懂执行打包命令bash运行ollama create my-ai -f Modelfile直接运行自定义模型bash运行ollama run my-ai四、Web 可视化界面图形化傻瓜操作核心特点抛弃命令行浏览器可视化聊天、下载、管理模型支持对话记录、多会话切换主流两款 UIOpen WebUI功能最全bash运行# 一键部署 docker run -d -p 3000:3000 -v open-webui:/app/backend/data --add-hosthost.docker.internal:host-gateway ghcr.io/open-webui/open-webui:main浏览器访问http://localhost:3000Lobe Chat界面简洁美观轻量化部署适合日常聊天使用功能一键下载模型、可视化删除、会话存档、参数可视化调整五、离线本地 GGUF 模型导入断网 / 解决下载超时核心特点规避网络超时、境外下载失败本地下载 GGUF 格式模型文件手动导入运行完整步骤国内站点下载 GGUF 模型魔搭 ModelScope、HF 镜像站优先选 Q4_K_M 轻量化量化同目录创建ModelfileplaintextFROM ./本地模型文件名.gguf本地导入创建模型bash运行ollama create 离线模型名 -f Modelfile正常启动使用bash运行ollama run 离线模型名方式选型对照表使用方式适用人群优势命令行调试、运维、老手极速启动、占用资源低API 调用开发者、程序集成无缝对接各类项目Modelfile定制 AI 人设打造专属风格模型WebUI日常聊天、新手操作直观、体验舒适离线导入网络差、无网环境彻底解决下载超时