我要投稿

聊聊Ollama如何离线部署GLM4-9b

发布日期：2024-07-31 07:20:55 浏览次数： 3223

作者：阿郎小哥的随笔驿站

微信搜一搜，关注“阿郎小哥的随笔驿站”

概述

Ollama官方地址：ollama。

官方已经讲的很清楚，但是在离线环境下，官方的文档还是显得很麻烦，而且镜像库的拉取部署也没有讲的很清楚。

从目前，我个人接触的Agent、RAG等框架，现今实现更多的是如下的接入模式：对于自己玩还行，调用官方开放平台免费的api，申请api_key即可；但在内网要玩起来就很麻烦了，连不到网，而且本地部署的模型，框架又不支持引入（我个人遇到过这种情况，譬如LangChain）。

现在更多的推理部署框架开源起来，譬如Ollama，xinference，vllm等，这些推理部署框架接入原生LLM后，实现了高并发、高性能、快捷方便的部署方式；部署起来后，对外只需要提供一个API端口，甚至是UI界面即可由第三方框架接入。

Ollama离线部署

下载离线二进制包，ollama；注意，这是一个二进制文件，下载后，可以直接运行，不过先给一个权限。我的docker系统环境是ubuntu。新建一个文件夹，路径是/home/Ollama，将下载后的二进制包重命名为ollama，

chmod +x ./ollma

文件夹结构如下：然后执行ollama的命令，启动服务，可以先看看ollama支持的命令：启动即可，如下：在这里我强烈建议，把info那段输出好好的阅读下，这里面包含了ollama的环境变量信息。

列举ollama的模型列表，执行命令list即可，刚部署完是空的。

模型拉取

在内网环境下，服务器不能联网，那么就不能使用ollama run xxx一键拉取，虽然ollama官方提供了手动下载的方式，但我没有尝试，因为有点难，而且对我来说还是有点问题。最后我换了个思路：先用VM拉取模型到本地，然后再模型上传到内网服务器上，ollama一识别就可以了。正常来说应该是没问题的，因为用run命令也是下载到本地，然后Ollama识别，按道理只要下载到了指定目录，正常来说，不管是哪种方式（手动或是自动）应该是一致的。在VM上，指定模型的下载路径，如下：

OLLAMA_MODELS=/home/ollama_sitepackage/ ./ollama run glm4:9b

环境变量都已经在上面截图的info级别信息打印出来了，留心看看。

不过，最后总会有个报错，但可以忽略，因为模型已经下载了，可以在文件夹内查看，如下：然后将这整个文件夹都上传到内网。

查看list列表：

最终指定环境变量启动ollama：

OLLAMA_HOST=0.0.0.0:11434 OLLAMA_MODELS=/home/ollama_sitepackage/ ./ollama serve

完美运行：

总结

很多的框架都支持在线拉取，但由于实际环境的限制，不会有这么便捷；但不管是远程在线拉取还是离线下载上传，只要清楚其原理逻辑，顺着推演，都是可以做到的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-03

OpenAI成立百人团队训练机械臂做家务，今年是否能迎来机器人管家

2026-01-31

AI硬件的宿命：要么“在场”，要么“进抽屉”

2026-01-31

我们测了十几款AI硬件，发现它们死于同一个问题

2026-01-29

LiteRT | 释放极致潜能，构建下一代高性能端侧 AI

2026-01-29

在树莓派CM0上部署 Clawdbot 真的有那么神奇吗？

2026-01-22

英伟达让机器人闪念决策：Fast-ThinkAct如何让AI思考速度快9倍还更聪明？

2026-01-20

AI手机的终极猜想：超级Agent入口｜产业深度

2026-01-19

吃灰 AI 眼镜爆改“交警 Copilot”，函数计算AgentRun 实操记录

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

豆包手机，从爆火到翻车只用了3天

2025-12-05

豆包AI手机遭全网抵制，深度解析！

2025-12-09

最强核显+峰值160W性能释放——AI MAX+ 395 铭凡MS-S1 Max 迷你工作站体验

2025-11-09

一手实测豆包手机助手，这就是当今手机Agent的天花板。

2025-12-01

我在字节的最后一个项目：聊聊豆包AI手机助手

2025-12-08

Agentic 应用时代，Dify 全链路可观测最佳实践

2025-11-17

豆包“撕裂”AI手机

2025-12-15

中兴把手机最核心的“灵魂”给了字节

2025-12-01

字节从自研手机转向华为inside模式，背后发生了什么｜独家

2025-12-03

在树莓派CM0上部署 Clawdbot 真的有那么神奇吗？

2026-01-29

大家都在问

在树莓派CM0上部署 Clawdbot 真的有那么神奇吗？

2026-01-29

英伟达让机器人闪念决策：Fast-ThinkAct如何让AI思考速度快9倍还更聪明？

2026-01-22

豆包手机之后，AI 手机还需要什么？

2026-01-06

怎么都在做“智慧笔”？

2026-01-04

OpenAI 首款 AI 硬件，是一支能「舔」的笔？

2026-01-02

一年花上千块来录音，是韭菜还是真有用？

2025-11-08

免费又好用的AI录音笔都出来了，这下哪还有理由不学习？

2025-10-27

阿里夸克AI眼镜开售：叠加补贴后3699元，它能打破AI眼镜的魔咒吗？

2025-10-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean