微信扫码
添加专属顾问
我要投稿
本地跑大模型太吃力?试试Ollama云模型,轻松驾驭120B参数大模型,不挑硬件性能!核心内容: 1. Ollama云模型原理:本地命令调用云端算力 2. 本地模式与云模式的六大核心差异对比 3. 三步上手教程:从登录授权到API调用
关注 “AI 工具派”
探索最新 AI 工具,发现 AI 带来的无限可能性!
嗨,我是Chris,一个专注于探索各类 AI工具的博主,与大家一起发掘 AI 的潜力。我正在开发WiseMindA,期待它能成为提升学习效率的宝藏。
本地显卡不够、显存爆了、加载模型半天动不了?
Ollama 最近的「云模型」功能,可能正好能帮助到你。
如果你用过 Ollama,大概率是因为它能在本地跑各种大模型:
下载一个模型,用 ollama run 一敲,就能聊起来。
但问题也来了—— 模型太大了,本地电脑吃不消,显存不够、风扇狂转、系统一卡一卡的。
Ollama 新推出的云模型(Cloud Models)就是为了解决这个问题:
你还是用熟悉的命令,但模型不是在你电脑上跑的,而是在 Ollama 的云端跑完后,把结果传回来。
也就是说,你能像本地一样用 Ollama,却能跑更大的模型。
其实 Ollama 现在有两种运行方式:
| 模式 | 本地模型(local) | 云模型(cloud) |
|---|---|---|
| 运行位置 | ||
| 算力需求 | ||
| 延迟 | ||
| 模型体积 | ||
| 隐私性 | ||
| 成本 |
一句话总结:
👉 本地模型:快,但受限于设备。
👉 云模型:灵活,不挑硬件。
目前 Ollama 云端能用的模型都带 -cloud 后缀,目前仅支持:
DeepSeek-v3.1:671b-cloudgpt-oss:120b-cloudkimi-k2:1t-cloudqwen3-coder:480b-cloud这些名字后面都有个“-cloud”,代表模型在云端运行。
这些模型都是参数体量超大的模型,但你本地照样能用。
其实用起来很简单,分三步就行 👇
先登录 Ollama:
ollama signin
这里需要注意,需要把上面中的 https://ollama.com/connect?name=.....链接复制到浏览器打开,然后登录你的账号,确认授权:
或者使用 API 时,把 Key 设置好:
export OLLAMA_API_KEY=你的密钥
获取 API Key: https://ollama.com/settings/keys
然后直接在终端运行模型,比如:
ollama run gpt-oss:120b-cloud
和本地模型几乎一样,只是这次在云端跑。
想在自己的项目里接入也行。
示例代码如下:
import os
from ollama import Client
client = Client(
host="https://ollama.com",
headers={'Authorization': 'Bearer ' + os.environ.get('OLLAMA_API_KEY')}
)
messages = [{'role': 'user', 'content': '为什么天空是蓝色的?'}]
for part in client.chat('gpt-oss:120b', messages=messages, stream=True):
print(part['message']['content'], end='', flush=True)
就这样,你的本地脚本就能直接调用云端模型。
Chris 这里帮你总结下:
✅ 用本地模型的情况:
✅ 用云模型的情况:
很多人会两者结合:比如小任务用本地模型,大任务临时切云模型。更多介绍可以查看官网:https://docs.ollama.com/cloud
虽然云模型很方便,但也有一些要注意的:
假设你原本这样写的:
ollama run gpt-oss:20b
现在只要改成:
ollama run gpt-oss:120b-cloud
或者在代码里做个小判断 👇
model = "gpt-oss:120b-cloud" if use_cloud else "gpt-oss:20b"
这样就能随时切换运行模式,想本地跑就本地跑,想云跑就云跑。开发调试更灵活,也方便部署。
另外,在 Chris 开发的 AI 本地知识库软件 WiseMindAI 上,也即将支持 Ollama Cloud 模型了,预计 10 月底 v0.2.5 版本上线:
Ollama 的云服务包含小时和每日限制,以避免容量问题。目前支持免费和专业版订阅(20 美元),只是免费版的每日限制,官方还没有确定,目前可以免费使用:
Ollama 的云模型功能,可以说是「让你不买显卡,也能玩大模型」,使用的时候:
近期推荐
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-09
Prompt:段永平AI分身
2025-11-09
95% 企业 AI 落地失败当下,另外 5% 的 CIO 在谈什么?
2025-11-09
火了大半年的Agent,还能整出啥新花样?
2025-11-09
谷歌 Nano Banana 2 要来了,多步自检流程是亮点
2025-11-09
Anthropic革命性方案:AI Agent从15万Token干到2千Token的秘密
2025-11-08
AI落地:上下文工程,那个决定性的关键!
2025-11-08
阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析
2025-11-08
TEN 框架:轻松实现与 AI 实时语音对话
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-08-19
2025-09-19
2025-09-29
2025-11-09
2025-11-09
2025-11-08
2025-11-06
2025-11-06
2025-11-06
2025-11-05
2025-11-04