我要投稿

第一次用 Ollama 跑视觉模型：Qwen2.5-VL 7B 给了我一个意外惊喜

发布日期：2025-11-18 07:58:12 浏览次数： 2748

作者：勇哥Java实战

微信搜一搜，关注“勇哥Java实战”

前几天在 Mac 上安装了 Ollama，并下载了 Qwen2.5-VL 7B 做了一些测试，整个过程还挺有意思，分享给大家。

1 Mac 安装 Ollama

进入 Ollama 官网，我的电脑是 Mac Studio ，所以选择 MacOS 下载。

下载完成后，双击安装，安装完成后界面如下图：

2 下载 Qwen 2.5 VL 7B

Qwen 2.5-VL 是阿里巴巴通义千问团队开发的一款开源的旗舰级视觉语言模型。

它能够处理文本、图像和视频，并具备强大的视觉理解和交互能力。该模型有不同参数规模（如 3B、7B 和 72B），适用于从边缘 AI 到高性能计算的多种场景。

下载 Qwen 2.5 VL 有两种方式：

1、通过命令行请求

ollama pull qwen2.5vl:7b

2、通过 Ollama GUI 界面安装

在 GUI 界面选择模型，若未下载会显示下载图标，然后在对话框中输入任意文本即可自动下载。

3 文本/图片体验

下载完模型后，即可在对话框中进行对话。

当然我们也可以通过 ollama 启动模型后展开对话：

ollama run qwen2.5vl:7b

接下来，进行图片检测，图片如下：

检测结果：

我们也可以通过该模型识别图像中的文字、公式或抽取票据、证件、表单中的信息，支持格式化输出文本：

4 程序调用分析图片

我们可以编写 python 调用 Ollama 接口，实现模型分析图片：

curl http://localhost:11434/api/chat -d '{
  "model": "qwen2.5vl:7b",
  "messages": [
    { "role": "user", "content": "写一段代码" }
  ]
}'

效果见下图：

5 总结

Qwen 2.5-VL 7B 简直就是“本地视觉小钢炮”。

笔者认为它尤其适合在如下场景中发挥作用：

文档和票据解析：发票、合同、报表、扫描件，一次推理即可提取文字并生成结构化数据
表格与图表解析：财务报表、统计图表，快速提取表头和数据，方便后续分析
图片场景理解：仓库、机房、办公室等照片，自动识别物体和整体场景
多模态问答：结合图片和文本内容回答问题，支持科研、教育或产品原型
内容审核与合规检测：识别敏感文字或违规图像，本地部署保护隐私

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-22

DiffusionGemma: 文本生成速度提升 4 倍

2026-06-22

刚刚，百度开源拿下全球第一！作者疑似DeepSeek出走大神

2026-06-22

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-20

GLM-5.2本地部署：744B参数模型如何在Mac上跑

2026-06-20

Hermes Agent v0.17发布：AI助手开始扩展触角

2026-06-18

开源中医 Skill：把倪海厦课程变成可检索知识库

2026-06-18

Gemma 4 QAT 模型现已推出: 支持日常端侧设备与消费级 GPU 本地流畅运行

2026-06-17

GLM-5.2 技术解读：智谱百万上下文的新一代旗舰模型

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

CoPaw深度解析：源码架构和功能实践

2026-03-31

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw