我要投稿

用户测评｜DeepSeek-OCR，你用了吗？

发布日期：2025-10-31 21:32:24 浏览次数： 1533

作者：硅基流动

微信搜一搜，关注“硅基流动”

作者｜Simon，硅基流动用户

我是 Simon，一个资深 asp.net 程序员，现在是一名独立的 AI 技术研发者，研发出多项 AI 应用于具体场景的技术，其中一项正在申请国家发明专利，已过初审。我会继续努力，争取有更大的进步。

OCR 模型我用过几款，也一直在关注，比如我有一个诉求是识别工业 CAD 图片，这是行业痛点之一，有一个具体场景是在图纸上高亮显示当前加工的工序，为后面的加工做提示。

DeepSeek-OCR 发布后，听说用了革命性的技术，就很好奇。

“要知道梨子的滋味，就得亲口尝一尝”

我写了一个页面用 WebAPI 调用硅基流动中这款模型，为了呈现效果也写了一些相关辅助的程序。先从最简单的有一些文字的图片开始，各种提示词都试试；然后尝试表格、图表的识别；再来几张照片看看模型能不能读懂；最后尝试在图上标注。咱一起看看 DeepSeek-OCR 的表现。

1. 识别图片上的文字，准确度高，速度特别快，速度这一点体验很赞。

2. 提取图表信息，表现也不错。

3. 这里有个小惊喜，我输入的原图是没有具体数据的，输出时模型给了估算值，第一次体验到这样的模型能力。

4. 这个场景大家可以用不同的提示词来试试，这个输出结果基本满足我的设想。

5. 这个提示词是：general: <image>\nAnalyze the crop lodging situation in the image, identify the lodged areas, and estimate the percentage of affected area. 模型给出的回答让人看到了更大的想象空间。

体感总结

以上几个场景基本能让我们看到 DeepSeek-OCR 的能力，不过我在测试的过程中也有点过山车的感觉，满心期待开始，遇到问题很疑惑，各种尝试后又有小惊喜。

1. 很多时候我发现中文提示词不起效，返回的结果也不稳定，改为英文提示词就顺畅多了。硅基流动的同学也给我推荐了官方提供的常用提示词：

General OCR: Free OCR.
Markdown: <|grounding|>Convert the document to markdown.
Table: <|grounding|>Extract all tables and convert to markdown format.

2. 模型幻觉还是有的，有时会回复与图片无关的回答。虽然返回结果有时不稳定，但有一种“大模型真正看懂图片了”的直观感受，通过优化提示词可以有真实的应用价值。
3. 图文等形式转成 Markdown 格式很实用，也方便后续还原文本和电子表格等。
4. 最让我感到惊艳的就是那张没有标值的图表，DeepSeek-OCR 能输出估算值。
5. 这款模型识别速度惊人，可能是我用过最快的 OCR 模型了。
6. 测评后，我自己后续想做的应用：开发一个工具一键还原图片中的文本或表格，还会把它用于图纸的识别场景。

DeepSeek-OCR 你用过了吗？也想听听你的使用心得。

上手体验 DeepSeek-OCR，硅基流动「限时免费」～

近期更新

硅基流动推出企业级MaaS

硅基流动上线阿里Qwen-VL-32B

2秒出图！Qwen-Image系列登陆BizyAir

硅基流动上线DeepSeek-OCR，限时免费

硅基流动企业级MaaS助电力巨头效能狂飙

提效300%，大模型一体机加速药企报告撰写

扫码加入用户交流群

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-31

Opera One升级内置AI 迎来智能助手新纪元

2025-10-31

LangExtract——大模型文本提炼工具

2025-10-31

从Palantir智能化技术路线看AI时代企业级架构平台的核心战略位置

2025-10-31

OpenAI 公开 Atlas 架构：为 Agent 重新发明浏览器

2025-10-31

Palantir 本体论模式：重塑企业 AI 应用的 “语义根基” 与产业启示

2025-10-31

树莓派这种“玩具级”设备，真能跑大模型吗？

2025-10-30

Cursor 2.0的一些有趣的新特性

2025-10-30

Anthropic 发布最新研究：LLM 展现初步自省迹象

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

DeepSeek突然更新V3.1：实测后才发现的亮点与槽点

2025-08-19

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）