微信扫码
添加专属顾问
 
                        我要投稿
DeepSeek-OCR实测体验:从文字识别到图表估算,这款AI工具带来了哪些惊喜?核心内容: 1. 多场景测试:文字、表格、图表识别及标注功能表现 2. 使用技巧:中英文提示词差异及官方推荐模板 3. 独特亮点:无数据图表估值功能与Markdown转换实用价值
 
                                作者|Simon,硅基流动用户
我是 Simon,一个资深 asp.net 程序员,现在是一名独立的 AI 技术研发者,研发出多项 AI 应用于具体场景的技术,其中一项正在申请国家发明专利,已过初审。我会继续努力,争取有更大的进步。
OCR 模型我用过几款,也一直在关注,比如我有一个诉求是识别工业 CAD 图片,这是行业痛点之一,有一个具体场景是在图纸上高亮显示当前加工的工序,为后面的加工做提示。
DeepSeek-OCR 发布后,听说用了革命性的技术,就很好奇。
我写了一个页面用 WebAPI 调用硅基流动中这款模型,为了呈现效果也写了一些相关辅助的程序。先从最简单的有一些文字的图片开始,各种提示词都试试;然后尝试表格、图表的识别;再来几张照片看看模型能不能读懂;最后尝试在图上标注。咱一起看看 DeepSeek-OCR 的表现。
以上几个场景基本能让我们看到 DeepSeek-OCR 的能力,不过我在测试的过程中也有点过山车的感觉,满心期待开始,遇到问题很疑惑,各种尝试后又有小惊喜。
DeepSeek-OCR 你用过了吗?也想听听你的使用心得。
上手体验 DeepSeek-OCR,硅基流动「限时免费」~
近期更新
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-31
Opera One升级内置AI 迎来智能助手新纪元
2025-10-31
LangExtract——大模型文本提炼工具
2025-10-31
从Palantir智能化技术路线看AI时代企业级架构平台的核心战略位置
2025-10-31
OpenAI 公开 Atlas 架构:为 Agent 重新发明浏览器
2025-10-31
Palantir 本体论模式:重塑企业 AI 应用的 “语义根基” 与产业启示
2025-10-31
树莓派这种“玩具级”设备,真能跑大模型吗?
2025-10-30
Cursor 2.0的一些有趣的新特性
2025-10-30
Anthropic 发布最新研究:LLM 展现初步自省迹象
 
            2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-08-19
2025-09-29
2025-08-20