微信扫码
添加专属顾问
我要投稿
揭秘如何用Dify实现PDF文档原格式翻译,保持排版不变的同时完成多语言转换。 核心内容: 1. PDF原格式翻译的技术难点与解决方案 2. Dify平台搭建翻译Agent的完整流程 3. 实际案例展示与效果对比
支持PDF原文件文档翻译是指能够将PDF文件中的文本内容自动翻译成另一种语言,并且在翻译过程中保留原始文档的格式、布局和排版。这种翻译方式不仅提高了翻译效率,还确保了翻译后的文档在视觉上与原文档保持一致,便于阅读和使用。
支持PDF原文件文档翻译的工具通常具备以下特点:
之前有小伙伴和我提出有没有办法实现文档的翻译,翻译需要保持原文档格式的不变。我后面时间研究了一下,一开始我想简单了以为靠传统的大模型翻译就可以解决,经过这几天的努力目前初步完成了。今天刚好基于dify1.6版本做了一个支持原始MCP的一个PDF文档翻译的Agent。那么我们看一下效果。
上面文档基于双语翻译后的文档。左边是原文法语,右边是翻译后的中文。大家看一下效果怎么样? 还不错吧,文档保持原来格式没有变化。dify 实现的效果如下:
那么这样的agent是如何制作的呢?话不多说下面带大家制作一个。
这个agent调用了一个我自己制作的一个MCP-Server 这个MCP 对外提供SSE方式调用,我们已经提前部署好了。接下来我们需要在dify1.6+版本上配置这个MCP
打开工作流工作台,点击工具按钮
我们点击MCP
这里我们点击添加基于HTTP服务的MCP
我们按照上面图配置好基于SSE的MCP-Server。配置完成后,点击右上角授权,这样我们就可以现在这个MCP-Server可以使用的9个工具
点击创建空白应用
进入Agent页面
我们点击工具-添加按钮,在弹出工具选择我们选择dify内置的MCP
目前我这里就配置了一个pdftranslate-mcp-server。所以我们点开它,把它9个工具都选中。
点击添加完成后,我们的MCP 配置就算完成了。
接下来我们添加开场白,点击右边右下角管理按钮,弹出管理设置页面
添加上面的开场白,这样的开场白设置就完成了。
模型这里我们选择硅基流动提供的DeepSeek-ai/DeepSeek-V3 模型,如果没有硅基的小伙伴可以去这个地址https://cloud.siliconflow.cn/i/e0f6GCrN 新户可以送14元。他们家最近上新了不少新模型。
以上我们就完成了agent设置了,这个应该非常简单的,小白一看就会。
点击工作流左上角“发布” 按钮,发布这个Agent
接下来我们输入我们的问题
请把这个文件翻译一下,文件URL地址https://music-1258720957.cos.ap-nanjing.myqcloud.com/11.pdf
接下来模型会调用这个PDF链接下载并上传到MCP-Server中,大概过几分钟会返回信息
测试过程中,文档翻译是需要时间的。所以模型会调用状态不断获取生成状态给客户端返回。如果返回不了,可以输入下面信息
请刚我把刚才翻译后的PDF下载链接地址发给我
让模型继续调用直到返回成功为止。
调用成功后默认会返回2个文档 双语 和翻译后的单语言。 当然你也可以让它只返回一个PDF文档。
我们点击链接下载这个翻译的PDF文件
这个就是翻译后的文档。
同时我们也能在后端MCP 服务中看到请求日志
以上我们就完成了dify 验证测试。 这个MCP 也可以发布在其他支持的mcp-client中使用,比如我本地电脑上的Cherry Studio
可能有小伙伴会问,这类文档是否需要上传带链接的版本?其实,MCP 支持三种文件传入方式:
其中,第三种本地文件方式,若要发布 MCP,需基于 stdio 实现;但如果用 dify 调用,这种方式就不太合适。而第一种 base64 值方式,由于文件转成 base64 后会导致 token 过大,多数模型对上下文大小有限制,容易出现调用失败的情况。
因此,本次文件上传最终选择通过 URL 链接的方式来实现。
我前2天也基于这个项目做了一版网页版本的pdftranslate PDF翻译工具。部署在服务器上可以支持更大文件的翻译。
感兴趣小伙伴可以关注哦。
基于dify 体验地址
工作流地址:https://dify.duckcloud.fun/chat/ltoJtnaKY6J6DmfO备用地址(http://14.103.204.132/chat/ltoJtnaKY6J6DmfO)
另外方便大家使用MCP,这个MCP请求地址也开放给大家(无密码)
https://pdftranslate2.duckcloud.fun/sse
这个PDF文档的原始材料是基于网友:王科提供的,该同志具有丰富的海外项目背景知识。项目最早的想法也是基于它提出来的。(他们直接工作中有这类PDF文档翻译的需求)
今天主要带大家制作了一个基于 Dify 1.6+ 版本的支持原始 MCP 的 PDF 文档翻译 Agent。此次实践不仅实现了 PDF 文档的高质量翻译,还重点展示了 Dify 在集成外部服务、简化工具配置方面的强大能力。
总的来说,通过此次实践,我们充分体验到了 Dify 在 AI 应用开发中的便捷性和高效性。它通过集成 MCP 服务,简化了与外部工具的集成过程,提高了工作流的可重用性和系统的稳定性,为 PDF 文档翻译等特定任务提供了强大、便捷的解决方案。
感兴趣的小伙伴可以按照本文步骤去尝试制作自己的 PDF 文档翻译 Agent,并体验 Dify 带来的新功能。今天的分享就到这里结束了,我们下一篇文章见。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-29
Dify 1.8.0 实测:多模型管理、MCP OAuth、异步存储,真升级还是鸡肋?
2025-08-28
Dify v1.8.0大版本更新:多模型凭证系统的底层架构革新与MCP的 OAuth 集成能力突破!
2025-08-27
Dify发布了V1.8.0版本,安全性和性能有了重大改进,让我们一起来看看吧!
2025-08-25
4300字长文:使用dify搭建合同审核Agent
2025-08-23
Dify集成MCP服务
2025-08-23
Dify v1.7.2 实战爆破:6 大特性颠覆开发,23 处修复稳如老狗
2025-08-20
深度实战:我用 Dify 复刻了 1688 的 AI 搜索,“多路召回”才是灵魂
2025-08-20
Dify Java Client
2025-06-04
2025-06-25
2025-06-03
2025-06-02
2025-06-05
2025-06-30
2025-06-29
2025-06-10
2025-06-24
2025-06-09
2025-08-29
2025-08-18
2025-08-02
2025-07-30
2025-06-26
2025-06-17
2025-05-29
2025-05-28