微信扫码
添加专属顾问
我要投稿
LlamaParse[1] 是一个专为生成式人工智能(GenAI)设计的文档解析器,能够解析复杂的文档数据,以适应任何下游大型语言模型(LLM)的使用场景,如检索增强生成(RAG)或智能代理。
它能够解析多种复杂的文件类型,包括 PDF、PPTX、DOCX、XLSX 和 HTML,并且支持表格识别、多模态解析和自定义解析。
pip install llama-parse 命令安装 LlamaParse 包。import nest_asyncio
nest_asyncio.apply()
from llama_parse import LlamaParse
parser = LlamaParse(
api_key="llx-...", # 也可以设置环境变量 LLAMA_CLOUD_API_KEY
result_type="markdown", # 可选 "markdown" 和 "text"
num_workers=4, # 如果上传多个文件,将分成 `num_workers` 个 API 调用
verbose=True,
language="en", # 可选定义语言,默认为英文
)
# 同步解析单个文件
documents = parser.load_data("./my_file.pdf")
# 同步批量解析
documents = parser.load_data(["./my_file1.pdf", "./my_file2.pdf"])
# 异步解析单个文件
documents = await parser.aload_data("./my_file.pdf")
# 异步批量解析
documents = await parser.aload_data(["./my_file1.pdf", "./my_file2.pdf"])
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-06
RAG 落地全干货深度分享:从“效果不理想”到生产级 RAG 系统的进化之路
2026-02-06
效率神器 Claude-Mem:终结 AI “金鱼记忆”!自动保存上下文、可视化记忆流,开发体验提升 10 倍!
2026-02-06
告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
2026-02-05
向量,向量化,向量数据库和向量计算
2026-02-05
从 RAG 到 Agentic Search,一次关于信任 AI 判断的认知升级
2026-02-04
Claude Cowork 真能替换 RAG ?
2026-02-03
使用 Agent Skills 做知识库检索,能比传统 RAG 效果更好吗?
2026-02-03
告别向量数据库!PageIndex:让AI像人类专家一样阅读长文档
2025-12-04
2025-12-03
2025-11-13
2025-12-02
2025-11-13
2026-01-15
2026-01-02
2025-12-07
2025-12-23
2025-12-18
2026-02-04
2026-02-03
2026-01-19
2026-01-12
2026-01-08
2026-01-02
2025-12-23
2025-12-21