我要投稿

大模型和Agent用两行代码实现Excel/CSV文件数据分析

发布日期：2024-07-13 04:24:14 浏览次数： 9622

作者：bytechu

微信搜一搜，关注“bytechu”

经常跟数据打交道的“表哥”、“表妹”，经常看报表的各位老板，应该非常熟悉Excel和CSV文件，通常我们想要分析数据中的信息，会使用各种函数、工具来进行探索和评估，最终输出分析报告形成数据支撑。

当下还是有非常多的企业招聘数据产品、数据分析的岗位，在大模型时代，如何用大模型的思路助力数据研发？这篇文章我们利用大模型、Agent以及LangChain框架来实现与CSV文件的直接“对话”，并且非常cool的一点，实现这一切仅仅需要两行代码。

Excel可以导出成CSV格式，我们此处仅考虑CSV文件

1. 准备工作

Python 3.10+ 的开发环境
大模型的API Key，任一可调用API的大模型（OpenAI / Minimax / ...）
一些csv文件（本文中我们选取了两类csv文件，一类是FAQ型，一类是数据记录型）
langchain
langchain_experimental

2. 编码

我们所用到的方法是langchain中的create_csv_agent，它可以通过agent的方式实现与csv文件的对话。

agent = create_csv_agent(OpenAI(temperature=0),"data.csv",    verbose=True,)
answer = agent.run(user_input)

这里几个参数介绍下

第一个参数是你调用的大模型，你可以指定大模型的temperature, 模型版本等参数
第二个参数是csv文件目录，可以是一个文件，也可以与多个csv文件交互（["a.csv", "b.csv"]）
第三个参数verbose，用于在log中展示大模型在其中都做了哪些操作
还有未设置的第四个参数agent_type，可以设置为AgentType.ZERO_SHOT_REACT_DESCRIPTION 或 AgentType.OPENAI_FUNCTIONS，当然你也可以像我一样默认即可

执行的话也仅需一行代码，agent.run(user_input)，其中user_input是你输入的问句。

3. 运行效果

在看运行效果之前，我们看一下两类csv文件

3.1 FAQ类

FAQ类文件主要包含常见的问答对数据，在企业售前、售后等客服等场景中经常会碰到，此处我们选择一个网站的业务助手。

针对以上文件，我们看下提问的效果

可以看到理解问题并给出了正确答案，其中的原理就是大模型agent对任务的拆解，以及对拆解后的子任务的思考（Thought）、行动（Action）以及输入（Input）得到最终答案（Final Answer）。

大模型agent的推理过程如下：

3.2 数据记录类

这类数据通常来自于生产系统、关系型数据库，记录日常行为操作等信息，此处我们选择某省水利测站对时段降水量的记录数据。

针对以上文件，看下提问的回答效果。

可以看到效果还不错，但是实际很多问题回答的并不好，原因在于我们用的是通用大模型，并且没有做任何的优化，但是基于这个思路，可以给到我们很多启发，尤其是大模型如何对用户的问题，进行思考理解、推理拆解，并调用Pandas DataFrame agent和Python agent的过程。

以下是针对每个问题，大模型agent的推理过程。

有兴趣的可以放大图片查看，或者联系作者进一步交流沟通，后续针对agent会专门写一篇文章。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

Agent生态碎片化终结，.agents/skills统一所有工具

2026-01-29

自建一个 Agent 很难吗？一语道破，万语难明

2026-01-28

全球首个Skills Vibe Agents，AtomStorm技术揭秘：我是怎么用Context Engineering让Agent不"变傻"的

2026-01-22

Deepagents落地场景来了：用openwork实现专属办公小管家

2026-01-05

快速上手：LangChain + AgentRun 浏览器沙箱极简集成指南

2026-01-05

为什么大模型企业都在强调可以连续工作XX小时的Agent和模型？长时运行Agent解析（Long-Running Agents）

2025-12-29

单agent落幕，双agent才能解决复杂问题！附LangGraph+Milvus实操

2025-12-28

为什么说LangGraph是企业级AI智能体的「终极答案」？

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

文档审核Agent2.0系统落地方案：LangChain1.1+MinerU

2025-12-21

LangChain、Dify、n8n、Coze框架对比

2025-12-21

LangChain 最新agent框架deepagents测评：长任务友好，高可控

2025-11-25

让AI智能体拥有像人类的持久记忆：基于LangGraph的长短期记忆管理实践指南

2025-12-08

LangChain 1.0 入门实战教学

2025-11-08

LangChain 1.0 变革

2025-11-18

LangGraph vs. Agno-AGI：新一代AI智能体框架的全方位深度解析

2025-11-07

被 LangChain 全家桶搞晕了？LangGraph、LangSmith、LangFlow 一文读懂

2025-11-25

LangChain v1.0 模型选型：静态还是动态？一文看懂 Agent 的正确打开方式

2025-11-19

为什么大模型企业都在强调可以连续工作XX小时的Agent和模型？长时运行Agent解析（Long-Running Agents）

2026-01-05

大家都在问

不再搞Chain 设计的LangChain 1.0，与LangGraph有哪些区别？

2025-11-03

为什么我们选择 LangGraph 作为智能体系统的技术底座？

2025-10-29

LangChain创始人：如何让AI智能体（Agent）跑得更快？

2025-07-14

“你问我答”，LangChain 是怎么帮 AI 变聪明的？

2025-07-13

一文看懂 LangChain：为什么火？核心模块都干啥？

2025-07-05

LangChain的OpenAI和ChatOpenAI，到底应该调用哪个？

2025-06-26

【LangChain 团队重磅实测报告】多智能体架构揭秘：谁才是性能之王？

2025-06-13

首个落地案例！WEBTOON 用 LangGraph 构建故事理解 Agent，创作者 AI 时代的范式来了？

2025-05-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部