我要投稿

AI编程实例：5分钟从excel提取500张图片

发布日期：2026-01-03 08:36:18 浏览次数： 1998

作者：陆洪

微信搜一搜，关注“陆洪”

只是想和大家分享如何借助AI编程工具，解决工作或生活中遇到的实际问题。

在开始之前，先对上一篇内容稍作补充。上一篇提到AI正在推动生产力提升，但这一点很多人尚未完全意识到。其实生产力的提升是一个渐进的过程。回顾办公室信息化的发展：从MRP加速ERP系统的普及，到CRM、OA、HR等系统相继出现，这些系统把很多办公人员的工作界面，从一张张A4纸转移到了电脑软件窗口里——窗口变多了，层次也更连续了。后来，飞书、钉钉、企业微信等工具进一步整合了沟通、流程、文档与目标管理，使得工作窗口的维度更大，但信息密度也急剧增加。

那么来到AI时代，那个终极的“生产力操作窗口”会是什么？为什么无论是OpenAI、Google、Anthropic这类模型公司，还是Manus、Lovart等AI创业公司，都在全力开发和打造自己的客户端环境？说得直白一些，这其实也是在争夺入口、抢占用户的心智。这个AI生产力操作环境，就包括之前提到过的Claude Code、Codex、Codebuddy、Gemini Cli等编程辅助工具，以及Cursor、Antigravity这类专为编程设计的工具，还有Ok Computer、Google AI Studio等集成开发环境。

这个窗口跟以往的窗口有很大的变化，原来ERP、飞书等，是提供了工具环境，很多功能，很多按钮，很多表格，本质还是人去操作。但今天的AI窗口，操作者变成了AI，人在这个窗口是提供微决策，这点很重要，因此，所有这些AI公司的新型操作窗口，交互方式都普遍回归到命令对话的形式，这是大家要去适应的地方。

回到今天的主题，我想通过一个实际案例，展示如何使用上面提到的Antigravity工具，在5分钟内从Excel中提取500张图片到指定文件夹。

场景是这样的：业务方发来一个50MB的Excel文件，需要我们将其中的信息上传到CRM系统。文件中有一列是图片，业务方已经整理好了，共500多张。如果一张张下载再一张张上传，效率太低，也容易出错。所以我们的第一反应是什么？当然是“AI优先”——必须用AI来完成图片提取。恰好我们了解到之前研发同事开发过一个小工具，可以批量上传图片，但前提是图片的文件名必须与产品编号一致。

于是，需求明确为：用AI从Excel中提取所有图片，每张保存到电脑，并以对应的产品编号命名。我们首先准备好Excel文件和存放图片的文件夹，接下来就可以开始操作了。

我们尝试用豆包来解决（实际工作中，我们没有尝试豆包，而是直接用antigravity来解决，用豆包来演示，不代表对豆包的否认，只是在这个窗口环境下，完成这样的任务确实不太好）

在豆包上传文件，给一段提示词：

有一个数据处理的任务，要求：将1.xlsx B列的图片保存在文件夹pic里，保存时，图片的文件名称以A列的代码命名。如果你理解我的需求，请说明，然后开始干活，有问题随时问。

然后豆包开始生成代码，他很努力，只是等待时间很长。

豆包的逻辑是我给你代码，你自己找个环境运行代码完成工作，这显然不是我们要的结果。

我们回到antigravity，这是由google开发的AI编程工具，不管这个工具的情况，完成工作再说。

打开antigravity，打开文件夹，在命令窗口输入提示词，还是上面那句：

然后他开始干活，不得不说，他非常卖力，而且想得周全，他问了我：

文件位置
:
```
1.xlsx
```
文件在哪个目录下?是在当前工作区
```
/Users/DeepAI/Documents/ql
```
中吗?
图片格式
: B 列中的图片是什么格式(PNG, JPG等)?还是格式不统一?
pic 文件夹位置
:
```
pic
```
文件夹应该创建在哪里?与
```
1.xlsx
```
同级目录吗?
重复代码处理
: 如果 A 列有重复的代码,应该如何处理?覆盖还是添加序号?

我给了他进一步的信息：

1.xlsx在当前文件夹
图片格式：保持图片原格式，如果不确定，请使用PNG格式
pic在当前文件夹
如果有重复，添加序号

得到确认信息后，他开始构建了一个python文件，并开始自己执行、处理，将图片保存在了pic文件夹里。

图片静静地躺在文件夹里，打包将图片发给研发上传，完毕，good job！

至此，任务完成，整个过程非常快，一次完成，快的都有点不像例子，其实说5分钟都有点夸张，真的细思极恐，而且这个事情，任何人都可以完成，有一定的门槛，但不高，稍微看看，必能掌握。

全文完，有感兴趣的朋友可以继续往下看AI是如何工作的：

看看antigravity完成该任务的报告

Excel 图片提取任务完成报告

任务概述

成功从 1.xlsx文件中提取 B 列的图片,并使用 A 列的代码作为文件名保存到 pic 文件夹中。

执行步骤

1. 环境准备

确认 1.xlsx文件位于 /Users/DeepAI/Documents/ql 目录
确认 pic 文件夹已存在
安装必要的 Python 库 openpyxl

2. 脚本开发

创建了 extract_images.py脚本,实现以下功能:

读取 Excel 文件中的 A 列代码
提取 B 列中的图片
自动识别图片格式(PNG/JPEG等)
使用 A 列代码作为文件名
处理重复代码(添加序号后缀)

3. 执行结果

✅ 成功提取 481 张图片

图片格式分布

PNG 格式: 478 张

JPEG 格式: 3 张 (x.xx.xx.0041, x.xx.xx.0042, x.xx.xx.0043)

文件命名示例

x.xx.xx.0086.png

x.xx.xx.0087.png

x.xx.xx.3968.png

x.xx.xx.1281.png

x.xx.xx.0041.jpeg

4. 验证检查

# 文件总数

$ ls pic | wc -l

481

# 文件大小示例

$ ls -lh pic | head -10

-rw-r--r-- 682K x.xx.xx.0086.png

-rw-r--r-- 642K x.xx.xx.0087.png

-rw-r--r-- 6.3K x.xx.xx.3968.png

-rw-r--r-- 120K x.xx.xx.4068.png

技术实现

核心技术

openpyxl: 用于读取 Excel 文件和提取嵌入图片
图片格式识别: 通过文件头字节自动识别图片格式
重复处理: 使用计数器为重复代码添加序号

关键代码逻辑

加载 Excel 工作簿
读取 A 列所有代码并建立行号映射
遍历工作表中的所有图片对象
根据图片位置(锚点)确定所在行和列
匹配 B 列图片与对应的 A 列代码
保存图片并处理文件名冲突

任务完成状态

读取 Excel 文件
提取 B 列图片
使用 A 列代码命名
保存到 pic 文件夹
保持原始图片格式
处理重复代码(添加序号)
验证提取结果

输出位置

所有图片已保存至: /Users/DeepAI/Documents/ql/pic/

提取脚本位置:

extract_images.py

该文件的源码公布，其实没什么鸟用，你根本不需要看懂。

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

"""

从 Excel 文件中提取图片并按照指定规则保存

"""

importos

fromopenpyxlimportload_workbook

fromopenpyxl.drawing.imageimport Image asOpenpyxlImage

fromcollectionsimportdefaultdict

defextract_images_from_excel(excel_path, output_dir):

"""

从 Excel 文件中提取图片

Args:

excel_path: Excel 文件路径

output_dir: 输出目录

"""

# 确保输出目录存在

os.makedirs(output_dir, exist_ok=True)

# 加载工作簿

print(f"正在加载 Excel 文件: {excel_path}")

wb=load_workbook(excel_path)

ws=wb.active

# 读取 A 列的代码

print("正在读取 A 列代码...")

codes= {}

forrowinrange(1, ws.max_row+1):

cell_value=ws.cell(row=row, column=1).value

ifcell_value:

codes[row] =str(cell_value).strip()

print(f"找到 {len(codes)} 个代码")

# 用于跟踪重复的文件名

filename_counter=defaultdict(int)

# 提取图片

print("正在提取图片...")

saved_count=0

# 检查工作表中的图片

ifhasattr(ws, '_images') andws._images:

forimginws._images:

# 获取图片所在的行

# openpyxl 中图片的 anchor 属性包含位置信息

ifhasattr(img, 'anchor') andhasattr(img.anchor, '_from'):

row=img.anchor._from.row+1# openpyxl 使用 0-based index

col=img.anchor._from.col+1

# 检查是否在 B 列 (column 2)

ifcol==2androwincodes:

code=codes[row]

# 获取图片格式

img_format='png'# 默认格式

ifhasattr(img, 'format'):

img_format=img.format.lower()

elifhasattr(img, '_data'):

# 尝试从图片数据判断格式

data=img._data()

ifdata[:4] ==b'\x89PNG':

img_format='png'

elifdata[:2] ==b'\xff\xd8':

img_format='jpg'

elifdata[:2] ==b'BM':

img_format='bmp'

elifdata[:4] ==b'GIF8':

img_format='gif'

# 处理重复文件名

base_filename=f"{code}.{img_format}"

filename_counter[code] +=1

iffilename_counter[code] >1:

filename=f"{code}_{filename_counter[code]}.{img_format}"

else:

filename=base_filename

# 保存图片

output_path=os.path.join(output_dir, filename)

try:

# 保存图片数据

withopen(output_path, 'wb') as f:

f.write(img._data())

print(f"已保存: {filename} (行 {row}, 代码: {code})")

saved_count+=1

exceptExceptionase:

print(f"保存图片失败 {filename}: {e}")

print(f"\n完成! 共保存 {saved_count} 张图片到 {output_dir}")

wb.close()

if __name__ =="__main__":

# 设置路径

excel_file="1.xlsx"

output_directory="pic"

# 执行提取

try:

extract_images_from_excel(excel_file, output_directory)

exceptExceptionase:

print(f"错误: {e}")

importtraceback

traceback.print_exc()

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-07

十年老技术开发的 AI Agent 探索之路

2026-04-25

OpenAI 出圈的「AI 屏幕记忆」，我找到了关于它的最佳答案

2026-04-22

别只盯落地场景了，这5个AI价值模型才是关键！

2026-04-16

从聊天窗口到多 Agent 控制台：一次 AI 编程协作范式的转移

2026-04-14

为什么要构建个人知识体系？

2026-04-09

办公Agent的CI/CD时刻到来了

2026-03-27

Claude Code的产品经理，把她用AI重构工作流的方式全说了！

2026-03-26

每天花 4 小时，我养了一支“龙虾”团队｜开发者说

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我分析了 1000 个 skills，这是最推荐的 30 个

2026-02-24

Obsidian 1.12 正式发布！官方 CLI 命令行工具上线，你的知识库从此可编程、可自动化

2026-02-28

微信PC版上线语音输入，AI 时代再造留存神话

2026-02-15

Claude code 产品经理Cat Wu亲述：我是如何用AI彻底重构PM工作流的

2026-03-21

开源两天斩获 1.8K Star！把网站变成命令行工具，支持国内外主流平台！

2026-03-19

比 iTerm2 更好的 Claude Code 终端

2026-02-19

开源免费！这个浏览器插件真香！AI重度用户必看，Gemini 用户必用

2026-02-19

阿里桌面Agent QoderWork全面开放！人人可用的智能体来了

2026-03-03

后悔没早用！AstrBot让我的微信变成最强AI助手

2026-02-23

实测腾讯QClaw：微信找到了和“龙虾”共存的方式

2026-03-10

大家都在问

为什么要构建个人知识体系？

2026-04-14

Coding Agent 的最终形态是 TUI + GUI 吗？

2026-02-04

谁来给桌面 Agent 的转正签字？

2026-01-21

AI 正在稀释「专家」，什么才是你的新护城河？

2026-01-18

Notion CEO发布AI年度思考笔记，发布1天，200万人围观，AI职场人的黄金时代刚刚开始？

2025-12-25

有了 NotebookLM 后，还需要 Obsidian 吗？

2025-12-10

谁是中国 AI 创新的第一公里？

2025-12-09

千问 APP 再更新：为什么说「聊天」并不是 AI 产品的终点？

2025-12-04

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw