免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

AI编程实例:5分钟从excel提取500张图片

发布日期:2026-01-03 08:36:18 浏览次数: 1685
作者:陆洪

微信搜一搜,关注“陆洪”

推荐语

AI助力办公效率革命:5分钟搞定500张图片批量提取,告别重复劳动!

核心内容:
1. AI时代生产力窗口的变革:从人工操作到AI执行
2. 实战演示:使用Antigravity工具快速提取Excel图片
3. 操作技巧:命名规则与批量处理的关键要点

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
只是想和大家分享如何借助AI编程工具,解决工作或生活中遇到的实际问题。

在开始之前,先对上一篇内容稍作补充。上一篇提到AI正在推动生产力提升,但这一点很多人尚未完全意识到。其实生产力的提升是一个渐进的过程。回顾办公室信息化的发展:从MRP加速ERP系统的普及,到CRM、OA、HR等系统相继出现,这些系统把很多办公人员的工作界面,从一张张A4纸转移到了电脑软件窗口里——窗口变多了,层次也更连续了。后来,飞书、钉钉、企业微信等工具进一步整合了沟通、流程、文档与目标管理,使得工作窗口的维度更大,但信息密度也急剧增加。

那么来到AI时代,那个终极的“生产力操作窗口”会是什么?为什么无论是OpenAI、Google、Anthropic这类模型公司,还是Manus、Lovart等AI创业公司,都在全力开发和打造自己的客户端环境?说得直白一些,这其实也是在争夺入口、抢占用户的心智。这个AI生产力操作环境,就包括之前提到过的Claude Code、Codex、Codebuddy、Gemini Cli等编程辅助工具,以及Cursor、Antigravity这类专为编程设计的工具,还有Ok Computer、Google AI Studio等集成开发环境。

这个窗口跟以往的窗口有很大的变化,原来ERP、飞书等,是提供了工具环境,很多功能,很多按钮,很多表格,本质还是人去操作。但今天的AI窗口,操作者变成了AI,人在这个窗口是提供微决策,这点很重要,因此,所有这些AI公司的新型操作窗口,交互方式都普遍回归到命令对话的形式,这是大家要去适应的地方。
回到今天的主题,我想通过一个实际案例,展示如何使用上面提到的Antigravity工具,在5分钟内从Excel中提取500张图片到指定文件夹
场景是这样的:业务方发来一个50MB的Excel文件,需要我们将其中的信息上传到CRM系统。文件中有一列是图片,业务方已经整理好了,共500多张。如果一张张下载再一张张上传,效率太低,也容易出错。所以我们的第一反应是什么?当然是“AI优先”——必须用AI来完成图片提取。恰好我们了解到之前研发同事开发过一个小工具,可以批量上传图片,但前提是图片的文件名必须与产品编号一致
于是,需求明确为:用AI从Excel中提取所有图片,每张保存到电脑,并以对应的产品编号命名。我们首先准备好Excel文件和存放图片的文件夹,接下来就可以开始操作了
我们尝试用豆包来解决(实际工作中,我们没有尝试豆包,而是直接用antigravity来解决,用豆包来演示,不代表对豆包的否认,只是在这个窗口环境下,完成这样的任务确实不太好)
在豆包上传文件,给一段提示词:
有一个数据处理的任务,要求:将1.xlsx B列的图片保存在文件夹pic里,保存时,图片的文件名称以A列的代码命名。如果你理解我的需求,请说明,然后开始干活,有问题随时问。
然后豆包开始生成代码,他很努力,只是等待时间很长。

豆包的逻辑是我给你代码,你自己找个环境运行代码完成工作,这显然不是我们要的结果。
我们回到antigravity,这是由google开发的AI编程工具,不管这个工具的情况,完成工作再说。
打开antigravity,打开文件夹,在命令窗口输入提示词,还是上面那句:
有一个数据处理的任务,要求:将1.xlsx B列的图片保存在文件夹pic里,保存时,图片的文件名称以A列的代码命名。如果你理解我的需求,请说明,然后开始干活,有问题随时问。
然后他开始干活,不得不说,他非常卖力,而且想得周全,他问了我:
  1. 文件位置
    1.xlsx
     文件在哪个目录下?是在当前工作区 
    /Users/DeepAI/Documents/ql
     中吗?
  2. 图片格式
    : B 列中的图片是什么格式(PNG, JPG等)?还是格式不统一?
  3. pic 文件夹位置
    pic
     文件夹应该创建在哪里?与 
    1.xlsx
     同级目录吗?
  4. 重复代码处理
    : 如果 A 列有重复的代码,应该如何处理?覆盖还是添加序号?
我给了他进一步的信息:
  1. 1.xlsx在当前文件夹
  2. 图片格式:保持图片原格式,如果不确定,请使用PNG格式
  3. pic在当前文件夹
  4. 如果有重复,添加序号

得到确认信息后,他开始构建了一个python文件,并开始自己执行、处理,将图片保存在了pic文件夹里。
图片静静地躺在文件夹里,打包将图片发给研发上传,完毕,good job!
至此,任务完成,整个过程非常快,一次完成,快的都有点不像例子,其实说5分钟都有点夸张,真的细思极恐,而且这个事情,任何人都可以完成,有一定的门槛,但不高,稍微看看,必能掌握。
全文完,有感兴趣的朋友可以继续往下看AI是如何工作的:
看看antigravity完成该任务的报告

Excel 图片提取任务完成报告

任务概述

成功从 1.xlsx文件中提取 B 列的图片,并使用 A 列的代码作为文件名保存到 pic 文件夹中。

执行步骤

1. 环境准备

  • 确认 1.xlsx文件位于 /Users/DeepAI/Documents/ql 目录

  • 确认 pic 文件夹已存在

  • 安装必要的 Python 库 openpyxl

2. 脚本开发

创建了 extract_images.py脚本,实现以下功能:

  • 读取 Excel 文件中的 A 列代码

  • 提取 B 列中的图片

  • 自动识别图片格式(PNG/JPEG等)

  • 使用 A 列代码作为文件名

  • 处理重复代码(添加序号后缀)

3. 执行结果

✅ 成功提取 481 张图片

图片格式分布

PNG 格式: 478 张

JPEG 格式: 3 张 (x.xx.xx.0041, x.xx.xx.0042, x.xx.xx.0043)

文件命名示例

x.xx.xx.0086.png

x.xx.xx.0087.png

x.xx.xx.3968.png

x.xx.xx.1281.png

x.xx.xx.0041.jpeg

4. 验证检查

# 文件总数

$ ls pic | wc -l

481

# 文件大小示例

$ ls -lh pic | head -10

-rw-r--r--  682K  x.xx.xx.0086.png

-rw-r--r--  642K  x.xx.xx.0087.png

-rw-r--r--  6.3K  x.xx.xx.3968.png

-rw-r--r--  120K  x.xx.xx.4068.png

技术实现

核心技术

  • openpyxl: 用于读取 Excel 文件和提取嵌入图片

  • 图片格式识别: 通过文件头字节自动识别图片格式

  • 重复处理: 使用计数器为重复代码添加序号


关键代码逻辑

  1. 加载 Excel 工作簿

  2. 读取 A 列所有代码并建立行号映射

  3. 遍历工作表中的所有图片对象

  4. 根据图片位置(锚点)确定所在行和列

  5. 匹配 B 列图片与对应的 A 列代码

  6. 保存图片并处理文件名冲突


任务完成状态

  •  读取 Excel 文件

  •  提取 B 列图片

  •  使用 A 列代码命名

  •  保存到 pic 文件夹

  •  保持原始图片格式

  •  处理重复代码(添加序号)

  •  验证提取结果


输出位置

所有图片已保存至: /Users/DeepAI/Documents/ql/pic/

提取脚本位置: 

extract_images.py

该文件的源码公布,其实没什么鸟用,你根本不需要看懂。

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

"""

从 Excel 文件中提取图片并按照指定规则保存

"""


importos

fromopenpyxlimportload_workbook

fromopenpyxl.drawing.imageimport Image asOpenpyxlImage

fromcollectionsimportdefaultdict



defextract_images_from_excel(excel_path, output_dir):

"""

    从 Excel 文件中提取图片

    Args:

        excel_path: Excel 文件路径

        output_dir: 输出目录

    """

# 确保输出目录存在

os.makedirs(output_dir, exist_ok=True)

# 加载工作簿

print(f"正在加载 Excel 文件: {excel_path}")

wb=load_workbook(excel_path)

ws=wb.active

# 读取 A 列的代码

print("正在读取 A 列代码...")

codes= {}

forrowinrange(1ws.max_row+1):

cell_value=ws.cell(row=row, column=1).value

ifcell_value:

codes[row=str(cell_value).strip()

print(f"找到 {len(codes)} 个代码")

# 用于跟踪重复的文件名

filename_counter=defaultdict(int)

# 提取图片

print("正在提取图片...")

saved_count=0

# 检查工作表中的图片

ifhasattr(ws'_images'andws._images:

forimginws._images:

# 获取图片所在的行

# openpyxl 中图片的 anchor 属性包含位置信息

ifhasattr(img'anchor'andhasattr(img.anchor'_from'):

row=img.anchor._from.row+1# openpyxl 使用 0-based index

col=img.anchor._from.col+1

# 检查是否在 B 列 (column 2)

ifcol==2androwincodes:

code=codes[row]

# 获取图片格式

img_format='png'# 默认格式

ifhasattr(img'format'):

img_format=img.format.lower()

elifhasattr(img'_data'):

# 尝试从图片数据判断格式

data=img._data()

ifdata[:4==b'\x89PNG':

img_format='png'

elifdata[:2==b'\xff\xd8':

img_format='jpg'

elifdata[:2==b'BM':

img_format='bmp'

elifdata[:4==b'GIF8':

img_format='gif'

# 处理重复文件名

base_filename=f"{code}.{img_format}"

filename_counter[code+=1

iffilename_counter[code>1:

filename=f"{code}_{filename_counter[code]}.{img_format}"

else:

filename=base_filename

# 保存图片

output_path=os.path.join(output_dir, filename)

try:

# 保存图片数据

withopen(output_path'wb'as f:

                            f.write(img._data())

print(f"已保存: {filename} (行 {row}, 代码: {code})")

saved_count+=1

exceptExceptionase:

print(f"保存图片失败 {filename}{e}")

print(f"\n完成! 共保存 {saved_count} 张图片到 {output_dir}")

wb.close()



if __name__ =="__main__":

# 设置路径

excel_file="1.xlsx"

output_directory="pic"

# 执行提取

try:

extract_images_from_excel(excel_fileoutput_directory)

exceptExceptionase:

print(f"错误: {e}")

importtraceback

traceback.print_exc()

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询