微信扫码
添加专属顾问
我要投稿
掌握Playwright自动化测试,轻松验证PDF内容准确性。 核心内容: 1. PDF文件在自动化测试中的重要性 2. 使用Playwright下载PDF文件的方法 3. 利用pdf-parse提取PDF内容并验证
在自动化测试中,PDF 文件的验证常常被忽视,但其重要性不容小觑。PDF 文件常用于展示发票、合同等关键信息,确保其内容准确无误对保障应用质量至关重要。本文将带你深入了解如何利用 Playwright,结合 pdf-parse 和 fs 模块,实现 PDF 内容的自动化验证。
Playwright 是一款强大的开源自动化测试工具,支持多浏览器和多平台运行。虽然它没有内置的 PDF 验证功能,但通过与其他工具配合,我们可以轻松填补这一空白。
首先,安装所需依赖:
npm install playwright fs pdf-parse
npm init playwright@latest使用 Playwright 模拟用户行为,下载 PDF 文件:
const { test, expect } = require('@playwright/test');
test('下载 PDF 文件', async ({ page }) => {
// 导航到包含 PDF 的页面
await page.goto('https://pdfobject.com/pdf/sample.pdf');
// 同时等待下载事件并触发下载
const [download] = await Promise.all([
page.waitForEvent('download'), // 监听下载事件
page.getByRole('link', { name: 'A Simple PDF File' }).click() // 点击下载链接
]);
// 保存文件到指定路径
const filePath = 'ExportData/' + download.suggestedFilename();
await download.saveAs(filePath);
});借助 pdf-parse 提取 PDF 中的文本,并保存为文本文件:
const fs = require('fs');
const pdf = require('pdf-parse');
async function extractPdfText(filePath) {
try {
// 读取 PDF 文件内容
const dataBuffer = fs.readFileSync(filePath);
// 解析 PDF 获取文本
const data = await pdf(dataBuffer);
// 将提取的文本保存到 actual.txt
fs.writeFileSync('./ExportData/actual.txt', data.text);
} catch (error) {
// 处理解析失败的情况
console.error('PDF 解析失败:', error);
}
}
// 调用函数提取文本
extractPdfText('./ExportData/sample.pdf');比较提取的文本与预期内容,确保一致性:
test('验证 PDF 内容', async () => {
// 读取预期和实际文本内容
let expected = fs.readFileSync('./ExportData/expected.txt', 'utf-8');
let actual = fs.readFileSync('./ExportData/actual.txt', 'utf-8');
// 使用 Playwright 的 expect 断言内容一致
expect(actual).toBe(expected);
});为方便理解,项目文件组织如下:
- ExportData
- actual.txt # 提取的实际文本
- expected.txt # 预期的文本
- sample.pdf # 下载的 PDF 文件
- node_modules # 依赖包
- playwright-report # 测试报告
- tests
- example.spec.js # 测试脚本
- package-lock.json
- package.json
- playwright.config.js通过本文,你掌握了在 Playwright 中实现 PDF 内容自动化验证的全过程。这一技能不仅能提升测试覆盖率,还能确保关键文档的准确性。赶快动手试试吧!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-16
YouMind:一款懂输入、思考、输出闭环的 AI 创作工具
2025-12-16
Ant Design X 重磅推出 AI 流式渲染引擎!
2025-12-16
自己都用不好自家的产品就别卖给客户丢人现眼了!
2025-12-15
NotebookLM+Nano Banana Pro:你的下一个PPT,何必是PPT?
2025-12-15
NotebookLM: 不就做个PPT,有什么难的
2025-12-15
两年前对AI影响用户研究的预测,哪些应验了,哪些被打脸
2025-12-14
左手NovelCrafter,右手Claude Code,作为码字人,我从没这么痛快过
2025-12-11
用友王文京:如何用《易经》理解AI
2025-11-04
2025-10-10
2025-09-22
2025-10-13
2025-10-20
2025-10-06
2025-09-23
2025-10-20
2025-10-19
2025-10-27
2025-12-15
2025-12-09
2025-11-17
2025-11-14
2025-11-12
2025-11-05
2025-09-11
2025-09-09