提取出 Word 文档里的图片 并利用 python 批量转换格式

简介: 日常工作中,你是否遇到过这样的场景,领导发来一份 Word 文档,要求你将文档中的图片存储到一个文件夹内,并且还要将图片都改成 .jpg 或者 .png,你会怎么办?你是不是一边内心崩溃,一边开始一张张的 另存为。今天,庭云教你两招省时省力的方法,不管文档中有几张甚到几百张图片,你都可以快速保存下来。

一、分析


图片在文档的应用已经是十分普遍的现象了,在 Word 文档中插入合适的图片无疑会让我们的文档变得更美观。


先来回想一下,我们平常是如何在Word中插入图片的?


  • 在本地电脑中事先存储好需要的图片素材,然后插入到Word中


  • 使用复制、截图等方法将图片粘贴到 Word 中


其实,第二种方法有一个弊端在于图片只存在 Word 中,如果我们需要将它们保存到本地电脑中以供日后使用,最常用的方法是单击鼠标右键,选择 另存为图片,然后选择路径进行保存。



这种方法在只需要处理少数几张图片时还算适用,一旦图片数量增多,处理工作就会变得繁琐且容易出错。


那么,我们怎样可以将这些图片批量保存呢?


二、提取出 Word 文档里的图片


解决方法就是:更改文件格式,直接将 Word 文档的后缀名改成 .rar ( .zip 也是可以的)的压缩格式。打开压缩文件,点击【word】-【media】,文档中使用的图片就出现在这里,只需要选中解压出来即可。


用于测试的 Word 文档如下:


操作方法如下:


点击查看,选择详细信息,勾上文件扩展名。



直接将 Word 文档的后缀名改成 .rar ( .zip 也是可以的)的压缩格式。打开压缩文件,点击【word】-【media】,文档中使用的图片就出现在这里,只需要选中解压出来即可。


三、利用 python 批量转换格式


# -*- coding: UTF-8 -*-"""@File    :test_01.py@Author  :叶庭云@CSDN    :https://yetingyun.blog.csdn.net/"""# 导入os模块importos# 不存在jpg图片这个文件夹  就创建ifnotos.path.exists('jpg图片'):
os.mkdir('jpg图片')
path=r'.\jpg图片'# 列出 media 文件夹下所有图片files=os.listdir(r'.\media')
foriteminfiles:
# 拼接出 media 文件夹下所有图片路径file_1='.\media'+'/'+item# 读取图片数据withopen(file_1, 'rb') asf:
con=f.read()
# 重新写入  以 .jpg 格式 并保存到jpg图片文件夹file_name=path+'/'+item.split('.')[0] +'.jpg'withopen(file_name, 'wb') asf:
f.write(con)


运行效果如下:


程序运行,嗖的一下,图片格式都转换成了 .jpg 并保存到新的文件夹里。

目录
相关文章
|
1月前
|
数据采集 Python
Python实用记录(七):通过retinaface对CASIA-WebFace人脸数据集进行清洗,并把错误图路径放入txt文档
使用RetinaFace模型对CASIA-WebFace人脸数据集进行清洗,并将无法检测到人脸的图片路径记录到txt文档中。
40 1
|
1月前
|
Python
Python实用记录(六):如何打开txt文档并删除指定绝对路径下图片
这篇文章介绍了如何使用Python打开txt文档,删除文档中指定路径的图片,并提供了一段示例代码来展示这一过程。
28 1
|
14天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
1月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
50 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
1月前
|
计算机视觉 Python
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
这篇文章介绍了如何使用Python的OpenCV库将多张图片合并为一张图片显示,以及如何使用matplotlib库从不同txt文档中读取数据并绘制多条折线图。
42 3
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
|
1月前
|
人工智能 开发者 Python
python读取word文档 | AI应用开发
在RAG系统中,构建知识库时需读取多种外部文档,其中Word文档较为常见。本文介绍如何使用`python-docx`库读取Word文档(.docx格式)中的标题、段落、表格和图片等内容。首先通过`pip install python-docx`安装库,然后利用提供的接口提取所需信息。尽管该库功能强大,但在识别标题样式时需自定义逻辑,并且仅提供图片的URI而非直接加载。示例代码展示了读取文本、识别标题、读取表格及获取图片URI的方法。【10月更文挑战第2天】
75 2
|
1月前
|
PyTorch 算法框架/工具 数据格式
Python实用记录(八):不同格式之间的转换
本文介绍了Python中不同数据格式之间的转换方法,包括numpy数组与列表、字符串之间的转换,以及PyTorch张量与numpy数组之间的转换。
15 0
|
1月前
|
IDE 开发工具 Python
Python自动化操作word--批量替换word文档中的文字
Python自动化操作word--批量替换word文档中的文字
|
6月前
|
数据安全/隐私保护 Python
Python3给图片添加水印
Python3给图片添加水印
97 1
|
数据采集 分布式计算 搜索推荐
使用Python实现网页中图片的批量下载和水印添加保存
使用Python实现网页中图片的批量下载和水印添加保存