小白学Python:提取Word中的所有图片,只需要1行代码

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 小白学Python:提取Word中的所有图片,只需要1行代码

大家好,这里是程序员晚枫,全网同名。

最近在小破站账号:Python自动化办公社区更新一套课程:给小白的《50讲Python自动化办公》

在课程群里,看到学员自己开发了一个功能:从word里提取图片。这个功能非常实用。

我在征求开发者:王鹏大哥的同意后,把这行代码集成到了python-office这个库里,实现了1行代码,调用这个功能~

下面我们一起来学习一下,更多自动化办公的功能,大家可以在百度搜索:python-office,进行查看~

代码演示

现在我们有1个Word文档,里面有N个图片,我们如何把这些图片自动化的提取出来呢?

可以使用本文的代码,该功能已经集成到python-office这个库里了,下载命令:

pip install python-office -U

1行代码,提取Word中图片的使用方式如下:

import office

office.word.docx4imgs(word_path=r'./程序员晚枫的文档.docx', img_path='./python-office/out')

该方法需要填写2个参数:

  • word_path:需要提取图片的word路径
  • img_path:保存图片的文件夹位置,程序会自动在指定位置,用word文件的名称创建一个子文件夹

大家在使用代码时有任何问题,欢迎在评论区和我交流~

相关文章
|
2月前
|
XML 关系型数据库 MySQL
python将word(doc或docx)的内容导入mysql数据库
用python先把doc文件转换成docx文件(这一步也可以不要后续会说明),然后读取docx的文件并另存为htm格式的文件(上一步可以直接把doc文件另存为htm),python根据bs4获取p标签里的内容,如果段落中有图片则保存图片。(图片在word文档中的位置可以很好的还原到生成的数据库内容) 我见网上有把docx压缩后解压获取图片的,然后根据在根据xml来读取图片的位置,我觉得比较繁琐。用docx模块读取段落的时候还需要是不是判断段落中有分页等,然而转成htm之后就不用判断那么多直接判断段落里的样式或者图片等就可以了。
31 1
|
2月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
108 0
|
2月前
|
存储 移动开发 算法
Python怎么将图片转换成base64编码
Python怎么将图片转换成base64编码
29 0
|
4天前
|
Python
python代码根据点坐标裁切图片
【4月更文挑战第19天】python代码根据点坐标裁切图片
12 2
|
13天前
|
机器学习/深度学习 算法 自动驾驶
opencv python 图片叠加
【4月更文挑战第17天】
|
15天前
|
BI 开发者 数据格式
Python代码填充数据到word模板中
【4月更文挑战第16天】
|
2月前
|
Python
Python教程:如何向Word中添加表格
Microsoft Word是一种流行的文档处理软件,广泛用于创建各种类型的文档,包括报告、简历、手册等。Python提供了许多库来处理Microsoft Word文档,其中包括`python-docx`,它使我们能够轻松地创建、修改和操作Word文档。本文将介绍如何使用Python的`python-docx`库向Word文档中添加表格。
20 0
|
2月前
|
文字识别 数据挖掘 网络安全
Python实现avif图片转jpg格式并识别图片中的文字
在做数据分析的时候有些数据是从图片上去获取的,这就需要去识别图片上的文字。Python有很多库可以很方便的实现OCR识别图片中的文字。这里介绍用EasyOCR库进行图片文字识别。easyocr是一个比较流行的库,支持超过80种语言,识别率高,速度也比较快。
30 2
|
2月前
|
XML 存储 算法
使用Python的zipfile模块巧解Word批量生成问题
使用Python的zipfile模块巧解Word批量生成问题
20 0
|
2月前
|
安全 API 数据安全/隐私保护
使用Python操纵Word自动编写离职报告
使用Python操纵Word自动编写离职报告
24 0