Python3，2行代码，多种方法，直接把网页内容转换成PDF文档和图片。-阿里云开发者社区

Python3，2行代码，多种方法，直接把网页内容转换成PDF文档和图片。

2023-09-27 672

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python3，2行代码，多种方法，直接把网页内容转换成PDF文档和图片。

1、引言

小鱼：小屌丝，你这是干啥呢？

小屌丝：我的女神想要这个网页的内容。

小鱼：那你也不能这一点点的复制粘贴啊，

小屌丝：为了我的女神，再辛苦我都愿意…

小鱼：咱能不能man一点，你直接把网页内容爬下来不就完事了，

小屌丝：我的女神还要把这些内容转换成PDF，

小鱼：你的女神事可真多…

小屌丝：鱼哥，你有什么好的法子吗？

小鱼：嗯，办法嘛，确实有

小屌丝：我懂。

2、代码实战

关于网页的内容转换成PDF，通常思路：

爬取网页内容
保存到本地
转换成PDF文档

这种方法，确实可以实现，但是，很麻烦，需要转两次。

而今天，小鱼给大家分享的方法，就3行代码，一次搞定。

2.1 模块介绍

2.1.1 pdfkit

pdfkit 是把 HTML+CSS 格式的文件转换成 PDF 的一种工具，它是 wkhtmltopdf 这个工具包的 python 封装。

2.2 安装

pip install pdfkit

其它安装方式，直接看这两篇:

《Python3，选择Python自动安装第三方库，从此跟pip说拜拜！！》

《Python3：我低调的只用一行代码，就导入Python所有库！》

敲黑板：

pdfkit 是基于 wkhtmltopdf 的封装，所以需要先安装 wkhtmltopdf 。

wkhtmltopdf官网：https://wkhtmltopdf.org/

2.3 代码实例

2.3.1 URL 对应网页转 PDF

代码示例：

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJ
import pdfkit
'URL 对应网页转 PDF'
#wkhtmltopdf.exe 为本地安装的路径
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_url参数，转换PDF
pdfkit.from_url(r'https://blog.csdn.net/wuyoudeyuer?type=blog', 'Carl_奕然.pdf', configuration=config)

运行结果：

2.3.2 HTML 文件转 PDF

代码示例：

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJ
import pdfkit
'HTML 文件转 PDF'
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_file参数，转换PDF
pdfkit.from_file(r'D:\Carl_奕然的博客.html, 'Carl_奕然.pdf', configuration=config)

敲黑板

读取html，需要调用pdfkit.from_file 参数。

2.3.3 字符串转 PDF

代码示例：

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJ
import pdfkit
'字符串转 PDF'
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_file参数，转换PDF
pdfkit.from_string(r'Ilike wangxinling, 'Carl_奕然.pdf', configuration=config)

运行结果

2.4 拓展

小屌丝：鱼哥，如果我不想写代码，能不能一键转换成PDF呢？

小鱼：嗯，这个可以实现，但是不能一键，必须一行代码。

小屌丝：也行，能少些一行是一行。

2.4.1 网页转换PDF

开篇小鱼也说过：pdfkit 是基于 wkhtmltopdf 的封装，所以功能肯定也是基于 wkhtmltopdf 的。

于是乎，我们就能先到，直接用wkhtmltopdf 的功能，看看能否实现PDF转换。

代码示例

第一步、找到wkhtmltopdf的安装路径，以小鱼的为例：
D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe
第二步、powershell打开，输入命令
.\wkhtmltopdf.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.pdf

运行结果

解析

.\wkhtmltopdf.exe ：调用wkhtmltopdf.exe
https://blog.csdn.net/wuyoudeyuer?type=blog：url地址
D:\carl.pdf：保存的路径

2.4.2 网页转换图片

代码示例

我们来试一下网页转换图片，

同样，

第一步、打开powershell，进入到bin文件夹下

第二步、输入命令：.\wkhtmltoimage.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.png

运行结果

3、总结

今天的分享，就到这里了。

是不是奇奇怪怪的姿势，又增加了呢。

我们总结一下今天的内容：

pdfkit 可以可以实现的转换：

·URL 对应网页转 PDF

·html文件转 PDF

·字符串转 PDF

wkhtmltopdf.exe可以实现的转换：

·网页转图片

·网页转 PDF

所以，学会了这个第三方库，就实现了直接转换成PDF的方法。

最后，

关注小鱼博客，带你学习更多关于python第三方库的知识。

Python3，2行代码，多种方法，直接把网页内容转换成PDF文档和图片。

1、引言

2、代码实战

2.1 模块介绍

2.1.1 pdfkit

2.2 安装

2.3 代码实例

2.3.1 URL 对应网页转 PDF

2.3.2 HTML 文件转 PDF

2.3.3 字符串转 PDF

2.4 拓展

2.4.1 网页转换PDF

2.4.2 网页转换图片

3、总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python3，2行代码，多种方法，直接把网页内容转换成PDF文档和图片。

1、引言

2、代码实战

2.1 模块介绍

2.1.1 pdfkit

2.2 安装

2.3 代码实例

2.3.1 URL 对应网页转 PDF

2.3.2 HTML 文件转 PDF

2.3.3 字符串转 PDF

2.4 拓展

2.4.1 网页转换PDF

2.4.2 网页转换图片

3、总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像