强烈推荐这款神器,把网站转pdf还能编程高级定制!【建议收藏】

简介: 正式的Python专栏第8篇,同学站住,别错过这个从0开始的文章!

学委之前写过一篇把热榜保存为html文件的,这次利用上次写的部分代码继续拓展:生成pdf文件。

我们需要的就是这个软件: wkhtmltopdf

它做的事就一件很专注:网页html生成 pdf (或者图片)

image.png

第一步,下载安装

打开官网:https://wkhtmltopdf.org/

下载苹果电脑的pkg文件。

学委用的是苹果电脑,下载的是下面这个软件。

image.png

点击下一步一步的,默认设置就好。

第二步,验证一下,把百度生成pdf

打开任意一个终端,运行下面的脚本。

#这里雷学委直接把百度首页保持为pdf
wkhtmltopdf https://baidu.com baidu.pdf
#保持内容为图片
wkhtmltoimage https://baidu.com baidu.png

如下图所示, wkhtmltopdf 这个软件不止生成pdf文件,还能生存图片。

image.png

image.png

随便找个文章链接就能保存为pdf

比如把学委的文章保存为pdf

wkhtmltopdf https://blog.csdn.net/geeklevin/article/details/120073157\?spm\=1001.2014.3001.5501 leixuewei.01.pdf

保存的pdf文件如下:

image.png

这个软件就是直接把整个网页变成pdf,原样保存。

第三步,高级定制。用python来定制生成pdf

这里把前面文章 ❤️爬虫截热榜长屏不方便阅读!推荐dominate直接生成报告❤️ 把里面的report.py 复制一下。

1 先安装下面的依赖

pdfkit
dominate

2 编写下面的代码定制网页来实现pdf定制

然后编写下面的代码,调用report.py 生成表格页面,保存为html

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2021/9/4 8:38 下午
# @Author : LeiXueWei
# @CSDN/Juejin/Wechat: 雷学委
# @XueWeiTag: CodingDemo
# @File : pdf_demo.py
# @Project : pydocs
import pdfkit
import report 
# PDF中包含的文字
lxw_tuples = []
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11143102.html?spm=1001.2014.3001.5482","雷学委趣味编程故事汇编"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11235756.html","编程新手指南"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10980215.html","Python从入门到精通"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11159040.html","学会Python等于拥有整个世界!"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11253201.html","沉住气学习爬虫"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11099259.html","架构运维"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10461966.html","雷学委之NodeJS爱好系列"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10532880.html","雷学委的DevOps一条龙"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11291617.html","LINUX程序员都要懂"))
lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10725914.html","[小白向Linux基操]"))
# 调用之前热榜保存为html文章的generate_html,根据专栏数据生成html页面代码
#https://blog.csdn.net/geeklevin/article/details/119657231?spm=1001.2014.3001.5501 内实现的report.py脚本的generate_html函数
html = report.generate_html(lxw_tuples)
# 这里雷学委把html源代码转换为PDF
pdfkit.from_string(html, './leixuewei_zhuanlan.pdf')

效果如下:

image.png

延伸

多数情况下,我们可以使用wkhtmltopdf来直接把链接直接保存为pdf文件。

pdf高级定制参考上面的代码。从上面的代码,我们可以看出,pdfkit可以根据任意的html代码来生成pdf。

目录
相关文章
|
7月前
|
Web App开发 Windows
【Windows】 chrome 如何下载网站在线预览PDF文件,保存到本地
【Windows】 chrome 如何下载网站在线预览PDF文件,保存到本地
734 0
|
2月前
|
人工智能 计算机视觉 Python
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
38 1
|
2月前
|
存储 安全 网络安全
Python编程--使用PyPDF解析PDF文件中的元数据
Python编程--使用PyPDF解析PDF文件中的元数据
71 1
|
2月前
|
算法 Java 程序员
【福利😍】2024年最新103本互联网大厂程序员编程书合集【高清文字版无水印pdf】
推荐优质编程电子书资源,涵盖Python入门、算法设计、Java高并发、Docker、机器学习等领域,适合从小白到高级开发者。书籍包括《编程小白的第一本Python入门书》、《编程珠玑》等,助你提升技能,紧跟技术前沿,在职场中脱颖而出。下载地址含国内外网盘链接,更多资源可访问资料吧网站获取。
216 0
|
2月前
|
IDE 开发工具 数据安全/隐私保护
Python编程实现批量md5加密pdf文件
Python编程实现批量md5加密pdf文件
43 0
|
7月前
|
存储 关系型数据库 MySQL
《MySQL 入门教程》第 05 篇 账户和权限,Java高并发编程详解深入理解pdf
《MySQL 入门教程》第 05 篇 账户和权限,Java高并发编程详解深入理解pdf
|
7月前
|
搜索推荐 定位技术 数据安全/隐私保护
方便、免费的PDF在线处理网站汇总:PDF合并、文字编辑、页面提取与删除、格式转换…
方便、免费的PDF在线处理网站汇总:PDF合并、文字编辑、页面提取与删除、格式转换…
158 1
|
Python
Python编程:pypdf2和pdfplumber获取pdf文件的页数
Python编程:pypdf2和pdfplumber获取pdf文件的页数
588 0
|
人工智能 前端开发 Linux
Python编程:利用ImageMagick转换PDF为图片并识别提取图表
Python编程:利用ImageMagick转换PDF为图片并识别提取图表
325 0
|
Linux Python
Python编程:使用wkhtmltopdf将html网页转成pdf文件
Python编程:使用wkhtmltopdf将html网页转成pdf文件
191 0
Python编程:使用wkhtmltopdf将html网页转成pdf文件