django(六)使用wkhtmltopdf将网页导出PDF

简介: 如题,我需要使用python 将 网页 转成PDF文件,这里会用到wkhtmltopdf我这里使用的是centos服务器。(使用ubuntu事会少很多,别问我为什么不用,我的web项目使用的是PHP,相对来说,centos部署web项目要比ubuntu要好)Python需要用到扩展 pdfkit

如题,我需要使用python 将 网页 转成PDF文件,这里会用到wkhtmltopdf

我这里使用的是centos服务器。(使用ubuntu事会少很多,别问我为什么不用,我的web项目使用的是PHP,相对来说,centos部署web项目要比ubuntu要好)

Python需要用到扩展 pdfkit

一:安装pdfkit

复制代码

pip install pdfkit

在python代码中执行:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

arduino

复制代码

OSError at /outHtmlToPdf
No wkhtmltopdf executable found: "b''"
If this file exists please check that this process can read it or you can pass path to it manually in method call, check README. Otherwise please install wkhtmltopdf -

进入下一步->

二:安装 wkhtmltopdf

Centos命令:

复制代码

yum install wkhtmltopdf

ubuntu命令:

复制代码


         

在python代码中执行:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

vbnet

复制代码

wkhtmltopdf: cannot connect to X server
You will need to run wkhtmltopdf within a "virtual" X server.
Go to the link below for more information
https://github.com/JazzCore/python-pdfkit/wiki/Using-wkhtmltopdf-without-X-server

进入下一步->

三:安装 xvfb

Centos 命令:

vbscript

复制代码

yum install xorg-x11-server-Xvfb

ubuntu 命令:

arduino

复制代码

apt-get install xvfb

四:配置服务器访问(centos/ubuntu)

在 /usr/bin/ 目录下生成脚本 wkhtmltopdf.sh 并写入命令

Centos:

bash

复制代码

sudo vim /usr/bin/wkhtmltopdf.sh

文件输入:

ini

复制代码

#! /usr/bin/bash
xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

Ubuntu:

bash

复制代码

sudo vim /usr/bin/wkhtmltopdf.sh

文件输入:

javascript

复制代码

#! /usr/bin/bash
echo -e '#!/bin/bash\nxvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*' > /usr/bin/wkhtmltopdf.sh

文件输入的内容,一定要严格按照我这里的输入,否则可能会出现下边我出现的bug

五:更改文件权限并创建软连接(快捷方式)

bash

复制代码

chmod a+x /usr/bin/wkhtmltopdf.sh
ln -s /usr/bin/wkhtmltopdf.sh /usr/local/bin/wkhtmltopdf

六:测试一下:

在Linux终端中输入:

arduino

复制代码

wkhtmltopdf http://www.baidu.com a.pdf

生成成功,即代表wkhtmltopdf 安装成功。

原以为到此就结束了,但是我还是太年轻。

当我执行完上边的所有步骤之后,执行代码:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

image.png

lua

复制代码

OSError at /outHtmlToPdf
[Errno 8] Exec format error: '/usr/local/bin/wkhtmltopdf'

这里我要事先说明一下:/usr/local/bin/wkhtmltopdf这个软连接文件中,我里边写的内容是:

css

复制代码

xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

然后,经过第六部的测试之后没有问题。我就认为没有问题。

但是上边的报错明确告诉我,有问题的是/usr/local/bin/wkhtmltopdf这个文件。

为什么会报这个错呢?我百思不得其解。

百度了一下:一般报[Errno 8] Exec format error:这个错误的,都是因为在文件开头没有添加:

javascript

复制代码

#! /usr/bin/env python3

的原因。

但是 /usr/local/bin/wkhtmltopdf这个文件 这个文件并不是 python 文件啊。

寻根溯源一下:

/usr/local/bin/wkhtmltopdf文件是/usr/bin/wkhtmltopdf.sh的软连接文件,一般在写.sh执行文件的时候,都会在文件开头添加一句:

javascript

复制代码

#! /usr/bin/bash

我就在 /usr/local/bin/wkhtmltopdf 文件开头添加了上边的语句:现在文件内容如下:

ini

复制代码

#! /usr/bin/bash
xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

然后在执行代码:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

然后,竟然好用了……

这玩意是真的坑……

八:中文乱码问题

解决中文乱码问题

复制代码

yum groupinstall Fonts -y

以上大概就是 我在django框架中 使用 wkhtmltopdf的基本情况。

有好的建议,请在下方输入你的评论。

目录
相关文章
|
2月前
|
机器学习/深度学习 文字识别 Shell
高效率办公PDF批量处理:批量OCR识别PDF区域文字内容,用PDF内容批量改名或导出表格的货物运单应用案例
针对铁路货运物流单存档需求,本项目基于WPF与飞桨OCR技术,实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域,系统提取关键信息(如车号、批次号)并生成规范文件名,提升档案管理效率与检索准确性,支持PDF及图像文件处理。
344 0
|
8月前
|
存储 JSON API
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。
|
5月前
|
缓存 测试技术 网络安全
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
102 0
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
|
10月前
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
2266 10
|
10月前
|
文字识别
【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容,用内容批量给PDF命名或者导出表格,学会全自动解放双手
在生活和工作中,我们常需处理大量PDF文件,如银行单据、税收单据等。手动处理效率低下,而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理,大幅提高效率。该工具通过获取PDF各区域内容坐标,导入并处理文件,最终将信息提取至表格,并根据关键信息对PDF进行重命名,方便管理和查找。
1620 2
|
前端开发 API
前端界面生成PDF并导出下载
【10月更文挑战第21天】利用合适的第三方库,你可以在前端轻松实现界面生成 PDF 并导出下载的功能,为用户提供更方便的文档分享和保存方式。你还可以根据具体的需求进一步优化和定制生成的 PDF 文件,以满足不同的业务场景要求。
|
资源调度 前端开发 JavaScript
安利一款基于canvas/svg的富文本编辑器-支持在线导出PDF、DOCX
高性能:利用Canvas和SVG进行图形和矢量图形的渲染,提供高性能的绘图能力。 可扩展性:Canvas-Editor是一个开源项目,支持通过插件机制扩展编辑器的功能,如DOCX、PDF导出、表格分页等。 丰富的文本编辑功能:支持多种文本编辑操作,如插入表格、分页、性能优化等。
1533 0
|
5月前
|
C#
【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件,PDF自动提取内容命名的方案和详细步骤
本工具可批量提取PDF中的合同编号、日期、发票号等关键信息,支持PDF自定义区域提取并自动重命名文件,适用于合同管理、发票处理、文档归档和数据录入场景。基于iTextSharp库实现,提供完整代码示例与百度、腾讯网盘下载链接,助力高效处理PDF文档。
710 40
|
5月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
7月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
344 10