django(六)使用wkhtmltopdf将网页导出PDF

简介: 如题,我需要使用python 将 网页 转成PDF文件,这里会用到wkhtmltopdf我这里使用的是centos服务器。(使用ubuntu事会少很多,别问我为什么不用,我的web项目使用的是PHP,相对来说,centos部署web项目要比ubuntu要好)Python需要用到扩展 pdfkit

如题,我需要使用python 将 网页 转成PDF文件,这里会用到wkhtmltopdf

我这里使用的是centos服务器。(使用ubuntu事会少很多,别问我为什么不用,我的web项目使用的是PHP,相对来说,centos部署web项目要比ubuntu要好)

Python需要用到扩展 pdfkit

一:安装pdfkit

复制代码

pip install pdfkit

在python代码中执行:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

arduino

复制代码

OSError at /outHtmlToPdf
No wkhtmltopdf executable found: "b''"
If this file exists please check that this process can read it or you can pass path to it manually in method call, check README. Otherwise please install wkhtmltopdf -

进入下一步->

二:安装 wkhtmltopdf

Centos命令:

复制代码

yum install wkhtmltopdf

ubuntu命令:

复制代码


         

在python代码中执行:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

vbnet

复制代码

wkhtmltopdf: cannot connect to X server
You will need to run wkhtmltopdf within a "virtual" X server.
Go to the link below for more information
https://github.com/JazzCore/python-pdfkit/wiki/Using-wkhtmltopdf-without-X-server

进入下一步->

三:安装 xvfb

Centos 命令:

vbscript

复制代码

yum install xorg-x11-server-Xvfb

ubuntu 命令:

arduino

复制代码

apt-get install xvfb

四:配置服务器访问(centos/ubuntu)

在 /usr/bin/ 目录下生成脚本 wkhtmltopdf.sh 并写入命令

Centos:

bash

复制代码

sudo vim /usr/bin/wkhtmltopdf.sh

文件输入:

ini

复制代码

#! /usr/bin/bash
xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

Ubuntu:

bash

复制代码

sudo vim /usr/bin/wkhtmltopdf.sh

文件输入:

javascript

复制代码

#! /usr/bin/bash
echo -e '#!/bin/bash\nxvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*' > /usr/bin/wkhtmltopdf.sh

文件输入的内容,一定要严格按照我这里的输入,否则可能会出现下边我出现的bug

五:更改文件权限并创建软连接(快捷方式)

bash

复制代码

chmod a+x /usr/bin/wkhtmltopdf.sh
ln -s /usr/bin/wkhtmltopdf.sh /usr/local/bin/wkhtmltopdf

六:测试一下:

在Linux终端中输入:

arduino

复制代码

wkhtmltopdf http://www.baidu.com a.pdf

生成成功,即代表wkhtmltopdf 安装成功。

原以为到此就结束了,但是我还是太年轻。

当我执行完上边的所有步骤之后,执行代码:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

报错:

image.png

lua

复制代码

OSError at /outHtmlToPdf
[Errno 8] Exec format error: '/usr/local/bin/wkhtmltopdf'

这里我要事先说明一下:/usr/local/bin/wkhtmltopdf这个软连接文件中,我里边写的内容是:

css

复制代码

xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

然后,经过第六部的测试之后没有问题。我就认为没有问题。

但是上边的报错明确告诉我,有问题的是/usr/local/bin/wkhtmltopdf这个文件。

为什么会报这个错呢?我百思不得其解。

百度了一下:一般报[Errno 8] Exec format error:这个错误的,都是因为在文件开头没有添加:

javascript

复制代码

#! /usr/bin/env python3

的原因。

但是 /usr/local/bin/wkhtmltopdf这个文件 这个文件并不是 python 文件啊。

寻根溯源一下:

/usr/local/bin/wkhtmltopdf文件是/usr/bin/wkhtmltopdf.sh的软连接文件,一般在写.sh执行文件的时候,都会在文件开头添加一句:

javascript

复制代码

#! /usr/bin/bash

我就在 /usr/local/bin/wkhtmltopdf 文件开头添加了上边的语句:现在文件内容如下:

ini

复制代码

#! /usr/bin/bash
xvfb-run -a --server-args="-screen 0, 1024x768x24" /usr/bin/wkhtmltopdf -q $*

然后在执行代码:

arduino

复制代码

import pdfkit
pdfkit.from_url('https://www.baidu.com/')

然后,竟然好用了……

这玩意是真的坑……

八:中文乱码问题

解决中文乱码问题

复制代码

yum groupinstall Fonts -y

以上大概就是 我在django框架中 使用 wkhtmltopdf的基本情况。

有好的建议,请在下方输入你的评论。

目录
相关文章
|
6月前
|
机器学习/深度学习 文字识别 Shell
高效率办公PDF批量处理:批量OCR识别PDF区域文字内容,用PDF内容批量改名或导出表格的货物运单应用案例
针对铁路货运物流单存档需求,本项目基于WPF与飞桨OCR技术,实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域,系统提取关键信息(如车号、批次号)并生成规范文件名,提升档案管理效率与检索准确性,支持PDF及图像文件处理。
953 48
|
12月前
|
存储 JSON API
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。
|
9月前
|
缓存 测试技术 网络安全
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
163 0
05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡
|
文字识别
【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容,用内容批量给PDF命名或者导出表格,学会全自动解放双手
在生活和工作中,我们常需处理大量PDF文件,如银行单据、税收单据等。手动处理效率低下,而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理,大幅提高效率。该工具通过获取PDF各区域内容坐标,导入并处理文件,最终将信息提取至表格,并根据关键信息对PDF进行重命名,方便管理和查找。
2543 47
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
3329 10
|
前端开发 API
前端界面生成PDF并导出下载
【10月更文挑战第21天】利用合适的第三方库,你可以在前端轻松实现界面生成 PDF 并导出下载的功能,为用户提供更方便的文档分享和保存方式。你还可以根据具体的需求进一步优化和定制生成的 PDF 文件,以满足不同的业务场景要求。
|
资源调度 前端开发 JavaScript
安利一款基于canvas/svg的富文本编辑器-支持在线导出PDF、DOCX
高性能:利用Canvas和SVG进行图形和矢量图形的渲染,提供高性能的绘图能力。 可扩展性:Canvas-Editor是一个开源项目,支持通过插件机制扩展编辑器的功能,如DOCX、PDF导出、表格分页等。 丰富的文本编辑功能:支持多种文本编辑操作,如插入表格、分页、性能优化等。
1923 0
|
Web App开发 前端开发 Python
django 1.8 官方文档翻译: 3-5-2 使用Django输出PDF
使用Django输出PDF 这篇文档阐述了如何通过使用Django视图动态输出PDF。这可以通过一个出色的、开源的Python PDF库ReportLab来实现。
1210 0
|
10月前
|
Linux 数据库 数据安全/隐私保护
Python web Django快速入门手册全栈版,共2590字,短小精悍
本教程涵盖Django从安装到数据库模型创建的全流程。第一章介绍Windows、Linux及macOS下虚拟环境搭建与Django安装验证;第二章讲解项目创建、迁移与运行;第三章演示应用APP创建及项目汉化;第四章说明超级用户创建与后台登录;第五章深入数据库模型设计,包括类与表的对应关系及模型创建步骤。内容精炼实用,适合快速入门Django全栈开发。
540 1
|
设计模式 前端开发 数据库
Python Web开发:Django框架下的全栈开发实战
【10月更文挑战第27天】本文介绍了Django框架在Python Web开发中的应用,涵盖了Django与Flask等框架的比较、项目结构、模型、视图、模板和URL配置等内容,并展示了实际代码示例,帮助读者快速掌握Django全栈开发的核心技术。
866 45