web开发HTML生成PDF的三种解决方案(服务器端mpdf、html2canvas.js、浏览器打印、PDF虚拟打印机)

简介: web开发HTML生成PDF的三种解决方案(服务器端mpdf、html2canvas.js、浏览器打印、PDF虚拟打印机)

前言

在web网页中加载并显示PDF文件是最常见的业务需求,目前浏览器大多数都自带pdf预览功能,但是每个浏览器的pdf加载器并不一样,工具栏也无法定制化。为了统一不同浏览器pdf预览的一致性,并增加一些自定义功能,需要在实际的项目开发过程中根据不同的情况进行pdf文档的生产。


一、服务器端生成PDF

mPDF是一个PHP类库,它由UTF-8编码的HTML生成PDF文件。它基于FPDF和HTML2FPDF ,再此基础上添加了许多功能。同时对css支持能力得到了大的提升,支持css样式的引入。mPDF生成类库的步骤如下:

1.开发对应HTML页面

如公开地址:http://test.com/index.php?m=Index&a=projectTable&act=showTable&zp_id=2

2.curl对应的HTML页面

/*
 1. 爬取
 2. $url,服务器地址;
 3. $header,文件头;
 4. $data,数据,array();
*/
function get_url($url)
{
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_POST, 1);
    /*自适应SSL证书*/
    if (1 == strpos("$" . $url, "https://")) {
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
    }
    $response = curl_exec($ch);
    curl_close($ch);
    return $response;
}


3.生成PDF文档

/*打印PDF详情页
 5. $url, 域名;
 6. $pro_id, 项目Id;
 7. $pro_types,机构类型;
 8. $waterMark,水印文字;
 9. $pro_serial,项目编号;
*/
function printPdf($url, $zp_id, $user_name, $waterMark)
{
    require_once("libs/mpdf/mpdf.php");
    $mpdf = new mPDF('utf-8', 'A4', '', '宋体', 0, 0, 20, 10);
    //$mpdf->shrink_tables_to_fit = 0;
    //添加水印;
    $mpdf->SetWatermarkText($waterMark, 0.1);//水印文字,透明度
    $mpdf->showWatermarkText = true; //开启水印
    if (preg_match("/([\x81-\xfe][\x40-\xfe])/", $waterMark, $match)) {
        $mpdf->watermark_font = 'GB';
    }
    //获取内容;
    $mpdf->useAdobeCJK = true;
    $html = get_url($url . '?m=Index&a=projectTable&act=showTable&zp_id=' . $zp_id);
    //设置PDF页眉内容
    //$header = '<table width="95%" style="margin:0 auto;border-bottom: 1px solid #4F81BD; vertical-align: middle; font-family:serif; font-size: 9pt; color: #000088;"><tr><td width="10%"></td><td width="80%" align="center" style="font-size:16px;color:#A0A0A0"></td><td width="10%" style="text-align: right;">山东精品课程申报系统</td></tr></table>';
    //设置PDF页脚内容
    $footer = '<table width="100%" style="vertical-align: bottom; font-size: 9pt; color: #000;"><tr style="height:30px"></tr><tr><td width="10%"></td><td width="80%" align="center" style="font-size:14px;color:#000"></td><td width="10%" style="font-size:14px;color:#000;">页码: {PAGENO} / {nb}</td></tr></table>';
    //添加页眉和页脚到pdf中
    //$mpdf->SetHTMLHeader($header);
    $mpdf->SetHTMLFooter($footer);
    //设置pdf显示方式
    $mpdf->SetDisplayMode('fullpage');
    //创建pdf文件
    $mpdf->WriteHTML($html);
    //输出pdf
    $mpdf->Output($user_name . '.pdf', 'I');//'D';下载模式
    exit;
}


4.注意事项

在读取html文档时,一般可以使用file_get_contents函数,但是如果访问量过大时,会造成CPU负荷多大,导致服务器宕机;

通过curl封装get_url($url)函数,在一定的程度上解决CPU负荷的问题;

如果爬取的文档内容不多,最彻底的解决方案:是在printPdf($url, $zp_id, $user_name, $waterMark)函数中做HTML和PHP混排;

生成的内容是文字,可以复制;

爬取内容时,如果对应的页面有用户登录权限,必须赋权访问,如:CURL获取cookies模拟登录的方法;

mpdf在自动分页上有很明显的优势,但在使用table布局时,大段落文字会出现压缩的情况,建议使用div布局。


二、html2canvas.js库

1.引入库html2canvas库

    <script type="text/javascript" src="static/rooted/js/html2canvas.min.js"></script>
    <script type="text/javascript" src="static/rooted/js/jspdf.min.js"></script>
    <script type="text/javascript" src="static/rooted/js/h2pdf.js"></script>


2.设置页面大小尺寸

案例默认使用A4大小。

/*表格打印*/
.page_width {
    width: 595.32pt;
}
.page {
    position: relative;
    margin: 0 auto;
}
#printId {
    width: 98%;
    height: 720pt;
    background: #FFF;
    color: #000;
    font-size: 16px;
}
/*控制表格内容宽高,防止被拉伸*/
.content_p {
    text-align: center;
    padding-top: 5px;
}
.content_p > table {
    width: 98%;
}
td {
    height: 30px;
    padding: 5px;
}
.title_td {
    font-weight: bold;
    text-align: center;
}
.verimg {
    position: absolute;
    right: 0px;
    top: 10px;
    z-index: 9999;
    transform: rotate(30deg)
}


3.HTML布局

<div class="page page_width">
    <div id="printId">
        <div class="content_p" id="content_p">
            <table  align="center" border="1" cellpadding="0">
                <tr>
                    <td colspan="4" class="title_td" style="font-size: 32px;padding: 10px;">山东省中医临床优秀人才选拔考试准考证</td>
                </tr>
                <tr>
                    <td colspan="4" class="title_td">身份信息</td>
                </tr>
                <tr>
                    <td align="center">准考证号</td>
                    <td colspan="2" align="center">SDYX001</td>
                    <td rowspan="6" align="center"><img width="160" height="242" src="upload/2022-06/SDYX001.jpg"></td>
                </tr>
                <tr>
                    <td align="center">姓名</td>
                    <td colspan="2" align="center">介保良</td>
                </tr>
                <tr>
                    <td align="center">性别</td>
                    <td colspan="2" align="center">男</td>
                </tr>
                <tr>
                    <td align="center">职称</td>
                    <td colspan="2" align="center">执业医师</td>
                </tr>
                <tr>
                    <td align="center">身份证号</td>
                    <td colspan="2" align="center">******</td>
                </tr>
                <tr>
                    <td align="center">工作单位</td>
                    <td colspan="2" align="center">中医院</td>
                </tr>
                <tr>
                    <td colspan="4" class="title_td">考试安排</td>
                </tr>
                <tr>
                    <td class="title_td">考试科目</td>
                    <td class="title_td">考试时间</td>
                    <td class="title_td">考试地点</td>
                    <td class="title_td">考场/座号</td>
                </tr>                              
            </table>
        </div>
    </div>
</div>


4.下载PDF文档

<div class="print_btn">
    <button type="button" class="layui-btn layui-btn-normal" onclick='printOut("lockdatav")'>下载PDF文档</button>
    <a type="button" id="ps" class="layui-btn layui-btn-normal" href="?m=Index&a=ticket&act=exam" target="_blank">网页版打印</a>
</div>


5.封装事件函数

    var ps = document.getElementById('ps');
    function preview(id) {
        var sprnhtml = $('#' + id).html(); //获取区域内容
        var selfhtml = $('body').html(); //获取当前页的html, 用来恢复页面
        $('body').html(sprnhtml);
        window.print();
        $('body').html(selfhtml);
    }
    ps.onclick = function () {
        preview('content_p');
    }


6.注意事项

  • PDF在浏览器端生成,减少了对服务器的压力;
  • 生成的PDF实际上是canvas画布base64图片,文字无法复制;
  • 如果是多页时,实现分页比较麻烦。


三、PDF虚拟打印机

使用浏览器自带的PDF虚拟打印机将网页打印成PDF格式:


打开需要保存或打印成PDF的网页,然后右击鼠标选择“打印”,或者直接利用Ctrl+P快捷键进入打印页面。

在弹出的对话框中,选择“闪电PDF虚拟打印机”,再点击“打印”;

选择“PDF”即可,同时,还可以对其他选项进行修改,如文件名、导出路径等。

选择“导出”;

已经成功将网页打印成PDF格式了;

双击打开文件查看效果;


总结

在web端生成pdf时,三种方法针对不同的场景各有利弊。

@漏刻有时

相关文章
|
算法 开发者
Moment.js库是如何处理不同浏览器的时间戳格式差异的?
总的来说,Moment.js 通过一系列的技术手段和策略,有效地处理了不同浏览器的时间戳格式差异,为开发者提供了一个稳定、可靠且易于使用的时间处理工具。
852 156
|
前端开发
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
1167 1
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
|
JavaScript 前端开发 数据处理
模板字符串和普通字符串在浏览器和 Node.js 中的性能表现是否一致?
综上所述,模板字符串和普通字符串在浏览器和 Node.js 中的性能表现既有相似之处,也有不同之处。在实际应用中,需要根据具体的场景和性能需求来选择使用哪种字符串处理方式,以达到最佳的性能和开发效率。
420 63
|
JSON 移动开发 JavaScript
在浏览器执行js脚本的两种方式
【10月更文挑战第20天】本文介绍了在浏览器中执行HTTP请求的两种方式:`fetch`和`XMLHttpRequest`。`fetch`支持GET和POST请求,返回Promise对象,可以方便地处理异步操作。`XMLHttpRequest`则通过回调函数处理请求结果,适用于需要兼容旧浏览器的场景。文中还提供了具体的代码示例。
319 5
在浏览器执行js脚本的两种方式
|
XML JavaScript 前端开发
JavaScript控制台:提升Web开发技能的秘密武器
作为Web开发人员,掌握JavaScript控制台中的各种方法至关重要。本文介绍了22种实用的console方法,从基本的log()到高级的profile()和memory,每种方法都配有示例和说明,帮助开发者更高效地调试和记录信息。通过了解这些工具,您可以优化代码、提高开发速度,减少错误,使编码过程更加顺畅愉快。
254 1
JavaScript控制台:提升Web开发技能的秘密武器
|
机器学习/深度学习 人工智能 JavaScript
JavaScript和TypeScript的未来发展趋势及其在Web开发中的应用前景
本文探讨了JavaScript和TypeScript的未来发展趋势及其在Web开发中的应用前景。JavaScript将注重性能优化、跨平台开发、AI融合及WebAssembly整合;TypeScript则强调与框架整合、强类型检查、前端工程化及WebAssembly的深度结合。两者结合发展,特别是在Vue 3.0中完全采用TypeScript编写,预示着未来的Web开发将更加高效、可靠。
773 4
|
移动开发 前端开发 JavaScript
HTML5 浏览器支持1
现代浏览器普遍支持HTML5,但早期浏览器可能不支持。可以通过将HTML5元素定义为块级元素,使旧版浏览器也能正确显示。例如,可以使用CSS将header、section等8个新的HTML5语义元素设置为块级元素。此外,还可以通过JavaScript为HTML添加新的自定义元素,如使用`document.createElement(&quot;myHero&quot;)`为IE浏览器添加新元素。
|
开发框架 JavaScript 前端开发
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势。通过明确的类型定义,TypeScript 能够在编码阶段发现潜在错误,提高代码质量;支持组件的清晰定义与复用,增强代码的可维护性;与 React、Vue 等框架结合,提供更佳的开发体验;适用于大型项目,优化代码结构和性能。随着 Web 技术的发展,TypeScript 的应用前景广阔,将继续引领 Web 开发的新趋势。
522 2
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
2162 1
|
设计模式 JavaScript 前端开发
浅谈JavaScript 框架在现代 Web 开发中的作用
浅谈JavaScript 框架在现代 Web 开发中的作用
211 12