pdf.js 怎么预览 base64 类型的 pdf 文件

简介: pdf.js 怎么预览 base64 类型的 pdf 文件

代码实现

<!DOCTYPE html>
<html>
    <head>
        <title>kiamo自定义渲染pdf页demo</title>
    </head>
    <body>
        <input type="file" onchange='handelChange(this)'/>
        <canvas id="canvas"></canvas>
        <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.min.js"></script>
        <script>
            function handelChange (e) {
                console.log(e.files)
                var file = new File(e.files, "kaimo");
                var reader = new FileReader();
                // readAsDataURL方法可以将读取到的文件编码成DataURL ,可以将资料(例如图片、excel文件)内嵌在网页之中,不用放到外部文件
                reader.readAsDataURL(file);
                console.log(reader)
                // FileReader 提供一个完整的事件模型,用来捕获读取文件的状态
                // onload:文件读取成功时触发
                reader.onload = function () {
                    // base64格式PDF
                    console.log(reader.result);
                    // data:application/octet-stream;base64, 长度37
                    var base64Str = reader.result.substring(37);
                    renderPdf(base64Str);
                };
                // onerror:读取文件错误时触发
                reader.onerror = function (error) {
                    console.log('Error: ', error);
                };
            }
            function renderPdf(base64Str) {
                var pdfjsLib = window['pdfjs-dist/build/pdf'];
                // Base64是一组类似的二进制到文本(binary-to-text)的编码规则,使得二进制数据在解释成radix-64的表现形式后可以用ASCII字符串的格式表示出来。Base64编码将数据转为“安全字符”用于传输,编码会使内容变长1/3。
                // atob() 对经过 base-64 编码的字符串进行解码。
                // btoa() 方法可以将一个二进制字符串(例如,将字符串中的每一个字节都视为一个二进制数据字节)编码为 Base64 编码的 ASCII 字符串。
                var pdfData = atob(base64Str);
                // GlobalWorkerOptions
                pdfjsLib.GlobalWorkerOptions.workerSrc = 'https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.worker.min.js';
                // 异步下载pdf
                var loadingTask = pdfjsLib.getDocument({
                    data: pdfData
                });
                // 加载pdf
                loadingTask.promise.then(function(pdf) {
                    console.log('PDF loaded');
                    // 定义的pdf页面:这里使用第一页进行测试
                    var pageNumber = 1;
                    // 调用getPage方法获取对应的页面
                    pdf.getPage(pageNumber).then(function(page) {
                        // 倍数
                        var scale = 1.5;
                        // 展示的倍数:用于修改 viewer.html 的倍数
                        var viewport = page.getViewport({scale: scale});
                        // 使用 canvas 绘制
                        var canvas = document.getElementById('canvas');
                        var context = canvas.getContext('2d');
                        canvas.height = viewport.height;
                        canvas.width = viewport.width;
                        // 内容
                        var renderContext = {
                            canvasContext: context,
                            viewport: viewport
                        };
                        // 渲染
                        var renderTask = page.render(renderContext);
                        renderTask.promise.then(function () {
                            console.log('渲染完毕');
                        });
                    });
                }, function(error){
                    // pdf加载错误
                    console.error('loading error', error);
                })
            }
        </script>
    </body>
</html>


实现的效果


我们选择文件,然后确定,这里我选了一个比较大的文件

c6d56297c4904b798ddf1c2b3e40a574.png



然后等待一下,就会渲染完毕:


image.png


注意:这里只会展示一页。上一页下一页的功能可以自己拓展,另外也可以考虑使用 pdf.js 的预览页面通过 file 传递 blob  地址预览,这种自带额外工具栏,可以下载,翻页等。不过这就需要你把 base64 的数据转为 blob 的地址,还需要依赖 pdf.js  的预览页。









目录
相关文章
|
13天前
|
JSON 前端开发 JavaScript
在JavaScript中,异步编程是一种处理非阻塞操作(如网络请求、文件读写等)的重要技术
【6月更文挑战第12天】JavaScript中的异步编程通过Promise和async/await处理非阻塞操作。Promise管理异步操作的三种状态,防止回调地狱,支持链式调用和并行处理。async/await是ES8引入的语法糖,使异步代码更像同步代码,提高可读性。两者结合使用能更高效地处理复杂异步场景。
21 3
|
11天前
|
前端开发 JavaScript 数据处理
前端新手指南:如何解决JavaScript导出CSV文件不完整的问题
【6月更文挑战第4天】在JavaScript中处理CSV文件时,需要特别注意一些特殊字符,例如逗号、双引号、换行符等。这些字符可能会影响CSV文件的解析,导致数据错乱。
42 0
|
1天前
|
JavaScript 前端开发 API
探讨JavaScript动态添加HTML文件的技术
探讨JavaScript动态添加HTML文件的技术
9 1
|
2天前
|
XML Java 数据格式
Java用xpdf库获取pdf文件的指定范围文本内容
Java用xpdf库获取pdf文件的指定范围文本内容
12 1
|
6天前
|
JavaScript 前端开发 开发者
介绍如何在WebStorm中调试JavaScript文件
介绍如何在WebStorm中调试JavaScript文件
10 1
|
11天前
|
JavaScript
JS实现照片预览
JS实现照片预览
|
17天前
|
文字识别 开发工具 数据安全/隐私保护
印刷文字识别产品使用合集之可以识别一张电子发票有多页(多张图片,或者一个PDF文件)的这种发票吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
18天前
|
移动开发 JavaScript 前端开发
使用GruntJS链接与压缩多个JavaScript文件
使用GruntJS链接与压缩多个JavaScript文件
13 3
|
17天前
|
编解码 文字识别
印刷文字识别操作报错合集之在尝试将PDF文件转换为图片时出现了问题,具体的错误代码是415,该怎么处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
2天前
|
XML 自然语言处理 数据安全/隐私保护