pdf.js 怎么预览 base64 类型的 pdf 文件

简介: pdf.js 怎么预览 base64 类型的 pdf 文件

代码实现

<!DOCTYPE html>
<html>
    <head>
        <title>kiamo自定义渲染pdf页demo</title>
    </head>
    <body>
        <input type="file" onchange='handelChange(this)'/>
        <canvas id="canvas"></canvas>
        <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.min.js"></script>
        <script>
            function handelChange (e) {
                console.log(e.files)
                var file = new File(e.files, "kaimo");
                var reader = new FileReader();
                // readAsDataURL方法可以将读取到的文件编码成DataURL ,可以将资料(例如图片、excel文件)内嵌在网页之中,不用放到外部文件
                reader.readAsDataURL(file);
                console.log(reader)
                // FileReader 提供一个完整的事件模型,用来捕获读取文件的状态
                // onload:文件读取成功时触发
                reader.onload = function () {
                    // base64格式PDF
                    console.log(reader.result);
                    // data:application/octet-stream;base64, 长度37
                    var base64Str = reader.result.substring(37);
                    renderPdf(base64Str);
                };
                // onerror:读取文件错误时触发
                reader.onerror = function (error) {
                    console.log('Error: ', error);
                };
            }
            function renderPdf(base64Str) {
                var pdfjsLib = window['pdfjs-dist/build/pdf'];
                // Base64是一组类似的二进制到文本(binary-to-text)的编码规则,使得二进制数据在解释成radix-64的表现形式后可以用ASCII字符串的格式表示出来。Base64编码将数据转为“安全字符”用于传输,编码会使内容变长1/3。
                // atob() 对经过 base-64 编码的字符串进行解码。
                // btoa() 方法可以将一个二进制字符串(例如,将字符串中的每一个字节都视为一个二进制数据字节)编码为 Base64 编码的 ASCII 字符串。
                var pdfData = atob(base64Str);
                // GlobalWorkerOptions
                pdfjsLib.GlobalWorkerOptions.workerSrc = 'https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.worker.min.js';
                // 异步下载pdf
                var loadingTask = pdfjsLib.getDocument({
                    data: pdfData
                });
                // 加载pdf
                loadingTask.promise.then(function(pdf) {
                    console.log('PDF loaded');
                    // 定义的pdf页面:这里使用第一页进行测试
                    var pageNumber = 1;
                    // 调用getPage方法获取对应的页面
                    pdf.getPage(pageNumber).then(function(page) {
                        // 倍数
                        var scale = 1.5;
                        // 展示的倍数:用于修改 viewer.html 的倍数
                        var viewport = page.getViewport({scale: scale});
                        // 使用 canvas 绘制
                        var canvas = document.getElementById('canvas');
                        var context = canvas.getContext('2d');
                        canvas.height = viewport.height;
                        canvas.width = viewport.width;
                        // 内容
                        var renderContext = {
                            canvasContext: context,
                            viewport: viewport
                        };
                        // 渲染
                        var renderTask = page.render(renderContext);
                        renderTask.promise.then(function () {
                            console.log('渲染完毕');
                        });
                    });
                }, function(error){
                    // pdf加载错误
                    console.error('loading error', error);
                })
            }
        </script>
    </body>
</html>


实现的效果


我们选择文件,然后确定,这里我选了一个比较大的文件

c6d56297c4904b798ddf1c2b3e40a574.png



然后等待一下,就会渲染完毕:


image.png


注意:这里只会展示一页。上一页下一页的功能可以自己拓展,另外也可以考虑使用 pdf.js 的预览页面通过 file 传递 blob  地址预览,这种自带额外工具栏,可以下载,翻页等。不过这就需要你把 base64 的数据转为 blob 的地址,还需要依赖 pdf.js  的预览页。









目录
相关文章
|
8月前
|
前端开发 JavaScript
个人征信电子版无痕修改, 个人信用报告pdf修改,js+html+css即可实现【仅供学习用途】
本代码展示了一个信用知识学习系统的前端实现,包含评分计算、因素分析和建议生成功能。所有数据均为模拟生成
|
10月前
|
存储 JSON API
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。
|
7月前
|
C#
【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件,PDF自动提取内容命名的方案和详细步骤
本工具可批量提取PDF中的合同编号、日期、发票号等关键信息,支持PDF自定义区域提取并自动重命名文件,适用于合同管理、发票处理、文档归档和数据录入场景。基于iTextSharp库实现,提供完整代码示例与百度、腾讯网盘下载链接,助力高效处理PDF文档。
886 40
|
7月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
9月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
490 10
|
8月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
|
8月前
|
前端开发
个人征信PDF无痕修改软件,个人征信模板可编辑,个人征信报告p图神器【js+html+css仅供学习用途】
这是一款信用知识学习系统,旨在帮助用户了解征信基本概念、信用评分计算原理及信用行为影响。系统通过模拟数据生成信用报告,涵盖还款记录
|
12月前
|
人工智能 编解码 文字识别
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
OCRmyPDF 是一款开源命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。
1254 17
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
1289 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
12月前
|
文字识别 Serverless 开发工具
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
1770 5

热门文章

最新文章