pdf.js 怎么预览 base64 类型的 pdf 文件

简介: pdf.js 怎么预览 base64 类型的 pdf 文件

代码实现

<!DOCTYPE html>
<html>
    <head>
        <title>kiamo自定义渲染pdf页demo</title>
    </head>
    <body>
        <input type="file" onchange='handelChange(this)'/>
        <canvas id="canvas"></canvas>
        <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.min.js"></script>
        <script>
            function handelChange (e) {
                console.log(e.files)
                var file = new File(e.files, "kaimo");
                var reader = new FileReader();
                // readAsDataURL方法可以将读取到的文件编码成DataURL ,可以将资料(例如图片、excel文件)内嵌在网页之中,不用放到外部文件
                reader.readAsDataURL(file);
                console.log(reader)
                // FileReader 提供一个完整的事件模型,用来捕获读取文件的状态
                // onload:文件读取成功时触发
                reader.onload = function () {
                    // base64格式PDF
                    console.log(reader.result);
                    // data:application/octet-stream;base64, 长度37
                    var base64Str = reader.result.substring(37);
                    renderPdf(base64Str);
                };
                // onerror:读取文件错误时触发
                reader.onerror = function (error) {
                    console.log('Error: ', error);
                };
            }
            function renderPdf(base64Str) {
                var pdfjsLib = window['pdfjs-dist/build/pdf'];
                // Base64是一组类似的二进制到文本(binary-to-text)的编码规则,使得二进制数据在解释成radix-64的表现形式后可以用ASCII字符串的格式表示出来。Base64编码将数据转为“安全字符”用于传输,编码会使内容变长1/3。
                // atob() 对经过 base-64 编码的字符串进行解码。
                // btoa() 方法可以将一个二进制字符串(例如,将字符串中的每一个字节都视为一个二进制数据字节)编码为 Base64 编码的 ASCII 字符串。
                var pdfData = atob(base64Str);
                // GlobalWorkerOptions
                pdfjsLib.GlobalWorkerOptions.workerSrc = 'https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.2.2/pdf.worker.min.js';
                // 异步下载pdf
                var loadingTask = pdfjsLib.getDocument({
                    data: pdfData
                });
                // 加载pdf
                loadingTask.promise.then(function(pdf) {
                    console.log('PDF loaded');
                    // 定义的pdf页面:这里使用第一页进行测试
                    var pageNumber = 1;
                    // 调用getPage方法获取对应的页面
                    pdf.getPage(pageNumber).then(function(page) {
                        // 倍数
                        var scale = 1.5;
                        // 展示的倍数:用于修改 viewer.html 的倍数
                        var viewport = page.getViewport({scale: scale});
                        // 使用 canvas 绘制
                        var canvas = document.getElementById('canvas');
                        var context = canvas.getContext('2d');
                        canvas.height = viewport.height;
                        canvas.width = viewport.width;
                        // 内容
                        var renderContext = {
                            canvasContext: context,
                            viewport: viewport
                        };
                        // 渲染
                        var renderTask = page.render(renderContext);
                        renderTask.promise.then(function () {
                            console.log('渲染完毕');
                        });
                    });
                }, function(error){
                    // pdf加载错误
                    console.error('loading error', error);
                })
            }
        </script>
    </body>
</html>


实现的效果


我们选择文件,然后确定,这里我选了一个比较大的文件

c6d56297c4904b798ddf1c2b3e40a574.png



然后等待一下,就会渲染完毕:


image.png


注意:这里只会展示一页。上一页下一页的功能可以自己拓展,另外也可以考虑使用 pdf.js 的预览页面通过 file 传递 blob  地址预览,这种自带额外工具栏,可以下载,翻页等。不过这就需要你把 base64 的数据转为 blob 的地址,还需要依赖 pdf.js  的预览页。









目录
相关文章
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
86 10
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
OCRmyPDF 是一款开源命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。
669 17
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
457 5
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
495 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
518 8
PDF预览:利用vue3-pdf-app实现前端PDF在线展示
通过本文的介绍,我们详细了解了如何在Vue3项目中使用vue3-pdf-app实现PDF文件的在线展示。从项目初始化、插件集成到高级功能的实现和部署优化,希望对你有所帮助。在实际项目中,灵活运用这些技术可以大大提升用户体验和项目质量。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
1116 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
7月前
|
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
174 16
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问