前端实现文件预览(pdf、excel、word、图片)

简介: 前端实现文件预览(pdf、excel、word、图片)

图片预览

iframe标签能够将另一个HTML页面嵌入到当前页面中,我们的图片也能够使用iframe标签来进行展示。

js

复制代码

<iframe  :src="图片地址"         style="z-index: 1000; height:650px; width: 100%; margin: 0 auto"         sandbox="allow-scripts allow-top-navigation allow-same-origin allow-popups"/>

sandbox这个属性如果是单纯预览图片可以不使用,该属性对呈现在 iframe 框架中的内容启用一些额外的限制条件。属性值可以为空字符串(这种情况下会启用所有限制),也可以是用空格分隔的一系列指定的字符串。

  • allow-scripts: 允许嵌入的浏览上下文运行脚本(但不能创建弹窗)。如果没有使用该关键字,就无法运行脚本。
  • allow-top-navigation: 允许将框架内所加载页面中的超链接导航到父级窗口
  • allow-same-popups: 允许弹窗 (例如 window.open, target="_blank")。如果没有使用该关键字,相应的功能将自动被禁用。
  • allow-same-origin: 如果没有使用该关键字,嵌入的浏览上下文将被视为来自一个独立的源,这将使 same-origin policy 同源检查失败。使用了这个属性,那么当前页面和iframe打开的页面视为同源。

word文档预览(docx)

js

复制代码

先下载npm包npm i docx-preview --save

js

复制代码

<div class="docxRef"></div><script>import { renderAsync } from'docx-preview';

functionfn() {
// 这里的res.data是 blob文件流,如果自己的不是blob文件流// 可以通过URL.createObjectURL(参数) 参数为File格式,转换为blob文件流    let blob = res.data    let childRef = document.getElementsByClassName('docxRef');    renderAsync(blob, childRef[0]) //渲染}fn()

</script>

blob文件流

预览excel文件(xlsx)

js

复制代码

下载包npm install xlsx@0.16.0

js

复制代码

<div class="xlsxClass"></div>const reader = newFileReader();
//通过readAsArrayBuffer将blob转换为ArrayBuffer对reader.readAsArrayBuffer(res.data) // 这里的res.data是blob文件流reader.onload = (event) => {  // 读取ArrayBuffer数据变成Uint8Array  var data = newUint8Array(event.target.result);  // 这里的data里面的类型和后面的type类型要对应  var workbook = XLSX.read(data, { type: "array" });  var sheetNames = workbook.SheetNames; // 工作表名称  var worksheet = workbook.Sheets[sheetNames[0]];  // var excelData = XLSX.utils.sheet_to_json(worksheet); //JSON  let html = XLSX.utils.sheet_to_html(worksheet);  document.getElementsByClassName('xlsxClass')[0].innerHTML = html};

pdf预览

js

复制代码

下载包 npm install pdfjs-dist我使用的是npm install pdfjs-dist@2.0.943版本,以下例子使用的是vue3+vite创建的项目以下例子通过canvas来渲染pdf

html

复制代码

<template>  <divclass="box">    <divclass="tool-bar">      <div>{{ pdfParams.pageNumber }} / {{ pdfParams.total }}</div>      <buttontype="primary":disabled="pdfParams.pageNumber == pdfParams.total" @click="nextPage">下一页      </button>      <buttontype="primary":disabled="pdfParams.pageNumber == 1" @click="prevPage">上一页</button>    </div>    <canvasid="pdf-render"></canvas>  </div></template>

js

复制代码

<script setup>import { onMounted, ref, reactive } from'vue'const pdfParams = reactive({
  pageNumber: 1, // 当前页  total: 0, // 总页数});// 不要定义为ref或reactive格式,就定义为普通的变量let pdfDoc = null;
// 这里必须使用异步去引用pdf文件,直接去import会报错,也不知道为什么onMounted(async ()=> {
  let pdfjs = awaitimport('pdfjs-dist/build/pdf')  let pdfjsWorker = awaitimport('pdfjs-dist/build/pdf.worker.entry')  pdfjs.GlobalWorkerOptions.workerSrc = pdfjsWorker  // 此文件位于public/test2.pdf  let url = ref('/test2.pdf')  pdfjs.getDocument(url.value).promise.then(doc => {    pdfDoc = doc    pdfParams.total = doc.numPages    getPdfPage(1)  })})// 加载pdf的某一页constgetPdfPage = (number) => {
  pdfDoc.getPage(number).then(page => {    const viewport = page.getViewport()    const canvas = document.getElementById('pdf-render')    const context = canvas.getContext('2d')    canvas.width = viewport.viewBox[2]    canvas.height = viewport.viewBox[3]    viewport.width = viewport.viewBox[2]    viewport.height = viewport.viewBox[3]    canvas.style.width = Math.floor(viewport.width) + 'px'    canvas.style.height = Math.floor(viewport.height) + 'px'    let renderContext = {      canvasContext: context,      viewport: viewport,      // 这里transform的六个参数,使用的是transform中的Matrix(矩阵)      transform: [1, 0, 0, -1, 0, viewport.height]    }    // 进行渲染    page.render(renderContext)  })}// 下一页功能constprevPage = () => {
  if(pdfParams.pageNumber > 1) {    pdfParams.pageNumber -= 1  } else {    pdfParams.pageNumber  = 1  }  getPdfPage(pdfParams.pageNumber)}// 上一页功能constnextPage = () => {
  if(pdfParams.pageNumber < pdfParams.total) {    pdfParams.pageNumber += 1  } else {    pdfParams.pageNumber = pdfParams.total  }  getPdfPage(pdfParams.pageNumber)}</script>

以上pdf代码引用文章:(54条消息) 前端pdf预览、pdfjs的使用_pdf.js_无知的小菜鸡的博客-CSDN博客

pdfjs官方代码:例子 (mozilla.github.io)

以上代码看不懂的地方可以查阅官方代码,大部分都是固定的写法。

以上注意点:

  • 必须异步引用pdf的文件!!!
  • pdf演示文件位于public/test2.pdf
  • transform: [1, 0, 0, -1, 0, viewport.height],使用了transform中的Matrix(矩阵)
  • 下一页和上一页功能都需要重新渲染


相关文章
DeepSeek + Xmind,1分钟自动把pdf/word文档转成思维导图
DeepSeek与Xmind结合,1分钟将PDF、Word文档转换为思维导图。只需四步:上传文档至DeepSeek,请求转换为Markdown格式,保存文件并修改后缀为.md,最后导入Xmind生成思维导图。轻松驾驭复杂文档,适用于学习笔记、工作报告、项目规划等场景,大幅提升效率!
|
4月前
|
Java API Apache
Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
【10月更文挑战第29天】Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
244 5
|
1月前
|
人工智能 编解码 文字识别
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
OCRmyPDF 是一款开源命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。
237 17
OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
|
17天前
|
文字识别 Serverless 开发工具
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
54 5
|
1月前
|
文字识别 BI
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
131 8
|
2月前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
182 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
3月前
|
人工智能 自然语言处理 JavaScript
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
Univer 是一款开源的 AI 办公工具,支持 Word、Excel 等文档处理的全栈解决方案。它具有强大的功能、高度的可扩展性和跨平台兼容性,适用于个人和企业用户,能够显著提高工作效率。
254 8
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
|
3月前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
483 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
3月前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
102 16
|
4月前
|
前端开发 JavaScript
除了 jsPDF,还有哪些前端库可以用于生成 PDF?
【10月更文挑战第21天】这些前端库都有各自的特点和优势,你可以根据具体的项目需求、技术栈以及对功能的要求来选择合适的库。不同的库在使用方法、性能表现以及功能支持上可能会有所差异,需要根据实际情况进行评估和选择。

热门文章

最新文章