前端实现文件预览(pdf、excel、word、图片)

简介: 前端实现文件预览(pdf、excel、word、图片)

图片预览

iframe标签能够将另一个HTML页面嵌入到当前页面中,我们的图片也能够使用iframe标签来进行展示。

js

复制代码

<iframe  :src="图片地址"         style="z-index: 1000; height:650px; width: 100%; margin: 0 auto"         sandbox="allow-scripts allow-top-navigation allow-same-origin allow-popups"/>

sandbox这个属性如果是单纯预览图片可以不使用,该属性对呈现在 iframe 框架中的内容启用一些额外的限制条件。属性值可以为空字符串(这种情况下会启用所有限制),也可以是用空格分隔的一系列指定的字符串。

  • allow-scripts: 允许嵌入的浏览上下文运行脚本(但不能创建弹窗)。如果没有使用该关键字,就无法运行脚本。
  • allow-top-navigation: 允许将框架内所加载页面中的超链接导航到父级窗口
  • allow-same-popups: 允许弹窗 (例如 window.open, target="_blank")。如果没有使用该关键字,相应的功能将自动被禁用。
  • allow-same-origin: 如果没有使用该关键字,嵌入的浏览上下文将被视为来自一个独立的源,这将使 same-origin policy 同源检查失败。使用了这个属性,那么当前页面和iframe打开的页面视为同源。

word文档预览(docx)

js

复制代码

先下载npm包npm i docx-preview --save

js

复制代码

<div class="docxRef"></div><script>import { renderAsync } from'docx-preview';

functionfn() {
// 这里的res.data是 blob文件流,如果自己的不是blob文件流// 可以通过URL.createObjectURL(参数) 参数为File格式,转换为blob文件流    let blob = res.data    let childRef = document.getElementsByClassName('docxRef');    renderAsync(blob, childRef[0]) //渲染}fn()

</script>

blob文件流

预览excel文件(xlsx)

js

复制代码

下载包npm install xlsx@0.16.0

js

复制代码

<div class="xlsxClass"></div>const reader = newFileReader();
//通过readAsArrayBuffer将blob转换为ArrayBuffer对reader.readAsArrayBuffer(res.data) // 这里的res.data是blob文件流reader.onload = (event) => {  // 读取ArrayBuffer数据变成Uint8Array  var data = newUint8Array(event.target.result);  // 这里的data里面的类型和后面的type类型要对应  var workbook = XLSX.read(data, { type: "array" });  var sheetNames = workbook.SheetNames; // 工作表名称  var worksheet = workbook.Sheets[sheetNames[0]];  // var excelData = XLSX.utils.sheet_to_json(worksheet); //JSON  let html = XLSX.utils.sheet_to_html(worksheet);  document.getElementsByClassName('xlsxClass')[0].innerHTML = html};

pdf预览

js

复制代码

下载包 npm install pdfjs-dist我使用的是npm install pdfjs-dist@2.0.943版本,以下例子使用的是vue3+vite创建的项目以下例子通过canvas来渲染pdf

html

复制代码

<template>  <divclass="box">    <divclass="tool-bar">      <div>{{ pdfParams.pageNumber }} / {{ pdfParams.total }}</div>      <buttontype="primary":disabled="pdfParams.pageNumber == pdfParams.total" @click="nextPage">下一页      </button>      <buttontype="primary":disabled="pdfParams.pageNumber == 1" @click="prevPage">上一页</button>    </div>    <canvasid="pdf-render"></canvas>  </div></template>

js

复制代码

<script setup>import { onMounted, ref, reactive } from'vue'const pdfParams = reactive({
  pageNumber: 1, // 当前页  total: 0, // 总页数});// 不要定义为ref或reactive格式,就定义为普通的变量let pdfDoc = null;
// 这里必须使用异步去引用pdf文件,直接去import会报错,也不知道为什么onMounted(async ()=> {
  let pdfjs = awaitimport('pdfjs-dist/build/pdf')  let pdfjsWorker = awaitimport('pdfjs-dist/build/pdf.worker.entry')  pdfjs.GlobalWorkerOptions.workerSrc = pdfjsWorker  // 此文件位于public/test2.pdf  let url = ref('/test2.pdf')  pdfjs.getDocument(url.value).promise.then(doc => {    pdfDoc = doc    pdfParams.total = doc.numPages    getPdfPage(1)  })})// 加载pdf的某一页constgetPdfPage = (number) => {
  pdfDoc.getPage(number).then(page => {    const viewport = page.getViewport()    const canvas = document.getElementById('pdf-render')    const context = canvas.getContext('2d')    canvas.width = viewport.viewBox[2]    canvas.height = viewport.viewBox[3]    viewport.width = viewport.viewBox[2]    viewport.height = viewport.viewBox[3]    canvas.style.width = Math.floor(viewport.width) + 'px'    canvas.style.height = Math.floor(viewport.height) + 'px'    let renderContext = {      canvasContext: context,      viewport: viewport,      // 这里transform的六个参数,使用的是transform中的Matrix(矩阵)      transform: [1, 0, 0, -1, 0, viewport.height]    }    // 进行渲染    page.render(renderContext)  })}// 下一页功能constprevPage = () => {
  if(pdfParams.pageNumber > 1) {    pdfParams.pageNumber -= 1  } else {    pdfParams.pageNumber  = 1  }  getPdfPage(pdfParams.pageNumber)}// 上一页功能constnextPage = () => {
  if(pdfParams.pageNumber < pdfParams.total) {    pdfParams.pageNumber += 1  } else {    pdfParams.pageNumber = pdfParams.total  }  getPdfPage(pdfParams.pageNumber)}</script>

以上pdf代码引用文章:(54条消息) 前端pdf预览、pdfjs的使用_pdf.js_无知的小菜鸡的博客-CSDN博客

pdfjs官方代码:例子 (mozilla.github.io)

以上代码看不懂的地方可以查阅官方代码,大部分都是固定的写法。

以上注意点:

  • 必须异步引用pdf的文件!!!
  • pdf演示文件位于public/test2.pdf
  • transform: [1, 0, 0, -1, 0, viewport.height],使用了transform中的Matrix(矩阵)
  • 下一页和上一页功能都需要重新渲染


相关文章
|
25天前
|
人工智能 搜索推荐 算法
PDF 转 JPG 图片小工具:CodeBuddy 助力解决转换痛点
在 PDF 转 JPG 的实际应用中,用户普遍面临转换质量差、批量处理效率低、格式兼容性不足以及编程实现困难等痛点。而 CodeBuddy 凭借智能代码生成与优化、实时错误诊断修复、助力代码学习拓展,以及支持多场景适配与个性化定制等强大的 AI 编程能力,精准直击这些难题。使用 CodeBuddy 开发 Python PDF 转 JPG 小工具,能够有效提升转换效率与质量,降低开发门槛和成本,为用户带来高效、优质的文件格式转换体验。
71 16
|
25天前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
67 10
|
2月前
|
文字识别 BI
【工具教程】批量PDF和图片OCR识别指定区域文字自动改图片名字,多个区域一次性批量识别改名批量重命名
本内容介绍了一款用于企业档案、医院病历及办公文件管理的图片和PDF文字识别工具。通过框选识别区域,软件可批量提取关键信息,实现文件重命名或导出为表格,极大提升管理效率。支持图片与PDF两种模式,操作简单,适用于合同、病历、报告等场景。提供详细步骤指导,包含区域设置、文件导入、批量处理及结果校验等功能。
242 8
|
3月前
|
人工智能 文字识别 自然语言处理
1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智能 OCR 等特性,特别适合需要隐私保护的文档处理场景。
156 1
DeepSeek + Xmind,1分钟自动把pdf/word文档转成思维导图
DeepSeek与Xmind结合,1分钟将PDF、Word文档转换为思维导图。只需四步:上传文档至DeepSeek,请求转换为Markdown格式,保存文件并修改后缀为.md,最后导入Xmind生成思维导图。轻松驾驭复杂文档,适用于学习笔记、工作报告、项目规划等场景,大幅提升效率!
|
3月前
|
JavaScript 前端开发 UED
PDF在线预览实现:如何使用vue-pdf-embed实现前端PDF在线阅读
本文详细介绍了如何在Vue项目中使用vue-pdf-embed实现PDF文件的在线展示。从项目初始化、插件集成到高级功能的实现和部署优化,希望对你有所帮助。在实际项目中,灵活运用这些技术可以大大提升用户体验和项目质量。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
|
4月前
|
文字识别 Serverless 开发工具
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
411 5
|
5月前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
454 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
4月前
|
文字识别 BI
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
444 8
|
3月前
|
文字识别 UED Python
对双栏 | 单双栏混合 | 图表文字混合的复杂布局的图片OCR识别(对布局复杂的整个pdf进行OCR识别)
这个故事告诉我们要多尝试不同的库和引擎,尤其是需求比较偏门或者少见的时候。同一个方向不同的库所擅长的领域是不一样的。 博客不应该只有代码和解决方案,重点应该在于给出解决方案的同时分享思维模式,只有思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~