发票PDF在线合并小工具

简介: 在公司报销的时候虽然已经有了电子发票,但是贴票还是需要将发票打印出来贴上,如果只有一两张也就算了,如果几十张.. 呵呵,光胶水我都不够用的,找了好多工具、在线版本都不合心意,烦死,自己做个自己喜欢的吧。

在公司报销的时候虽然已经有了电子发票,但是贴票还是需要将发票打印出来贴上,如果只有一两张也就算了,如果几十张.. 呵呵,光胶水我都不够用的,找了好多工具、在线版本都不合心意,烦死,自己做个自己喜欢的吧。
二次更新 : 发票PDF在线合并来啦
查了下lib库,看了下API 开干。

准备

  • nodejs 环境
  • pdf-lib module
  • N张发票PDF文件

文档准备

本来想着,将pdf读成图片然后缩放在一个PDF中,结果发现pdf-lib直接就可以将pdf进行缩放,到时省事了。

pdf-lib github地址: https://github.com/Hopding/pdf-lib

代码

这里用到的API很少,主要有以下几个:

embedPdf  :  嵌入PDF文档 
scale           :  将PDF进行缩放    
addPage    :  添加一个新的pdf页面
drawPage  : 将PDF写入新pdf页面

完整代码:

/**
 * 年底,将12个月份的发票合并在一个pdf中。
 * ps.在线的各种不中意,线下的各种收费加水印。
 * npm i pdf-lib
 */
const pdfLib = require('pdf-lib')
const PDFDocument = pdfLib.PDFDocument
// import { PDFDocument } from 'pdf-lib'
const fs = require('fs')
const path = require('path')
//这里需要修改为自己的路径
const folderPath = `I:\\huafei\\huafei\\2020pdf`
  ; (async function () {
    // Create a new PDFDocument
    const pdfDoc = await PDFDocument.create()
    // Add a blank page to the document
    let page = pdfDoc.addPage()

    let lineNum = 1 //每行几张发票

    let fileList = fs.readdirSync(folderPath)
    let i = 0
    fileList.sort((a, b) => {
      let aa = path.basename(a)
      let bb = path.basename(b)
      return aa - bb
    })
    for (let file of fileList) {
      let filePath = path.join(folderPath, file)
      let fileStream = fs.readFileSync(filePath)
      const [americanFlag] = await pdfDoc.embedPdf(fileStream)
      const dims = americanFlag.scale(1 / lineNum)
      // Draw the JPG image in the center of the page
      let opts = {
        ...dims,
        x: (i % lineNum) * (dims.width - 20) - 5,
        y:
          page.getHeight() -
          Math.floor(i / lineNum) * (dims.height + 5) -
          dims.height,
      }
      //如果当前高度不足,则创建新页面
      console.log(opts)
      if (opts.y < 0) {
        //换页面
        page = pdfDoc.addPage()
        i = 0
        opts = {
          ...dims,
          x: (i % lineNum) * (dims.width - 20) - 5,
          y:
            page.getHeight() -
            Math.floor(i / lineNum) * (dims.height + 5) -
            dims.height,
        }
      }
      page.drawPage(americanFlag, opts)
      i++
    }
    // Serialize the PDFDocument to bytes (a Uint8Array)
    const pdfBytes = await pdfDoc.save()
    fs.writeFileSync(path.join(folderPath, 'total.pdf'), pdfBytes)
  })()

以上,核心代码在github都有,直接拿过来稍微改动即可。
接下来,准备将这个小工具做成web服务,扔到我的小工具中...

相关文章
|
3月前
|
人工智能 文字识别 自然语言处理
熊猫 OCR 识别软件下载,支持截图 OCR、PDF 识别、多语言翻译的免费全能工具,熊猫OCR识别
本文介绍了几款实用的图文识别软件,包括熊猫OCR、Umi-OCR和天若OCR_本地版。熊猫OCR功能强大,支持多窗口操作、AI找图找色、OCR识别等;Umi-OCR免费且高效,具备截图OCR、批量处理等功能;天若OCR界面简洁,适合快速文字识别。文章还提供了下载链接及软件特点、界面展示等内容,便于用户根据需求选择合适的工具。
274 36
|
5月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
1765 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
4月前
|
人工智能 搜索推荐 算法
PDF 转 JPG 图片小工具:CodeBuddy 助力解决转换痛点
在 PDF 转 JPG 的实际应用中,用户普遍面临转换质量差、批量处理效率低、格式兼容性不足以及编程实现困难等痛点。而 CodeBuddy 凭借智能代码生成与优化、实时错误诊断修复、助力代码学习拓展,以及支持多场景适配与个性化定制等强大的 AI 编程能力,精准直击这些难题。使用 CodeBuddy 开发 Python PDF 转 JPG 小工具,能够有效提升转换效率与质量,降低开发门槛和成本,为用户带来高效、优质的文件格式转换体验。
143 16
|
4月前
|
人工智能 自然语言处理 安全
CodeBuddy 开发本地 PDF 转图工具
市场上的 PDF 转图片工具存在收费昂贵、功能有限、隐私安全风险等痛点,而使用 CodeBuddy 实现的本地 PDF 批量转图片工具可以有效解决这些问题。CodeBuddy 的强大编程能力让我们可以快速开发出满足需求的工具,而且工具可以在本地运行,保证了文件的隐私安全。此外,工具还支持批量处理和自定义功能,提高了工作效率。如果你也有 PDF 转图片的需求,不妨尝试使用 CodeBuddy 来实现一个属于自己的工具。
123 11
|
4月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
141 10
|
5月前
|
文字识别 BI
【工具教程】批量PDF和图片OCR识别指定区域文字自动改图片名字,多个区域一次性批量识别改名批量重命名
本内容介绍了一款用于企业档案、医院病历及办公文件管理的图片和PDF文字识别工具。通过框选识别区域,软件可批量提取关键信息,实现文件重命名或导出为表格,极大提升管理效率。支持图片与PDF两种模式,操作简单,适用于合同、病历、报告等场景。提供详细步骤指导,包含区域设置、文件导入、批量处理及结果校验等功能。
696 8
|
7月前
|
人工智能 文字识别 安全
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。
515 6
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
|
8月前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
654 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
8月前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
1107 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
9月前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
1648 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式

热门文章

最新文章