Node convert pdf to json

简介: Node convert pdf to json

node 版本 v10.9.0 npm 版本 v6.2.0 依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }

使用 pdf2json npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady 回调函数中获取 json 数据

server.js

// pdf to json
let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => {
  console.log(errData)
});
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");

也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady 回调函数中使用 pdfParser.getRawTextContent() 获取文本数据

server.js

let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser(this, 1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");
目录
相关文章
|
2月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
2月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
2月前
|
JSON JavaScript API
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
|
9天前
|
JavaScript
Vue如何查看node版本---- package.json 文件中的 engines
Vue如何查看node版本---- package.json 文件中的 engines
|
2月前
|
编解码 前端开发 JavaScript
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
78 1
|
2月前
|
JSON 资源调度 JavaScript
Node.js专题讲解 第2期 package.json
Node.js专题讲解 第2期 package.json
65 0
|
9月前
|
JSON JavaScript 前端开发
Node.js 项目中 package-lock.json 文件的作用
Node.js 项目中 package-lock.json 文件的作用
node编译TS时,tsconfig.json中的基础配置 与 webpack编译TS时webpack.config.js中的基础配置
node编译TS时,tsconfig.json中的基础配置 与 webpack编译TS时webpack.config.js中的基础配置
|
Web App开发 JavaScript 测试技术
软件版本号规范与命名原则(node.js与package.json依赖包规范)
### 1、软件版本号 一般来讲大部分的软件版本号分3段,比如 A.B.C + A 表示大版本号,一般当**软件整体重写**,或**出现不向后兼容的改变**时,增加A,A为零时表示软件还在**开发阶段**。 + B 表示功能更新,**出现新功能时增加B** + C 表示小修改,如**修复bug**,只要有修改就增加C ### 2、版本号的修饰词 + 日期版本号:表示发布日期 + alpha: 内部测试版,bug较多,主要是修改和实现功能 + beta: 测试版,大部分bug已修,主要是修改UI和小bug等 + rc: 即将作为正式版发布 + lts: 长期维护 + release版: 该
378 1