Node convert pdf to json

简介: Node convert pdf to json

node 版本 v10.9.0 npm 版本 v6.2.0 依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }

使用 pdf2json npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady 回调函数中获取 json 数据

server.js

// pdf to json
let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => {
  console.log(errData)
});
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");

也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady 回调函数中使用 pdfParser.getRawTextContent() 获取文本数据

server.js

let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser(this, 1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");
目录
相关文章
|
3月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
3月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
3月前
|
JSON JavaScript API
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
|
6天前
|
JavaScript
NodeJs——Parsing error: Cannot read file '.../tsconfig.json'.eslint
NodeJs——Parsing error: Cannot read file '.../tsconfig.json'.eslint
5 0
|
1月前
|
JavaScript
Vue如何查看node版本---- package.json 文件中的 engines
Vue如何查看node版本---- package.json 文件中的 engines
|
3月前
|
编解码 前端开发 JavaScript
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
130 1
|
3月前
|
JSON 资源调度 JavaScript
Node.js专题讲解 第2期 package.json
Node.js专题讲解 第2期 package.json
67 0
|
3月前
|
JSON JavaScript Java
Nodejs 第三章(Npm Package json)
Nodejs 第三章(Npm Package json)
38 0
|
10月前
|
JSON JavaScript 前端开发
Node.js 项目中 package-lock.json 文件的作用
Node.js 项目中 package-lock.json 文件的作用
|
1天前
|
JSON 前端开发 API
【淘系】商品详情属性解析(属性规格详情图sku等json数据示例返回参考),淘系API接口系列
在淘宝(或天猫)平台上,商品详情属性(如属性规格、详情图、SKU等)是商家在发布商品时设置的,用于描述商品的详细信息和不同规格选项。这些信息对于消费者了解商品特性、进行购买决策至关重要。然而,直接通过前端页面获取这些信息的结构化数据(如JSON格式)并非直接暴露给普通用户或开发者,因为这涉及到平台的商业机密和数据安全。 不过,淘宝平台提供了丰富的API接口(如淘宝开放平台API),允许有资质的开发者或合作伙伴通过编程方式获取商品信息。这些API接口通常需要注册开发者账号、申请应用密钥(App Key)和秘钥(App Secret),并遵守淘宝的API使用协议。