node 版本 v10.9.0
npm 版本 v6.2.0
依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }
使用 pdf2json
npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady
回调函数中获取 json 数据
server.js
// pdf to json let fs = require("fs"), PDFParser = require("pdf2json"); let pdfParser = new PDFParser(); pdfParser.on("pdfParser_dataError", errData => { console.log(errData) }); pdfParser.on("pdfParser_dataReady", pdfData => { fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => { if (err) throw err; console.log('The file has been saved!') }); }); pdfParser.loadPDF("./pdf/1.PDF");
也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady
回调函数中使用 pdfParser.getRawTextContent()
获取文本数据
server.js
let fs = require("fs"), PDFParser = require("pdf2json"); let pdfParser = new PDFParser(this, 1); pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) ); pdfParser.on("pdfParser_dataReady", pdfData => { fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => { if (err) throw err; console.log('The file has been saved!') }); }); pdfParser.loadPDF("./pdf/1.PDF");