Node convert pdf to json

简介: Node convert pdf to json

node 版本 v10.9.0 npm 版本 v6.2.0 依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }

使用 pdf2json npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady 回调函数中获取 json 数据

server.js

// pdf to json
let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => {
  console.log(errData)
});
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");

也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady 回调函数中使用 pdfParser.getRawTextContent() 获取文本数据

server.js

let fs = require("fs"),
    PDFParser = require("pdf2json");
let pdfParser = new PDFParser(this, 1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});
pdfParser.loadPDF("./pdf/1.PDF");
目录
相关文章
|
6月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
6月前
|
JSON 关系型数据库 数据库
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
【python】Python将100个PDF文件对应的json文件存储到MySql数据库(源码)【独一无二】
|
6月前
|
JSON JavaScript API
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
|
1月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
75 2
|
3月前
|
JavaScript
NodeJs——Parsing error: Cannot read file '.../tsconfig.json'.eslint
NodeJs——Parsing error: Cannot read file '.../tsconfig.json'.eslint
34 0
|
4月前
|
JavaScript
Vue如何查看node版本---- package.json 文件中的 engines
Vue如何查看node版本---- package.json 文件中的 engines
|
6月前
|
编解码 前端开发 JavaScript
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
node实战——koa实现文件下载和图片/pdf/视频预览(node后端储备知识)
296 1
|
6月前
|
JSON 资源调度 JavaScript
Node.js专题讲解 第2期 package.json
Node.js专题讲解 第2期 package.json
79 0
|
6月前
|
JSON JavaScript Java
Nodejs 第三章(Npm Package json)
Nodejs 第三章(Npm Package json)
45 0
|
28天前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道