开发者社区> 问答> 正文

用什么语言读取pdf文件:报错

我想能结构化的读取pdf文件里的内容,比如书签, 标注,文本内容。请问这个用什么语言,什么技术能实现。最好是VBA或者javascript之类的脚本语言,谢了!

展开
收起
kun坤 2020-06-06 22:39:23 634 0
1 条回答
写回答
取消 提交回答
  • 任何能读二进制的语言都可######我知道大概所有语言都可以进行IO操作,可是如果自己写IO不觉得很麻烦吗。我意思是有没有什么技术可以进行结构化的读取, 谢谢!######

    我听说过PDF.js

    http://blog.163.com/hongshaoguoguo@126/blog/static/1804698120135300348446/

    ######感谢!######这个问题真是问出了水平。。######回复 @keepgoing_ : github里面应该有现成的源码。我可能搞错了,你说的是结构化读取,我看成了io读取了,没有其他的意思######看来这位朋友大牛,不过你冷嘲热讽我可不服你,不如拿出点干货。我问的是结构化读取,拿出个方案来,让我崇拜下。######只要有文件解析器就可以,一个自己写,一个用别人完成开源的。 Github 搜索 pdf 即可
    2020-06-06 22:39:27
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
对象存储实战指南-试读 立即下载
OpenAnolis 龙蜥操作系统开源社区技术创新白皮书 立即下载
使用CNFS搭建弹性Web服务 立即下载