文档备案控制台

开发者社区问答正文

用什么语言读取pdf文件：报错

我想能结构化的读取pdf文件里的内容，比如书签，标注，文本内容。请问这个用什么语言，什么技术能实现。最好是VBA或者javascript之类的脚本语言，谢了！

展开

收起

kun坤 2020-06-06 22:39:23 700 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

任何能读二进制的语言都可######我知道大概所有语言都可以进行IO操作，可是如果自己写IO不觉得很麻烦吗。我意思是有没有什么技术可以进行结构化的读取，谢谢！######

我听说过PDF.js

http://blog.163.com/hongshaoguoguo@126/blog/static/1804698120135300348446/
######感谢！######这个问题真是问出了水平。。######回复 @keepgoing_ : github里面应该有现成的源码。我可能搞错了，你说的是结构化读取，我看成了io读取了，没有其他的意思######看来这位朋友大牛，不过你冷嘲热讽我可不服你，不如拿出点干货。我问的是结构化读取，拿出个方案来，让我崇拜下。######只要有文件解析器就可以，一个自己写，一个用别人完成开源的。 Github 搜索 pdf 即可

2020-06-06 22:39:27

赞同展开评论

问答分类：

JavaScript 前端开发

问答标签：

PDF文件 PDF报错 PDF文件报错 PDF读取语言PDF

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

大写PDF后缀的文件智能媒体管理是否支持预览？

362

1

0

OSS上传的pdf文件如何调整成html格式显示

260

1

0

通过oss url pdf 转png 报错SSLException

215

1

0

钉钉里如何预览PDF格式文件？

673

2

0

在文字识别OCR中，阿里云有直接识别PDF文件的OCR吗？

202

3

0

文档智能 api文档里有word，测试页面只能是图片类或pdf，这个接口到底是否支持word文件？

167

1

0

文档智能pdf 文件里图片中文字能提取到吗？

124

1

0

上云 k8s 上后？生成的 word 和 Excel 文件中文都是正常的，pdf 文件乱码是为什么？

1407

1

0

智能媒体管理在测试文档转换的时候，发现将.doc文件转成pdf，这个有没有什么参数需要设定？

106

1

0

函数计算word转PDF 调用报错是什么原因呢？

152

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

云端部署coclaw报错

相关文章

文本字符数统计在线工具核心JS实现

不用写一行代码！阿里云上线 Qwen3 一键部署，秒开大模型对话界面

10 分钟部署 Qwen3！阿里云 FunctionAI 模板实测，成本低至 ¥0.5/小时

深度体验 Qwen3 MoE 架构！阿里云 FunctionAI 支持 0.6B~235B 全系列

vLLM + SGLang + Ollama 自动适配！阿里云 Qwen3 部署智能选引擎

还有其他疑问?