文档备案控制台

开发者社区视觉智能文字识别正文

OCR现在支持pdf转word（或者html转word）吗？

OCR现在支持pdf转word（或者html转word）吗？

展开

收起

冰激凌甜筒 2023-04-03 15:28:36 443 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

4 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

阿里云OCR支持多种格式的文档识别，包括PDF、JPG、PNG、BMP、GIF等。其中，PDF格式的文档识别需要使用通用文字识别（高精度版）的API接口，该接口可以识别PDF文件中的文字，并返回JSON格式的数据。如果您想将PDF转换为Word或HTML，您可以使用第三方工具或自己编写代码来实现。

阿里云OCR也支持HTML格式的文档识别，需要使用表格识别的API接口，该接口可以识别HTML文件中的表格内容，并返回HTML、JSON或XLSX格式的数据。如果您想将HTML转换为Word，您也可以使用第三方工具或自己编写代码来实现。

2023-04-23 22:47:17

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

功能支持的

2023-04-03 22:40:31

赞同展开评论
微笑向日葵

调用PDF转Word接口_文档智能-阿里云帮助中心https://help.aliyun.com/document_detail/450843.html，可以调用上面的API此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-04-03 16:49:49

赞同展开评论
凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

支持，OCR现在支持多种格式转换。

2023-04-03 15:40:54

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

PDF ocr 印刷文字识别pdf PDF word PDF html HTML PDF

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

智能媒体管理实现word、pdf快速预览，如何操作？

193

1

0

文字识别OCR ocr可以识别pdf么？

444

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

361

2

0

文档智能接口可以识别图片、PDF、Excel、Word的内容，然后自动分析内容吗？

475

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

247

1

0

智能媒体管理word PDF 如何预览？

217

0

0

在文字识别OCR中，带有水印的pdf解析应该使用哪个产品？

307

3

0

在文字识别OCR中，阿里云有直接识别PDF文件的OCR吗？

339

3

0

在文字识别OCR中，请教一个关于通过pdf文字识别获得文字后如何结构化整理的问题?

292

1

0

pdf里面有个表格，我想通过文字识别OCR识别成结构化数据，可以吗？

424

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

AI大模型赋能企业跨端远程办公与文件处理：架构设计与落地实践

企业大模型本地化部署与数据安全实践：从 RAG 权限过滤到审计闭环

AI大模型赋能企业跨端远程办公与文件处理：基于 RAG 的权限检索与会议纪要任务化实践

AI大模型赋能企业跨端远程办公与文件处理：别急着做 RAG，先把 PDF、表格和扫描件解析对

AI大模型赋能企业跨端远程办公与文件处理：用版本比对自动生成变更摘要的工程方法

热门讨论

热门文章

文字识别OCR报错403是什么意思?

我购买了OCR证照识别，请问在哪里看appcode呢？

文字识别OCR目前有哪些情况会导致识别失败？

请问ocr能支持识别南非身份证吗？

OCR中有接口能够识别学历证书上的，学校名称，专业，编号等信息的吗？

文字识别OCR经常出现这个错误是什么原因呢？

文字识别OCR的图片识别异常相同图片部分机型无法识别，这是为什么？

文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？

文字识别OCR想识别题干，选项，答案，解析有什么办法吗？

ocr通用文字识别后付费和资源包价格是不一样吗？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

吴恩达《机器学习》课程总结（18）应用实例：图片文字识别

浪潮发布业界最高GPU密度的SR-AI整机柜

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

阿里云视觉智能开放平台--文字识别使用教程

分析对比大模型OCR、传统OCR和深度学习OCR

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

合合信息——用智能文字识别技术赋能古彝文原籍数字化

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

展开全部

还有其他疑问?