文字识别-最新-阿里云开发者社区-阿里云

游客gmnthj624deqw

|

8月前

|

PHP 文字识别

|

问答

php 调用阿里云文字识别传入needRotate和needSortPage时报错

268 0 0

老乡别走

|

9月前

|

机器学习/深度学习文字识别 Shell

|

博文

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

针对铁路货运物流单存档需求，本项目基于WPF与飞桨OCR技术，实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域，系统提取关键信息（如车号、批次号）并生成规范文件名，提升档案管理效率与检索准确性，支持PDF及图像文件处理。

1320 48 49

老乡别走

|

机器学习/深度学习缓存文字识别

|

博文

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

竖排繁体文字识别系统适用于古籍数字化、港澳台文档、书法作品、历史档案及学术研究等场景，支持图像预处理、自动旋转、OCR识别、竖转横与繁转简。通过咕嘎OCR与OpenCC技术，实现高效精准的文字转换与编辑。

1659 3 3

老乡别走

|

C#

|

博文

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

本工具可批量提取PDF中的合同编号、日期、发票号等关键信息，支持PDF自定义区域提取并自动重命名文件，适用于合同管理、发票处理、文档归档和数据录入场景。基于iTextSharp库实现，提供完整代码示例与百度、腾讯网盘下载链接，助力高效处理PDF文档。

1555 40 40

游客3ovjb4ylkci6m

|

文字识别

|

问答

调用【身份证OCR文字】接口返回403(Forbidden)

492 0 0

游客exh3rzrojww4s

|

文字识别 Java Maven

|

问答

OCR识别报错检测不到我的包，是为什么？

533 1 0

老乡别走

|

文字识别 Serverless 开发工具

|

博文

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术，可自动提取学生信息并录入Excel，便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤，包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南，帮助用户高效处理PDF文件。链接： - 百度网盘：[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘：[链接](https://share.weiyun.com/a77jklXK)

2875 5 5

老乡别走

|

文字识别

|

博文

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

在生活和工作中，我们常需处理大量PDF文件，如银行单据、税收单据等。手动处理效率低下，而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理，大幅提高效率。该工具通过获取PDF各区域内容坐标，导入并处理文件，最终将信息提取至表格，并根据关键信息对PDF进行重命名，方便管理和查找。

3070 47 49

kuaitongai

|

人工智能文字识别自然语言处理

|

博文

保单AI识别技术及代码示例解析

车险保单包含基础信息、车辆信息、人员信息、保险条款及特别约定等关键内容。AI识别技术通过OCR、文档结构化解析和数据校验，实现对保单信息的精准提取。然而，版式多样性、信息复杂性、图像质量和法律术语解析是主要挑战。Python代码示例展示了如何使用PaddleOCR进行保单信息抽取，并提出了定制化训练、版式分析等优化方向。典型应用场景包括智能录入、快速核保、理赔自动化等。未来将向多模态融合、自适应学习和跨区域兼容性发展。

1224 29 29

kuaitongai

|

机器学习/深度学习文字识别自然语言处理

|

博文

分析对比大模型OCR、传统OCR和深度学习OCR

OCR技术近年来迅速普及，广泛应用于文件扫描、快递单号识别、车牌识别及日常翻译等场景，极大提升了便利性。其发展历程从传统方法（基于模板匹配和手工特征设计）到深度学习（采用CNN、LSTM等自动学习高级语义特征），再到大模型OCR（基于Transformer架构，支持跨场景泛化和少样本学习）。每种技术在特定场景下各有优劣：传统OCR适合实时场景，深度学习OCR精度高但依赖大量数据，大模型OCR泛化能力强但训练成本高。未来，大模型OCR将结合多模态预训练，向通用文字理解方向发展，与深度学习OCR形成互补生态，最大化平衡成本与性能。

7145 11 11

游客z2kfhh7zefrtm

|

问答

票据凭证识别->混贴发票识别，提供的发票地址公网可以访问，依旧报错，怎么处理？

436 1 0

p4bvykgu6pzx2

|

对象存储文字识别

|

问答

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

357 2 0

打不哭

|

文字识别数据可视化 Serverless

|

博文

阿里云多模态数据信息提取解决方案评测报告

本文基于阿里云多模态数据信息提取解决方案，对其进行全面评测。该方案利用百炼大模型等技术，支持文本、图像、音频和视频处理，显著提升效率并降低成本。体验中，文本和图片信息提取功能表现出色，部署便捷且准确率高。优势包括易用性、多模态支持和高性价比，但文档完善性和模型定制性等方面仍有提升空间。建议增强模型可定制性、跨模态融合能力及丰富文档案例，以进一步优化用户体验。

1030 30 30

游客yh7tsbh7jc7qk

|

文字识别

|

问答

ocr身份证识别调用

313 1 0

游客ilgedy3qgkcva

|

Perl Swift

|

问答

swift pod 'AlibabacloudOcrApi20210707'之后报错

393 2 0

游客yl2qngv4bkz3c

|

文字识别

|

问答

文字识别OCR，client.recognizeAdvancedWithOptions 返回null

379 2 0

圆葱猪肉包

|

问答

银行卡照片在阿里云是无法识别信息的，但是其他的渠道可以，这种情况怎么解决

281 1 0

圆葱猪肉包

|

文字识别

|

问答

文字识别OCR 全文高精版识别结果，识别出的邮箱账号里少了个字母l，这个帮看下能修复么？

323 2 0

圆葱猪肉包

|

文字识别

|

问答

文字识别OCR ocr可以识别pdf么？

455 3 0

三分钟热度的鱼

|

文字识别

|

问答

文字识别OCR的标注任务导入支持其它标注平台的数据转换格式以后导入么？

357 1 0

三分钟热度的鱼

|

文字识别

|

问答

文字识别OCR行驶证识别报403，如何解决？

364 3 0

三分钟热度的鱼

|

文字识别

|

问答

文字识别OCR标注中心这里进去报错了，怎么解决？

382 1 0

三分钟热度的鱼

|

文字识别

|

问答

文字识别OCR这个图片必须是阿里云的么？

315 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR统一识别的服务不小心开通，只要不用就没事吧？刚问了人工服务说是后付费服务关闭不了

312 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR如果上传做训练的标注集里面有图片有问题，想不做标注，废弃处理。该怎么操作？

299 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR有专门开通企业账号的入口是吧？

332 3 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR购买了增值税发票识别，现在想换成混贴发票识别，是需要额外购买嘛，还是说可以有优惠？

300 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR使用混贴接口，请求体的形式是form—data，此时附件的参数名应该是啥？

346 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR如果是公司使用，是不是开通对公 AccessKey 账号？

318 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR增值税发票识别可以实现多个发票识别嘛？

398 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR要识别营业执照是不要开通这个服务才行？

269 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR按照官方的传参，系统返回code: 400, 怎么解决？

473 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR type 传 Advanced 是能识别图片的，但是传这个参数就不行，咋整？

344 2 0

嘟嘟嘟嘟嘟嘟

|

PHP 文字识别

|

问答

文字识别OCR用composer安装运行，系统显示Fatal error这个是示例本身的问题吗？

269 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR的部署私服大概价格是多少呀？

378 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR混贴发票接口识别的内容包含增值税接口的嘛？

307 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR直接在调试里下载了完整工程，但是运行的时候会报一个空指针的错，怎么解决？

395 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

372 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR，名片文字识别，可以按使用量付费吗？

287 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR这个地方只要content,不要X，Y，怎么写程序？

307 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR 识别发票是不是只能一张一张的识别，多张发票在一个图片里也只能识别一张是吗？

442 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR最近增值税税发票偶现负数发票识别成正数。什么情况嘞？

451 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR什么时候能支持这类发票？

341 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR 识别过路费，怎么识别不了？

244 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR查看账号在某个时间段内是否触发限流怎么操作？

325 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

阿里的云账号，可以使用文字识别OCR这个服务吗？

402 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR这两个程序可合并成一个吗？

312 1 0

嘟嘟嘟嘟嘟嘟

|

文字识别

|

问答

文字识别OCR身份证接口直接用余额可以吗？而且显示有赠送次数。

294 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别 API

|

问答

文字识别OCR户口页识别用的这个接口地址能识别户主页吗？

265 2 0

嘟嘟嘟嘟嘟嘟

|

文字识别 API

|

问答

文字识别OCR户口页主页和常住人口页在api调用中是通过哪个字段控制的？

246 2 0

文字识别

最新

综合

php 调用阿里云文字识别 传入needRotate和needSortPage时报错

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

调用【身份证OCR文字】接口返回403(Forbidden)

OCR识别报错检测不到我的包，是为什么？

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

保单AI识别技术及代码示例解析

分析对比大模型OCR、传统OCR和深度学习OCR

票据凭证识别->混贴发票识别，提供的发票地址公网可以访问，依旧报错，怎么处理？

OCR入参图片链接 不支持 OSS 带有效时间的图片链接 ？

阿里云多模态数据信息提取解决方案评测报告

ocr身份证识别调用

swift pod 'AlibabacloudOcrApi20210707'之后报错

文字识别OCR，client.recognizeAdvancedWithOptions 返回null

银行卡照片在阿里云是无法识别信息的，但是其他的渠道可以，这种情况怎么解决

文字识别OCR 全文高精版识别结果，识别出的邮箱账号里少了个字母l，这个帮看下能修复么？

文字识别OCR ocr可以识别pdf么？

文字识别OCR的标注任务导入 支持其它标注平台的数据 转换格式以后导入么？

文字识别OCR行驶证识别 报403，如何解决？

文字识别OCR标注中心这里进去报错了，怎么解决？

文字识别OCR这个图片必须是阿里云的么？

文字识别OCR统一识别的服务不小心开通，只要不用就没事吧？刚问了人工服务说是后付费服务关闭不了

文字识别OCR如果上传做训练的标注集里面有图片有问题，想不做标注，废弃处理。该怎么操作？

文字识别OCR有专门开通企业账号的入口是吧？

文字识别OCR购买了增值税发票识别，现在想换成混贴发票识别，是需要额外购买嘛，还是说可以有优惠？

文字识别OCR使用混贴接口，请求体的形式是form—data，此时附件的参数名应该是啥？

文字识别OCR如果是公司使用，是不是开通对公 AccessKey 账号？

文字识别OCR增值税发票识别可以实现多个发票识别嘛？

文字识别OCR要识别营业执照 是不要开通这个服务才行？

文字识别OCR按照官方的传参，系统返回code: 400, 怎么解决？

文字识别OCR type 传 Advanced 是能识别图片的 ，但是传这个参数就不行，咋整？

文字识别OCR用composer安装运行，系统显示Fatal error这个是示例本身的问题吗？

文字识别OCR的部署私服大概价格是多少呀？

文字识别OCR混贴发票接口识别的内容包含增值税接口的嘛？

文字识别OCR直接在调试里下载了完整工程，但是运行的时候会报一个空指针的错，怎么解决？

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

文字识别OCR，名片文字识别，可以按使用量付费吗？

文字识别OCR这个地方只要content,不要X，Y，怎么写程序？

文字识别OCR 识别发票是不是只能一张一张的识别，多张发票在一个图片里 也只能识别一张是吗？

文字识别OCR最近增值税税发票偶现负数发票识别成正数。什么情况嘞？

文字识别OCR什么时候能支持这类发票？

文字识别OCR 识别过路费，怎么识别不了？

文字识别OCR查看账号在某个时间段内是否触发限流怎么操作？

阿里的云账号，可以使用文字识别OCR这个服务吗？

文字识别OCR这两个程序可合并成一个吗？

文字识别OCR身份证接口直接用余额可以吗？而且显示有赠送次数。

文字识别OCR户口页识别用的这个接口地址 能识别户主页吗？

文字识别OCR户口页主页和常住人口页在api调用中是通过哪个字段控制的？

活跃用户

相关产品

php 调用阿里云文字识别传入needRotate和needSortPage时报错

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

文字识别OCR的标注任务导入支持其它标注平台的数据转换格式以后导入么？

文字识别OCR行驶证识别报403，如何解决？

文字识别OCR要识别营业执照是不要开通这个服务才行？

文字识别OCR type 传 Advanced 是能识别图片的，但是传这个参数就不行，咋整？

文字识别OCR 识别发票是不是只能一张一张的识别，多张发票在一个图片里也只能识别一张是吗？

文字识别OCR户口页识别用的这个接口地址能识别户主页吗？