文字识别OCR这种存在多个表格和字段的,能支持吗?

文字识别OCR这种存在多个表格和字段的,能支持吗?27502aebfeb50902ee934b0b9bce0099.png
e7d6ad7655c72b198c306ac6e7cc0488.png
eb233613005d795002f2862d535c35d9.png

展开
收起
三分钟热度的鱼 2024-04-10 17:07:47 39 分享 版权
阿里云 AI 助理回答

是的,阿里云的文字识别OCR服务能够支持包含多个表格和字段的文档识别,并提供结构化的输出结果。以下是详细的功能说明和相关配置:

1. 表格识别能力

阿里云OCR支持对多种类型的表格进行有效识别,包括有线表格、条纹表格和无线表格。具体功能如下: - 表格智能解析:可以从表格中提取出表格样式、表格内容、文本键值对(Key-Value)以及表格键值对(Table KV)等信息。 - 复杂表格处理:对于无线表格或只有横线没有竖线的表格,可以通过设置参数 IsLineLessTable 来指定表格类型,从而提升识别效果。 - 手写表格支持:如果表格为手写内容,可以启用 IsHandWritingTable 参数以优化识别效果。

2. 字段提取与结构化输出

OCR服务不仅能够识别表格内容,还可以对文档中的字段进行结构化提取,适用于合同、票据、报告等场景。主要功能包括: - 逻辑层级结构提取:通过文档结构化识别功能,可以提取文档的逻辑层级结构、文本内容、表格内容、Key-Value键值字段以及样式信息。 - 多格式输出:支持将表格识别结果导出为Excel或HTML格式文件,方便后续处理。可以通过设置 OutputTableExcelOutputTableHtml 参数来启用此功能。

3. 高精度识别

针对复杂文档背景和光照环境,OCR全文识别高精版提供了以下优势: - 抗干扰能力:支持多格式版面、复杂背景和光照条件下的精准识别。 - 自动排异功能:对于带有印章或手印的文档,可实现印章擦除后识别,确保文字内容的准确性。 - 高阶功能支持:支持低置信度过滤、图案检测等功能,进一步提升识别质量。

4. 多语言与多场景支持

OCR服务支持国际主流语系的自动语言分类判定,并返回对应语言的文字信息。无论是中文、英文还是其他小语种,都可以高效识别并提取字段。

5. 重要提醒

  • 响应时间:开启表格导出(如Excel或HTML)或单字识别等功能会增加接口的响应时间,请根据实际需求选择是否启用这些功能。
  • 文件大小限制:目前支持单页文档的结构化识别,PDF文档大小不超过100M且页数不超过100页,图片文档数量不超过30张。

综上所述,阿里云OCR服务完全能够满足包含多个表格和字段的文档识别需求,并提供灵活的配置选项以适应不同场景的应用。如果您需要进一步测试或开发,可以通过调试页面提供的代码示例完成API接入。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理