开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR只有表格才是整块标注的?

文字识别OCR只有表格才是整块标注的?

展开
收起
-Feng、冯冯 2024-01-17 07:38:40 23 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    不只是表格,文字识别OCR可以标注整块的文本区域,这包括表格中的数据、标题、列名等,以及不规则的文字区域,如印章、弯曲文本等。在处理时,图像首先需要经过分割,识别出各个不同的区域,例如表格的各个组成部分,然后使用OCR引擎提取文本内容,由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。此外,一些Python库,例如Tesseract OCR和OpenCV也可以实现特定部分位置的OCR文本提取。

    2024-01-17 14:18:25
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云文字识别OCR在处理不同类型的文本时,并不需要全部都是整块标注的表格,据我所知OCR可以识别和提取不同种类的文本内容,包括表格、单个文本行、多个文本行等。

    对于表格识别,OCR可以识别表格的结构,并将其转化为结构化的表格数据,你可以使用阿里云的OCR服务来提取表格中的内容,例如表格的行列信息、单元格内容等。

    2024-01-17 09:17:01
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载