文字识别OCR这种竖着 并且长度不订的表格 识别 是没办法识别吗?

文字识别OCR这种竖着 并且长度不订的表格 识别 是没办法识别吗?lQLPJxQxamaOrGDNAgHNA1ywtLD-8VRKb4UE0zJxNcCnAA_860_513.png
lQLPJxvnBRVnVGDNAfzNA5ywGa_UWfDjuusE0zJ4kMCnAA_924_508.png
lQLPJxnps-EBKODNAeXNA2SwJiAdGoNtZpUE0zKA4UCnAA_868_485.png

展开
收起
三分钟热度的鱼 2023-08-22 15:58:41 147 分享 版权
6 条回答
写回答
取消 提交回答
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    阿里云表格识别,是阿里云官方自研OCR文字识别产品,支持对多种表格格式(有线表格、条纹表格、无线表格)进行智能文字识别并结构化输出识别结果。
    阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势,可以使用阿里云自定义模板进行调整。
    image.png

    2023-08-24 14:30:07
    赞同 展开评论
  • 自定义表格模板是针对固定版式的单页有框线表格表单数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同版式数据的自定义结构化识别抽取。经过配置调优的模板识别准确率可达85%以上。文档
    image.png

    2023-08-22 20:39:35
    赞同 展开评论
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    阿里云文字识别OCR服务通常可以识别水平方向上的表格,但对于竖向排列并且长度不固定的表格来说,可能会存在一些识别困难。OCR技术在处理复杂表格时可能会遇到以下问题:
    image.png
    image.png

    1. 表格结构解析:竖向排列的表格可能使得表格结构的解析更加复杂,因为文字和行之间的边界不再是水平的。这可能导致OCR算法在正确分割和提取表格内容时遇到困难。

    2. 单元格内容识别:由于竖向排列的表格布局与传统的水平表格布局不同,OCR算法需要适应不同的文本方向,并正确识别每个单元格中的内容。这可能需要使用特定的算法或模型来处理。

    尽管如此,OCR技术在某些情况下仍然可以处理部分竖向表格,并提取其中的文本信息。为了改善竖向表格的识别准确性,您可以尝试以下方法:

    • 预处理图像:对图像进行预处理,例如旋转、调整透视变换等,使表格变为水平方向。这样可以更容易地利用OCR技术进行表格内容的识别。

    • 指定区域识别:如果您知道表格在图像中的位置,可以通过指定特定区域进行识别,以减少干扰并提高识别准确性。

    • 自定义模板:针对特定的竖向表格,您可以尝试创建自定义模板,指定每个单元格的位置和结构,以便更准确地提取表格内容。

    2023-08-22 20:35:17
    赞同 展开评论
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云的文字识别OCR可以处理包括表格在内的各种文本,包括竖着的表格。但是,对于长度不固定的表格,OCR可能会出现误差或者无法识别的情况,因为长度不固定的表格往往存在行与行之间的间距不同、列与列之间的宽度不同以及单元格合并等情况,这些都会影响识别结果。
    image.png

    同时,如果表格中的字体、字号、颜色等也与OCR所设定的默认识别范围不同,也可能会影响表格的识别效果。因此,在使用OCR进行表格识别时,需要根据实际情况调整OCR的参数或者对识别结果进行后处理。看一下下面的类型:
    image.png

    2023-08-22 19:04:01
    赞同 展开评论
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    这个情况,建议使用OCR的自定义表格模板。

    文档地址:自定义表格模板

    image.png

    调整模块的时候要注意,框体长度每次都是固定的,不能识别动态的。

    image.png

    2023-08-22 17:09:27
    赞同 展开评论
  • 列表型表格部分要用右边表格栏标注的表格标注工具标注的,详情可见https://help.aliyun.com/document_detail/603349.html?spm=a2c4g.603346.0.0.40425530a7Z2xf#c45693bea17cl a0e58ef2602e6a60879e3972e2840890.png
    此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-08-22 16:15:59
    赞同 展开评论
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理