开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR 就这种格式 我希望能得到单位:编号:单独key 的对应值,需要用那种识别?

文字识别OCR 就这种格式 我希望能得到单位:编号:单独key 的对应值,需要用那种识别?
0f023845df4004608adec944ec79416e.png

展开
收起
青城山下庄文杰 2023-07-31 12:21:09 63 0
4 条回答
写回答
取消 提交回答
  • 自定义KV模版:https://help.aliyun.com/document_detail/603348.html?spm=a2c4g.603347.0.0.54f55e3fqQqsUe
    【适用于业务数据样本少(少于20张),经过配置调优的模板识别准确率可达85%+】
    单据票证信息抽取:https://help.aliyun.com/document_detail/603350.html?spm=a2c4g.603348.0.0.760c5f34pAufCt
    【在图像质量较好情况下,通过100+训练样本标注,调优后模型识别准确率可超95%+】
    按需测试 都有500次免费额度-此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2023-08-01 10:07:12
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    您可以使用OCR文本识别技术中的关键字识别功能,来提取指定关键字的对应值。具体操作步骤如下:

    首先,您需要确定需要提取的关键字,例如"单位"、"编号"、"单独key"等。

    然后,使用OCR技术对文本进行识别,获取文本的识别结果。

    对识别结果进行关键字匹配,找到关键字对应的位置和内容。

    提取关键字对应的值,例如"单位"对应的值为"ABC公司","编号"对应的值为"123456","单独key"对应的值为"789"等。

    2023-07-31 21:03:04
    赞同 展开评论 打赏
  • 如果你希望从OCR识别结果中提取单位、编号和单独的键值对,你可以使用基于自然语言处理(NLP)的技术来完成这个任务。OCR工具本身主要用于识别文字,而提取特定的字段则需要进一步的处理。

    下面是一个示例的处理流程:

    1. 使用OCR工具进行文字识别:首先,使用OCR工具对待处理的文档或图像进行文字识别,获得原始的识别结果。

    2. 文本清理和预处理:对识别结果进行清理和预处理,例如去除无关字符、修正识别错误等。

    3. 文本分析和提取:使用自然语言处理技术(如正则表达式、命名实体识别、关键词提取等),针对单位、编号和键值对进行文本分析和提取。这可以通过编写代码或使用相应的NLP库和工具来实现。

    4. 单位和编号提取:根据你的需求,确认单位和编号的规则或特征,并使用相应的文本分析技术来提取它们。例如,可以使用正则表达式匹配特定的文本模式,或者使用命名实体识别技术来识别特定的单位名称。

    5. 键值对提取:同样,根据你的需求,使用适当的文本分析技术来提取键值对。这可能涉及到识别特定的键(如"编号")和相应的值,并将它们匹配成对。

    2023-07-31 20:47:41
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    您好,读光OCR识别接口均支持图片格式数据,包括:.jpg/.jpeg/.png/.bmp./gif./tiff./webp,请注意图片大小不超过10M,最短边大于15像素,最长边不超过8192像素;
    支持PDF|PDF格式接口:增值税发票识别、混贴发票识别、火车票识别、航空行程单识别、定额发票识别、通用机打发票识别、增值税发票卷票识别

    2023-07-31 17:37:07
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载