开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR"长文档信息抽取-小样本" 和其他2种有什么区别?

文字识别OCR文档中只有2种预置模型 但控制台有3种
那么文字识别OCR"长文档信息抽取-小样本" 和其他2种有什么区别?

https://help.aliyun.com/zh/document-mind/product-overview/long-document-information-extraction?spm=a2c4g.11186623.0.0.6be1401cXUU9Uc

展开
收起
三分钟热度的鱼 2024-03-27 15:10:12 68 0
2 条回答
写回答
取消 提交回答
  • 文字识别OCR中的"长文档信息抽取-小样本"模型与其他两种预置模型的主要区别在于其支持用户自定义抽取字段的能力。具体分析如下:

    1. 自定义化抽取:"长文档信息抽取-小样本"模型允许用户根据自己的需求定制要抽取的字段,这提供了更高的灵活性和适应性。
    2. 模型训练:该模型通过平台提供的可视化引导,帮助用户完成数据标注和模型训练的过程,使得即使是没有算法基础的用户也能够进行模型的训练和部署。
    3. 应用场景:长文档信息抽取功能适用于从大段文本中提取结构化信息的场景,这对于后续的数据处理和分析非常有用。

    总的来说,"长文档信息抽取-小样本"模型的特点在于其对用户需求的定制化能力以及较低的使用门槛,这使得它能够更好地适应不同用户在长文档信息提取方面的具体需求。

    2024-03-29 15:10:10
    赞同 展开评论 打赏
  • 阿里云大降价~

    文字识别OCR中的"长文档信息抽取-小样本"与其他两种预置模型区别主要体现在以下几个方面:

    1. 自定义化抽取:"长文档信息抽取-小样本"模型支持用户自定义需要抽取的字段,允许通过可视化引导完成数据标注和模型训练,以实现对非结构化、多版式文档的高精度信息提取。
    2. 小样本学习能力:该模型基于Prompt思想,能够实现开放域的信息抽取,并支持零样本或小样本学习,即在只有少量标注数据的情况下也能进行有效的信息抽取。
    3. 技术集成:"长文档信息抽取-小样本"可能集成了如PP-OCRv4这样的先进文字识别模型和大型语言模型(LLM),以提高识别结果的分析能力和关键信息的提取精度。

    综上所述,"长文档信息抽取-小样本"模型主要针对需要从长文档中提取特定信息的场景,尤其适用于标注样本较少的情况,而其他两种预置模型可能适用于不同的场景或具有不同的功能特点。在选择模型时,应根据具体的应用需求和可用资源来决定最合适的模型类型。

    2024-03-27 15:46:47
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载