开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR长文档信息抽取这个应用类型 上传20张图片训练可以上传 不同模版的pdf吗 ?

文字识别OCR长文档信息抽取这个应用类型 上传20张图片训练可以上传 不同模版的pdf吗 ?还是只能用一个模版不同内容?

展开
收起
三分钟热度的鱼 2024-06-19 18:49:41 38 0
1 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR长文档信息抽取自定义模型至少需要50张训练数据,才能获得相对较好的识别抽取效果。不可以上传不同模版的PDF,需要是同类任务的数据用于模型训练与评测,可以理解为一个模版的不同内容
    image.png
    其他内容参考:文档

    2024-06-20 18:35:22
    赞同 1 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
对象存储实战指南-试读 立即下载
OpenAnolis 龙蜥操作系统开源社区技术创新白皮书 立即下载
使用CNFS搭建弹性Web服务 立即下载