文档备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR有一个【表格信息抽取】创建模型后，就一直卡住了，能帮忙看下吗？

文字识别OCR有一个【表格信息抽取】创建模型后，就一直卡住了，能帮忙看下吗？

数据是上方发票样式的 20个

展开

收起

三分钟热度的鱼 2023-10-18 20:33:57 165 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

vohelon

表格信息抽取https://help.aliyun.com/document_detail/603351.html?spm=a2c4g.11186623.0.i5#83b71210a9o05

创建「表格信息抽取」流程如下图，开始模型训练需要至少 20 个训练数据。

提示建议：

数据准备有什么具体要求？

数据集可上传图片、文档、压缩包；

文档，支持不超过20M且后缀为pdf的文件，仅支持单页pdf；

图片，支持不超过10M且后缀为jpg、jpeg、png的文件；

压缩包，仅支持zip格式，且单zip包不超过20M。

单张图片最长边不超过8192像素，最短边不小于15像素。当长边超过1024像素时，长宽比不超过50 ：1。

至少准备20-30份以上同类任务的数据用于模型训练与评测。

如何获得更好识别效果？

在产品功能范围的任务，数据质量越高，识别与抽取效果越好，字迹清晰端正的数据能有更高的准确率。

单字大小保持在10-50像素内，以获得较好的识别效果。

数据来源于真实业务场景，且类型与版式完整覆盖。

2023-10-20 09:58:46

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别表格印刷文字识别ocr 印刷文字识别信息

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR的24978模型在线体验报错如何解决？

141

0

0

文字识别OCR模型ID:24711训练报错，怎么解决？

143

0

0

文字识别OCR 这个试卷切题接口能否把识别出来的区域切成一个一个的图片？

189

1

0

我在训练身份证反面的文字识别OCR模型，训练出来的模型为什么只能识别横向拍的照片？竖着拍的识别不出来

222

1

0

文字识别OCR这个识别不太理想。是需要开发来调整吗？

119

2

0

文字识别OCR需要识别五线谱的话，有没有对应的模型？

156

2

0

文字识别OCR在训练身份证反面的OCR识别模型，标注时如果只标注kv区域，帮忙分析下是哪里的问题？

113

0

0

文字识别OCR这个公章统一识别识别出来的结果少了个“广”字，这个你们会修复么？

147

1

0

对于文字识别OCR，这一张票无法识别是什么原因？

144

2

0

在文字识别OCR中想拍照或直接扫描后提取标签上相关信息，形成Excel报表能实现吗？

176

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

AI解说大师Agent Skill详解：如何让智能体具备自主任务规划能力？

如何使用 Python 操作 Excel 图片：插入、提取与压缩

电子版征信pdf修改软件，数据渲染Smarty引擎

公司迁云上阿里云？阿里云有哪些活动政策补贴？看完这篇文章就知道了

阿里云 AI 产品免费试用：超30款 AI 产品和7000万大模型 tokens 免费体验

热门讨论

热门文章

文字识别OCR目前有哪些情况会导致识别失败？

文字识别OCR长文档信息抽取这个应用类型上传20张图片训练可以上传不同模版的pdf吗？

OCR之前还用的好好的，怎么突然错了？

身份证识别ocr，每次购买需要更换url地址吗？

文字识别OCR有没有文章自然段落识别的接口呀？

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR看recognizeInvoice的文档，识别成功code为啥是null？

文字识别OCR现在有pdf识别发票的接口吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

OCR有没有c#调用票据识别示例？网页上面的调用不成功。难道要买了才可以调试吗？

展开全部

图像文字识别(OCR)用什么算法小结

OCR文字识别技术总结（一）

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

印刷文字识别使用问题之如何识别pdf文件中的表格

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

分析对比大模型OCR、传统OCR和深度学习OCR

展开全部

还有其他疑问?