文档备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR有一个【表格信息抽取】创建模型后，就一直卡住了，能帮忙看下吗？

文字识别OCR有一个【表格信息抽取】创建模型后，就一直卡住了，能帮忙看下吗？

数据是上方发票样式的 20个

展开

收起

三分钟热度的鱼 2023-10-18 20:33:57 206 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

vohelon

表格信息抽取https://help.aliyun.com/document_detail/603351.html?spm=a2c4g.11186623.0.i5#83b71210a9o05

创建「表格信息抽取」流程如下图，开始模型训练需要至少 20 个训练数据。

提示建议：

数据准备有什么具体要求？

数据集可上传图片、文档、压缩包；

文档，支持不超过20M且后缀为pdf的文件，仅支持单页pdf；

图片，支持不超过10M且后缀为jpg、jpeg、png的文件；

压缩包，仅支持zip格式，且单zip包不超过20M。

单张图片最长边不超过8192像素，最短边不小于15像素。当长边超过1024像素时，长宽比不超过50 ：1。

至少准备20-30份以上同类任务的数据用于模型训练与评测。

如何获得更好识别效果？

在产品功能范围的任务，数据质量越高，识别与抽取效果越好，字迹清晰端正的数据能有更高的准确率。

单字大小保持在10-50像素内，以获得较好的识别效果。

数据来源于真实业务场景，且类型与版式完整覆盖。

2023-10-20 09:58:46

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别表格印刷文字识别ocr 印刷文字识别信息

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR如果是公司使用，是不是开通对公 AccessKey 账号？

280

2

0

文字识别OCR用单机版的客户端，添加数字员工提示内部异常，怎么解决？

219

1

0

文字识别OCR新上线的单证票据信息抽取跟原来的表格信息抽取的区别是什么？

306

3

0

文字识别OCR单证票据信息抽取跟原来的表格信息抽取的区别是什么？

318

2

0

文字识别OCR添加body失败，怎么办？

218

1

0

文字识别OCR这部分使用，集团内APP使用，该和谁沟通？

183

1

0

在文字识别OCR中，这是啥意思？

178

0

0

在文字识别OCR中，如果图片上有签章，用表格识别的话，OCR内部是否可以预处理签章后识别呢？

282

2

0

在文字识别OCR中，可以申请试用离线ocr功能吗？

195

2

0

样式完全相同的图片，我想把图片中的英语单词识别出来，文字识别OCR哪种产品比较适合？

208

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

Ж-CEH：锚定结构存在论—— 从宇宙虚无到视觉张量的统一框架

阿里云Qwen 3.7 Plus与Max全解析：资费、消耗、配置与多模态能力深度对比

内网环境跑通RPA自动化：企业级私有化部署实战

AI办公高频问题汇总梳理清单

Deepseek大语言模型在多语种手稿数字化中的工程实践与策略

热门讨论

热门文章

身份证识别ocr，每次购买需要更换url地址吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

OCR中java 代码示例，返回这个是什么意思？

文字识别OCR目前有哪些情况会导致识别失败？

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

目前OCR中如果部署在本地的话，识别速度怎么样？一张图片平均多久可以识别到

文字识别OCR API有没有Delphi的demo哦？

ocr云有没有哪个有算法可以检测是否“光盘”？就是盘子里的饭菜吃完了

展开全部

图像文字识别(OCR)用什么算法小结

使用图像文字识别技术获取失信黑名单

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

OCR文字识别技术总结（一）

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

分析对比大模型OCR、传统OCR和深度学习OCR

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

展开全部

还有其他疑问?