文档备案控制台

开发者社区视觉智能文字识别正文

有关于古籍的ocr接口吗？

有关于古籍的ocr接口吗？

展开

收起

鸡蛋灌饼儿 2023-02-13 16:03:28 526 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

aliyun6918228952

没有上线支持私有化部署——该回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-02-13 19:38:21

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

目前来说的话阿里云文字识别OCR支持目前通用汉字的识别，古籍书籍的识别部分应该是暂不支持的，古籍文字种类较多，文字繁杂且目前对于古籍的研究还没有到最后阶段，你可以拿响应的古籍文字来尝试一下，根据返回的结果来看识别的效果，如果确实有需要可以咨询在线技术支持是否有其他产品支持古籍文字识别。

2023-02-13 16:48:53

赞同展开评论
飞云觅宙

十年摸盘键，代码未曾试。今日码示君，谁有上云事。

借助阿里达摩院AI技术，汉典重光以准确率达到97.5%的古籍识别系统，将20万页古籍从扫描图片变成在线文本，还沉淀下覆盖3万多字的在线古籍字典。从寻觅、修复、储存，再到如今的数字化、公共化，海外回归的中国古籍背后，是一代代中国人为延续民族文化香火所做的努力。在阿里内部，OCR（光学字符识别）技术团队是底蕴最为深厚的AI团队之一，常年深耕于文字图像领域。 OCR识别现代印刷品是认行（行识别），但要识别古籍必须认得每个字（单字检测）。现代常用汉字只有6000多个，算法基本能覆盖到2万字内，但由于写法多样，古籍文字多达几十万。为了开发出一套AI古籍识别系统，达摩院的技术大牛和川大的研究学者，纷纷恶补对方的知识领域。一方研究历史知识，一方学习AI技术，大家取长补短。不到10人的达摩院项目算法团队，花费两年时间，最终利用单字检测、无监督单字聚类、小样本学习、主动学习等机器学习方法，开发出了一套边识别古籍、边训练模型的系统。单字检测，就是给全书做检测，抠出古籍正文中的每个字，单独成为一张图。随着模型不断优化迭代，目前，汉典重光古籍识别系统对20万页古籍的整体识别准确率已达到97.5%，剩下有2.5%的字，仍需人工识别打标。这已是非常了不起的成就。阿里正计划，将这套技术工具连同古籍数字化平台一并捐赠，交由权威公共机构长期运营，最终将成为一个开放的网络平台，供大众检索学习。据我所知ORC工具（使用阿里云统一文字识别接口实现）。

2023-02-13 16:17:21

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别接口

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

在文字识别OCR中，什么时候可以支持？因为我看航空行程单识别接口是可以识别出来的，只是混贴不支持？

223

2

0

文字识别OCR中这个接口是否能同作业帮拍照读取作业题目？

196

1

0

文字识别OCR有可以读汽车仪表盘公里数的接口吗？

697

4

0

请问一下，文字识别OCR中OCR的票据凭证识别，是否有发票验真的接口？

301

7

0

在文字识别OCR中，请问混贴发票不支持识别ofd格式的机票吗？通过机票识别接口可以识别？

242

3

0

文字识别OCR分类器的接口请求地址在哪里看啊？

210

2

0

在钉钉中OCR识别接口怎么收费？

527

2

0

文字识别OCR 识别越南银行凭证提取凭证图片的文字调用哪个接口吗？

175

1

0

阿里云OpenAPI的身份证OCR识别接口这种报错是怎么回事嘞？

190

1

0

文字识别OCR共享资源包是这里面所有的接口共享吗？

209

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

PDF复杂表格的1:1还原引擎：跨页表格自动拼接技术实战

纸质单据结合二维码的混合式钓鱼攻击研究与防御

阿里云Qwen 3.7 Plus与Max全解析：资费、消耗、配置与多模态能力深度对比

内网环境跑通RPA自动化：企业级私有化部署实战

AI办公高频问题汇总梳理清单

热门讨论

热门文章

身份证识别ocr，每次购买需要更换url地址吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

目前OCR中如果部署在本地的话，识别速度怎么样？一张图片平均多久可以识别到

文字识别OCR API有没有Delphi的demo哦？

文字识别OCR 教育场景识别，如何分别提取出试卷的题目和选项呢？

请问文字识别OCR的TaskId这个参数是什么意思？不是只要唯一就可以吗？

文字识别OCR 行驶证识别最近总是识别错误，能看一下么？

展开全部

图像文字识别(OCR)用什么算法小结

吴恩达《机器学习》课程总结（18）应用实例：图片文字识别

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

使用图像文字识别技术获取失信黑名单

阿里云视觉智能开放平台--文字识别使用教程

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

OCR文字识别技术总结（一）

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

分析对比大模型OCR、传统OCR和深度学习OCR

展开全部

还有其他疑问?