备案控制台

开发者社区人工智能文章正文

第 38 章 OCR - Optical Character Recognition

2018-01-10 1674

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

自定义KV模板，自定义KV模板 500次/账号

企业资质识别，企业资质识别 200次/月

车辆物流识别，车辆物流识别 200次/月

简介：

目录

38.1. Tesseract
38.2. cuneiform - multi-language OCR system

https://help.ubuntu.com/community/OCR

38.1. Tesseract

查找Tesseract安装包

$ apt-cache search Tesseract
ocrodjvu - tool to perform OCR on DjVu documents
slimrat - GUI application for automated downloading from file hosters
slimrat-nox - CLI application for automated downloading from file hosters
tesseract-ocr - Command line OCR tool
tesseract-ocr-deu - tesseract-ocr language files for German text
tesseract-ocr-deu-f - tesseract-ocr language files for the German Fraktur script
tesseract-ocr-dev - Development files for the tesseract command line OCR tool
tesseract-ocr-eng - tesseract-ocr language files for English text
tesseract-ocr-fra - tesseract-ocr language files for French text
tesseract-ocr-ita - tesseract-ocr language files for Italian text
tesseract-ocr-nld - tesseract-ocr language files for Dutch text
tesseract-ocr-por - tesseract-ocr language files for Brasilian Portuguese text
tesseract-ocr-spa - tesseract-ocr language files for Spanish text
tesseract-ocr-vie - tesseract-ocr language files for Vietnamese text

$ sudo apt-get install tesseract-ocr

$ convert test.jpg test.tif
$ tesseract test.tif test
$ cat test.txt

原文出处：Netkiller 系列手札
本文作者：陈景峯
转载请与作者联系，同时请务必标明文章原始出处和作者信息及本声明。

文章标签：

文字识别

文字识别

关键词：

印刷文字识别optical character

玄学酱

目录

相关文章

算精通

|

人工智能文字识别 API

OCR（Optical Character Recognition，光学字符识别）

OCR（Optical Character Recognition，光学字符识别）是一种将图像中的文字转换成可编辑文本的技术。OCR 技术可以应用于各种场景，例如自动化办公、图像文本识别、车牌识别、身份证识别、发票识别等。

算精通

232 1 1

ansondroider

|

文字识别 Java API

Android OCR(Optical Character Recognition) API 初探

Android OCR(Optical Character Recognition) API 初探

ansondroider

303 0 0

玄学酱

|

文字识别

第 38 章 OCR - Optical Character Recognition

玄学酱

1230 0 0

三分钟热度的鱼

|

5月前

|

文字识别

印刷文字识别使用问题之是否支持非标发票的识别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

57 7 7

三分钟热度的鱼

|

5月前

|

存储文字识别运维

印刷文字识别使用问题之如何开通统一识别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

49 6 6

三分钟热度的鱼

|

5月前

|

文字识别容器

印刷文字识别使用问题之是否支持医疗检测报告识别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

59 6 6

三分钟热度的鱼

|

5月前

|

人工智能文字识别开发工具

印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

42 1 1

三分钟热度的鱼

|

5月前

|

人工智能 JSON 文字识别

印刷文字识别使用问题之如何数电发票进行识别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

57 1 1

三分钟热度的鱼

|

5月前

|

文字识别数据安全/隐私保护 iOS开发

印刷文字识别使用问题之如何识别礼品册上的卡号、密码信息

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

63 1 1

三分钟热度的鱼

|

5月前

|

机器学习/深度学习文字识别 API

印刷文字识别使用问题之是否支持识别香港和澳门食品经营许可证

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

32 1 1

热门文章

最新文章

[雪峰磁针石博客]免费的好用的OCR工具人脸识别等图像识别工具

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

看懂二维码识别OCR：从算法到 API Java 接入代码

Halcon解决方案指南（18）OCR--字符识别

Postman调用阿里云云市场的通用文字识别接口

针对11.2 RAC丢失OCR和Votedisk所在ASM Diskgroup的恢复手段

基于opencv-python的身份证识别（KNN与OCR两种算法）

R1-001 Linux平台查看OCR位置

PaddlePaddle：在 Serverless 架构上十几行代码实现 OCR 能力

一文看懂增值税发票识别OCR：从技术原理到 API Java 示例代码接入

印刷文字识别产品使用合集之购买了共享资源包该怎么使用

印刷文字识别产品使用合集之TaskId这个参数是什么意思

印刷文字识别产品使用合集之手写识别服务，能单独识别出来手写的选项吗

印刷文字识别产品使用合集之阿里云文字识别OCR demo主要有哪些

印刷文字识别产品使用合集之证件扫描的置信度字段，这个有什么用

印刷文字识别产品使用合集之证件规格不统一，可以用全文识别吗

印刷文字识别产品使用合集之标注阶段设定了两个独立的字段，但在返回的信息中却合并成了一个字段如何解决

印刷文字识别产品使用合集之有识别二维码并将识别二维码的内容通过接口返回的功能吗

印刷文字识别产品使用合集之怎么进行牌匾文字识别

印刷文字识别产品使用合集之部署失败如何解决

相关电子书

更多

阿里云智能-印刷文字识别OCR-产品介绍

阿里巴巴读光OCR

印刷文字识别算法设计与在线服务

相关实验场景

更多

极速搭建基于人工智能的OCR识别应用

下一篇

阿里云无影云电脑免费试用，最长可试用3个月