YunOS场景文字识别
该文章先介绍常见的文字识别方法,然后介绍YunOS在场景文字识别方面取得的进展、结果和技术方案。将重点讲解技术方案的两个主要部分:1)基于全卷积网络的从局部到整体的文字行检测方法;2)基于BLSTM-CTC-Seq2Seq的文字行识别方案。
AI魔幻行为大赏:细数机器视觉的9大应用场景
本文主要介绍了机器视觉的主要应用场景,目前绝大部分数字信息都是以图片或视频的形式存在的,若要对这些信息进行有效分析利用,则要依赖于机器视觉技术的发展,虽然目前已有的技术已经能够解决很多问题,但离解决所有问题还很遥远,因此机器视觉的应用前景还是非常广阔的。
[雪峰磁针石博客]免费的好用的OCR工具 人脸识别等图像识别工具
tesseract -- 推荐
Tesseract 已经有 30 年历史,开始它是惠普实验室的一款专利软件,然后在 2005 年开源,自 2006 年后由 Google 赞助进行后续的开发和维护。
在 1995 年 Tesseract 曾是世界前三的 OCR 引擎,而且在现在的免费 OCR 引擎中,其识别精度也仍然是出类拔萃的。
读光OCR-文字识别技术解读与应用案例分析
大数据上云特惠活动系列直播,阿里巴巴高级算法专家永攀对读光OCR-文字识别技术和行业应用进行讲述。OCR的本质是识别图片中的文字,即在复杂的图片背景下中对所需目标文字进行识别提取。主要从OCR商业应用场景、OCR算法和读光产品进行了介绍。展示读光OCR在在文字识别中强大的应用。
图像文字识别(OCR)用什么算法小结
说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内。
1.文字识别步骤
1.1detection:找到有文字的区域(proposal)。
1.2classification:识别区域中的文字。
2.文字检测
文字检测主要有两条线,两步法和一步法。
阿里巴巴直播防控中的实人认证技术
直播作为近来新兴的互动形态,已经成为近几年最风生水起的行业之一。如何在提高用户体验的同时准确的判断账号背后真实的人?本文来带你一探究竟。
玩 High API 系列之:拍照翻译
谷歌翻译前些日子推出了一个很有意思的功能,就是通过手机获取拍摄照片,然后实时对图片中的文字进行翻译。终端用户不需要输入文字,去国外对不懂的地标、文字等只要拍照就能随时进行翻译了。看起来很炫酷有没有?好在,在API时代,我们自己也可以利用现成的API来快速实现同样的功能。