读光OCR-文字识别技术解读与应用案例分析
大数据上云特惠活动系列直播,阿里巴巴高级算法专家永攀对读光OCR-文字识别技术和行业应用进行讲述。OCR的本质是识别图片中的文字,即在复杂的图片背景下中对所需目标文字进行识别提取。主要从OCR商业应用场景、OCR算法和读光产品进行了介绍。展示读光OCR在在文字识别中强大的应用。
阿里巴巴直播防控中的实人认证技术
直播作为近来新兴的互动形态,已经成为近几年最风生水起的行业之一。如何在提高用户体验的同时准确的判断账号背后真实的人?本文来带你一探究竟。
玩 High API 系列之:拍照翻译
谷歌翻译前些日子推出了一个很有意思的功能,就是通过手机获取拍摄照片,然后实时对图片中的文字进行翻译。终端用户不需要输入文字,去国外对不懂的地标、文字等只要拍照就能随时进行翻译了。看起来很炫酷有没有?好在,在API时代,我们自己也可以利用现成的API来快速实现同样的功能。
C&C++图形图像处理开源库
Google三维APIO3D
O3D 是一个开源的 WebAPI 用来在浏览器上创建界面丰富的交互式的 3D 应用程序。这是一种基于网页的可控3D标准。此格式期望真正的基于浏览器,独立于操作系统之外,并且支持主流的3D显卡,这样就可以在网页中实现效果逼真的3D动画。
浅谈OCR之Onenote 2010
原文:浅谈OCR之Onenote 2010
上一次我们讨论了Tesseract OCR引擎的用法,作为一款老牌的OCR引擎,目前已经开源,最新版本3.0中更是加入了中文OCR功能,再加上Google的更新、维护,可以说是潜力很大,值得期待。