将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
[雪峰磁针石博客]免费的好用的OCR工具 人脸识别等图像识别工具
tesseract -- 推荐
Tesseract 已经有 30 年历史,开始它是惠普实验室的一款专利软件,然后在 2005 年开源,自 2006 年后由 Google 赞助进行后续的开发和维护。
在 1995 年 Tesseract 曾是世界前三的 OCR 引擎,而且在现在的免费 OCR 引擎中,其识别精度也仍然是出类拔萃的。
读光OCR-文字识别技术解读与应用案例分析
大数据上云特惠活动系列直播,阿里巴巴高级算法专家永攀对读光OCR-文字识别技术和行业应用进行讲述。OCR的本质是识别图片中的文字,即在复杂的图片背景下中对所需目标文字进行识别提取。主要从OCR商业应用场景、OCR算法和读光产品进行了介绍。展示读光OCR在在文字识别中强大的应用。
信息与通信工程——重要国际学术会议和国际顶级期刊(仅供参考)
<p><strong>一、信息与通信工程的重要国际学术会议</strong></p>
<p>主要包含两类:</p>
<p>A类会议:本学科最顶尖级水平的国际会议;<br></p>
<p>B类会议:学术水平较高、组织工作成熟、按一定时间间隔系列性召开的国际会议。<br></p>
<p><br></p>
<p>A类会议(序号不表示优先顺序)<br></p>
<p>序号 / 英文名称
厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。
【云栖大会】阿里研究院:阿里巴巴人工智能应用的五部曲
从今年年初的AlphaGo人机大战之后,人工智能成为了产业界最受关注的一大热点。其实,从1956年人工智能概念出现迄今已经60年的历史了,人工智能也经历了几番起起落落。为何今天成为了业界热点呢?归结起来,实际上是三大技术基础的成熟和发展奠基了人工智能的落地。