厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩

本文涉及的产品
教育场景识别,教育场景识别 200次/月
个人证照识别,个人证照识别 200次/月
自定义KV模板,自定义KV模板 500次/账号
简介: 近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。

近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。(竞赛结果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1
e095e4e548cd283fe2eab7e77428c921

据了解,ICDAR(International Conference on Document Analysis and Recognition)具有OCR领域的奥斯卡盛会之称,是全球OCR领域公认最权威的比赛之一。

当前,OCR技术被广泛应用于多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。

阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包含了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。

为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。

据介绍,图灵实验室的研究人员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷积核获得更好的感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因此相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字识别模型,图灵实验室的研究人员在主流方案的基础上,做了全新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,提高了识别效率。

阿里安全图灵实验室研究人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和识别服务,以及离线ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支撑阿里生态中的商品内容安全、业务安全、平台治理、评价、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)产品,输出给第三方客户使用。

目前,ATL Cangjie OCR服务日均调用量几亿次,可为客户提供稳定的技术保障。

目录
相关文章
|
4月前
|
物联网 开发者
可图Kolors-LoRA风格故事挑战赛决赛入围名单出炉!决赛赛题首公开,奉上夺奖秘籍!
8月初,魔搭社区联合阿里云天池平台,结合快手旗下开源文生图大模型可图Kolors 模型,推出文生图创作大赛,30支队伍脱颖而出,晋级复赛。
可图Kolors-LoRA风格故事挑战赛决赛入围名单出炉!决赛赛题首公开,奉上夺奖秘籍!
|
5月前
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
本文提供了2023年华数杯全国大学生数学建模竞赛A题的完整论文,深入分析了隔热材料的结构优化控制研究,包括建立数学模型、求解单根纤维的热导率、优化织物结构参数以及考虑对流换热影响的模型调整,旨在开发出具有更优隔热性能的新型织物。
87 0
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
|
机器学习/深度学习 人工智能 自然语言处理
2023谷歌研究学者计划名单公布:清华姚班、北大等多位校友在列
2023谷歌研究学者计划名单公布:清华姚班、北大等多位校友在列
278 0
|
机器学习/深度学习 人工智能 自然语言处理
比拼“读懂人话”,阿里AI总分首次超越人类成绩
比拼“读懂人话”,阿里AI总分首次超越人类成绩
181 0
|
算法 C语言
【CSDN编程竞赛·第四期】个人参赛经历和个人建议
大家好,我前不久参加了官方举办的CSDN编程比赛,官方举办了四期,第一期的时候没看到,错过了,后面的每一期我都参加了,总的感觉来说,还可以。下面我具体说说第四期相关经验吧。
|
机器学习/深度学习 人工智能 自然语言处理
高中教师养出40亿美元超级独角兽,发布ChatGPT最大平替
高中教师养出40亿美元超级独角兽,发布ChatGPT最大平替
120 0
|
人工智能 算法 大数据
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
Competition——互联网比赛(编程相关):国内外各种互联网比赛举办时间、条件、细节等详细攻略
Competition——互联网比赛(编程相关):国内外各种互联网比赛举办时间、条件、细节等详细攻略
Competition——互联网比赛(编程相关):国内外各种互联网比赛举办时间、条件、细节等详细攻略
|
机器学习/深度学习 人工智能 安全
托福被取消?这个英语测试AI出题,2天出分,全球900+大学承认
托福被取消?这个英语测试AI出题,2天出分,全球900+大学承认
242 0
|
机器学习/深度学习 数据采集 人工智能
《阿里云天池大赛赛题解析---机器学习篇》新书正式发布!
2020年10月10日下午13点,在杭州西溪宾馆西溪厅,由阿里云计算有限公司、英特尔(中国)有限公司联合举办的“数字人体”研讨大会成功举行,期间《阿里云天池大赛赛题解析---机器学习篇》新书发布会也在会上成功召开。 阿里云市场营销和公共事务总经理刘湘雯、达摩院人工智能工程中心负责人华先胜、阿里云计算平台事业部总裁贾扬清、电子工业出版社博文视点总经理郭立揭幕发布了本次新书。
3014 0
《阿里云天池大赛赛题解析---机器学习篇》新书正式发布!