你会心动吗?ICPR 2018 MTWI挑战赛开启-阿里云开发者社区

开发者社区> 新零售淘系技术> 正文

你会心动吗?ICPR 2018 MTWI挑战赛开启

简介:

互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在流动传播。基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃至改变相关行业的生产方式。而在学术领域,图片中的文字识别(OCR)同样也是研究重点,但目前业内依旧缺少基于网络图片的、以中文为主的OCR数据集。

90745deebd105633bb0fc09100d2fb17deadaa9a

近期,由阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI(Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英混合数据集——MTWI数据集。大赛聚焦OCR领域相关实用知识点的突破与解决,旨在与全球AI科研人才一起共同推动OCR在工业界的应用和发展。

本次大赛发布的MTWI数据集来源于真实网络场景,以“来源于实践,且高于实践”为构建理念,既考虑到学术价值同时也兼顾工业适用性。

不同于纯文档图片和场景文字图片,MTWI数据集中的图片多为作者设计或者二次加工所得。整体上看,这类图片不仅包含部分场景图片和文档图片,更多的是在这些图片基础上添加设计好的文字而成的新图片。

a7cafa121c4fe9ee507bccd0faddd8c50b3fb2fe

左一:空心字,切断字,中英混排 /左二:封面印刷文字,离散单字,重叠字/左三:实拍,自然场景,艺术文字/左四:大字中镶嵌小字,不同字号混排

从数据场景上看,本数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量日文、韩文等类型的文字。而从文字版式上来看,包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。

因此,本次大赛发布的数据集既有图片文字识别的共性也有本身的特性,突出覆盖前沿技术尚未解决或者遗漏的样例,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测,文本行识别,端到端的整图文字识别三个层次的赛题,对相关技术点的解决以及在工业领域的信息数字化应用将具有直接的推动作用。

e416b7590bc65b1fac7b3bd4e3421a6eb53966ed

本次ICPR MTWI 2018 挑战赛基于天池数据众智平台,目前已开启报名通道,吸引了来自国内外2000余支队伍报名参赛,其中不乏OCR研究领域的知名院校团队。赛事组委会将在2018年6月1日评出获奖名单,并于ICPR2018大会期间在北京进行颁奖。


原文发布时间为:2018-04-4
本文来自云栖社区合作伙伴“淘宝技术”,了解相关信息可以关注“淘宝技术”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

淘系技术部隶旗下包含淘宝技术、天猫技术、农村淘宝技术、闲鱼、iHome等团队和业务,是一支是具有商业和技术双重基因的螺旋体。 我们致力于成为全球最懂商业的技术创新团队,打造消费者和商家一体化的新零售智能商业平台,创新商业赛道。随着新零售业务的持续探索与快速发展,我们不断吸引用户增长、机器学习、视觉算法、音视频通信、数字媒体、端侧智能等领域全球顶尖专业人才加入,让科技引领面向未来的商业创新和进步。欢迎投递简历至ruoqi.zlj@taobao.com

官方博客
淘系开源,欢迎star哟