ICPR 2018 MTWI挑战赛开启 开放首个网络图片数据集

本文涉及的产品
企业资质识别,企业资质识别 200次/月
自定义KV模板,自定义KV模板 500次/账号
文档理解,结构化解析 100页
简介:

_1

近期,由阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI (Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英混合数据集——MTWI数据集。大赛聚焦OCR领域相关实用知识点的突破与解决,旨在与全球AI科研人才一起共同推动OCR在工业界的应用和发展。

互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在流动传播。基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃至改变相关行业的生产方式。而在学术领域,图片中的文字识别(OCR)同样也是研究重点,但目前业内依旧缺少基于网络图片的、以中文为主的OCR数据集。

本次大赛发布的MTWI数据集来源于真实网络场景,以“来源于实践,且高于实践”为构建理念,既考虑到学术价值同时也兼顾工业适用性。

不同于纯文档图片和场景文字图片,MTWI数据集中的图片多为作者设计或者二次加工所得。整体上看,这类图片不仅包含部分场景图片和文档图片,更多的是在这些图片基础上添加设计好的文字而成的新图片。

_2
左一:空心字,切断字,中英混排;左二:封面印刷文字,离散单字,重叠字;左三:实拍,自然场景,艺术文字;左四:大字中镶嵌小字,不同字号混排

从数据场景上看,本数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量日文、韩文等类型的文字。而从文字版式上来看,包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。

因此,本次大赛发布的数据集既有图片文字识别的共性也有本身的特性,突出覆盖前沿技术尚未解决或者遗漏的样例,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测,文本行识别,端到端的整图文字识别三个层次的赛题,对相关技术点的解决以及在工业领域的信息数字化应用将具有直接的推动作用。

_33
本次ICPR MTWI 2018 挑战赛基于天池数据众智平台,目前已开启报名通道,吸引了来自国内外2000余支队伍报名参赛,其中不乏OCR研究领域的知名院校团队。赛事组委会将在2018年6月1日评出获奖名单,并于ICPR2018大会期间在北京进行颁奖。
了解本次大赛更多详情及赛事最新动态,请登录ICPR MTWI 2018 挑战赛官网(https://tianchi.aliyun.com/markets/tianchi/icpr_mtwi_2018_challenge)或扫描下方二维码报名参赛!
ocr

关于主办团队:

阿里巴巴“图像和美”团队是阿里巴巴从事图像技术历史最悠久的团队,在OCR领域,多年来不断整合前沿技术和行业经验,打磨出了能够承载跨行业应用的技术架构,形成了完备的图像文字定位、识别和理解的人工智能技术体系。目前已在阿里巴巴集团内部的图片管控,搜索,智能审核等领域扮演重要角色,并推出“读光”OCR云产品,包括文档图片,网络图片,表格图片和卡证照图片的文字识别服务,正致力于为政务、司法以及金融等行业提供安全高效的OCR解决方案。

相关文章
|
6月前
|
机器学习/深度学习 存储 Serverless
【动手学深度学习】深入浅出深度学习之利用神经网络识别螺旋状数据集
【动手学深度学习】深入浅出深度学习之利用神经网络识别螺旋状数据集
107 27
|
6月前
|
机器学习/深度学习 编解码 PyTorch
Pytorch实现手写数字识别 | MNIST数据集(CNN卷积神经网络)
Pytorch实现手写数字识别 | MNIST数据集(CNN卷积神经网络)
|
6月前
|
机器学习/深度学习 算法 网络架构
基于yolov2深度学习网络的人脸检测matlab仿真,图像来自UMass数据集
**YOLOv2算法在MATLAB2022a中实现人脸检测:** 展示6个检测结果图,利用Darknet-19进行特征提取,网络每个网格预测BBox,包含中心偏移、尺寸、置信度和类别概率。多任务损失函数结合定位、置信度和分类误差。程序加载预训练模型,遍历图像,对检测到的人脸以0.15阈值画出边界框并显示。
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【PyTorch实战演练】AlexNet网络模型构建并使用Cifar10数据集进行批量训练(附代码)
【PyTorch实战演练】AlexNet网络模型构建并使用Cifar10数据集进行批量训练(附代码)
488 0
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
437 0
|
1月前
|
机器学习/深度学习 数据可视化 测试技术
YOLO11实战:新颖的多尺度卷积注意力(MSCA)加在网络不同位置的涨点情况 | 创新点如何在自己数据集上高效涨点,解决不涨点掉点等问题
本文探讨了创新点在自定义数据集上表现不稳定的问题,分析了不同数据集和网络位置对创新效果的影响。通过在YOLO11的不同位置引入MSCAAttention模块,展示了三种不同的改进方案及其效果。实验结果显示,改进方案在mAP50指标上分别提升了至0.788、0.792和0.775。建议多尝试不同配置,找到最适合特定数据集的解决方案。
369 0
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
深度学习实践:构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行分类
本文详细介绍如何使用PyTorch构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行图像分类。从数据预处理、模型定义到训练过程及结果可视化,文章全面展示了深度学习项目的全流程。通过实际操作,读者可以深入了解CNN在图像分类任务中的应用,并掌握PyTorch的基本使用方法。希望本文为您的深度学习项目提供有价值的参考与启示。
|
3月前
|
网络协议 Windows
在电脑上测试TCP/UDP端口是否开放,还是得网络大佬这招厉害!
在电脑上测试TCP/UDP端口是否开放,还是得网络大佬这招厉害!
801 2
|
3月前
|
机器学习/深度学习 安全 网络协议
网络安全公开数据集Maple-IDS,恶意流量检测数据集开放使用!
【8月更文挑战第29天】Maple-IDS 是东北林业大学网络安全实验室发布的网络入侵检测评估数据集,旨在提升异常基础入侵检测和预防系统的性能与可靠性。该数据集包含多种最新攻击类型,如 DDoS 和 N-day 漏洞,覆盖多种服务和网络行为,兼容 CIC-IDS 格式,便于直接使用或生成 csv 文件,适用于多种现代协议。
153 0
|
3月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Tensorflow+Keras】keras实现条件生成对抗网络DCGAN--以Minis和fashion_mnist数据集为例
如何使用TensorFlow和Keras实现条件生成对抗网络(CGAN)并以MNIST和Fashion MNIST数据集为例进行演示。
50 3
下一篇
无影云桌面