赛题介绍
image
赛题名:漫画照片人脸识别竞赛
赛道:训练赛道
背景:计算机视觉研究领域对漫画的识别和生成越来越感兴趣。漫画识别的研究目的是研究计算机是否能从特定的照片中识别出漫画。近年来,这方面的研究越来越多,其主要原因之一是可以帮助理解人类如何识别脸,并且缩小人类感知和机器识别脸之间的差距。另一个主要原因则是有了更好的漫画识别机制,可以在保留内在身份的同时合成更好的漫画。过去的研究表明,对人类对照片人脸和漫画人脸的感知的研究可能有助于理解人类大脑是如何表征和编码面孔的。
任务:通过部分人物的漫画数据和照片数据,对漫画与照片之间的对映射关系进行建模,通过机器学习等相关技术,建立准确的漫画-照片人脸识别模型,判断漫画和照片身份之间的对应关系。
数据简介
数据来源于WebCaricature数据集,原数据集共包括属于252个人物的6042幅漫画和5974张照片。同时由于所有的漫画图片均来自网络爬虫爬取,因此数据集中的漫画的艺术风格是多种多样。此外,该数据集中也并不对光照条件、姿态、表情、遮挡和年龄等信息进行约束。训练赛道给出的数据是预处理裁剪好的部分数据,不需要再进行人脸检测和对齐,完整数据可从https://cs.nju.edu.cn/rl/WebCaricature.htm申请获取。
WebCaricature/train | 训练集图片文件夹,子目录文件夹对应人物(以人物姓名命名),人物姓名文件夹下存放该人物对应的图片,其中P开头表示照片,C开头表示漫画 |
WebCaricature/test | 测试集图片文件夹 |
WebCaricature/protocols/ FR_Train_dev.txt | 训练数据,每行分别表示人物身份,漫画数量以及照片数量 |
WebCaricature/protocols/C2P | FR_Gallery_C2P.txt,C2P设置下的Gallery数据集(由照片构成),FR_Probe_C2P.txt,C2P设置下的Probe数据集(由漫画构成)。 |
WebCaricature/protocols/P2C | FR_Gallery_P2C.txt,P2C设置下的Gallery数据集(由漫画构成),FR_Probe_P2C.txt,P2C设置下的Probe数据集(由照片构成)。 |
评测标准
参赛队员的算法需要计算找出与Probe中的图片人物身份相同的Gallery图片,返回该图片的名称作为Probe图片的匹配结果,赛方计算Rank-1准确率。
image
其中,Pi为第i个Probe图片的人物ID,Gi1为算法找出的第i个Probe图片的最相似人物ID。
赛题介绍
image
赛题名:真实场景下的水表读数自动识别
赛道:训练赛道
背景:当前,尽管智能水表正在取代老式的机械水表,但在许多地区,由于环境、成本等因素的限制,机械水表无法被替换,仍就需要人工手动进行抄表。为了实现对老式机械水表的自动识别,本次大赛开展了真实场景下的水表读数自动识别竞赛。
任务:本次大赛要求参赛者使用机器学习、深度学习或者光学字符识别等技术来实现对老式机械水表读数区域的自动识别,任务如图1所示:
image
- 本次大赛的难点主要在两个方面:1、水表读数区域(图1中的“00095/00095”区域)的准确估计;2、对估计出的读数区域中数字的准确识别。
数据说明
文件名称 | 说明 |
train_imgs.zip | 训练集图片,里面包含1000张水表图片 |
train_labels.zip | 训练集对应的标注答案结果,具体描述见本表后面文字 |
test_imgs.zip | 测试集图片,里面包含500张待识别水表图片 |
submit_example.csv | 提交样例,参赛者根据此格式进行提交 |
训练集结果文件说明:
image
标签文件的命名方式和训练集一致
标签中前八个值,为水表表盘的四个角点(x1, y1, x2, y2, x3, y3, x4, y4), 坐标值原点为图片的左上角,顺序为顺时针,且从左上角开始。后面的值为表盘的数值,由于最后一位出现半字符的情况,所以有两个数值。
图示:
image
提交要求
csv结果提交:针对算法竞赛,参赛者以csv文件格式,提交模型结果到大数据竞赛平台,平台进行在线评分,实时排名。
文件编码:UTF-8
提交示例
提交实例可参考submit_example.csv,内容如下
filename,result
test_1.jpg,00323
test_2.jpg,00323
test_3.jpg,00323
test_4.jpg,00323
test_5.jpg,00323
test_6.jpg,00323
评测标准
对于参赛者提交的结果,要求完全识别出读数区域的数字,如图1所示,5个数字全部识别正确才算正确识别出一张水表图片。水表图片中的数字没有全部识别正确,或者识别出了读数区域之外的其他任何字符都算作识别失败,最终将根据500张测试图像的正确率进行由高到低的排序。
image