DataFountain训练赛汇总,成长在于不断学习(下)

简介: DataFountain训练赛汇总,成长在于不断学习(下)

赛题介绍

74.png

image


赛题名:漫画照片人脸识别竞赛


赛道:训练赛道


背景:计算机视觉研究领域对漫画的识别和生成越来越感兴趣。漫画识别的研究目的是研究计算机是否能从特定的照片中识别出漫画。近年来,这方面的研究越来越多,其主要原因之一是可以帮助理解人类如何识别脸,并且缩小人类感知和机器识别脸之间的差距。另一个主要原因则是有了更好的漫画识别机制,可以在保留内在身份的同时合成更好的漫画。过去的研究表明,对人类对照片人脸和漫画人脸的感知的研究可能有助于理解人类大脑是如何表征和编码面孔的。


任务:通过部分人物的漫画数据和照片数据,对漫画与照片之间的对映射关系进行建模,通过机器学习等相关技术,建立准确的漫画-照片人脸识别模型,判断漫画和照片身份之间的对应关系。


数据简介


数据来源于WebCaricature数据集,原数据集共包括属于252个人物的6042幅漫画和5974张照片。同时由于所有的漫画图片均来自网络爬虫爬取,因此数据集中的漫画的艺术风格是多种多样。此外,该数据集中也并不对光照条件、姿态、表情、遮挡和年龄等信息进行约束。训练赛道给出的数据是预处理裁剪好的部分数据,不需要再进行人脸检测和对齐,完整数据可从https://cs.nju.edu.cn/rl/WebCaricature.htm申请获取。


WebCaricature/train 训练集图片文件夹,子目录文件夹对应人物(以人物姓名命名),人物姓名文件夹下存放该人物对应的图片,其中P开头表示照片,C开头表示漫画
WebCaricature/test 测试集图片文件夹
WebCaricature/protocols/ FR_Train_dev.txt 训练数据,每行分别表示人物身份,漫画数量以及照片数量
WebCaricature/protocols/C2P FR_Gallery_C2P.txt,C2P设置下的Gallery数据集(由照片构成),FR_Probe_C2P.txt,C2P设置下的Probe数据集(由漫画构成)。
WebCaricature/protocols/P2C FR_Gallery_P2C.txt,P2C设置下的Gallery数据集(由漫画构成),FR_Probe_P2C.txt,P2C设置下的Probe数据集(由照片构成)。

评测标准


参赛队员的算法需要计算找出与Probe中的图片人物身份相同的Gallery图片,返回该图片的名称作为Probe图片的匹配结果,赛方计算Rank-1准确率。

75.png

image


其中,Pi为第i个Probe图片的人物ID,Gi1为算法找出的第i个Probe图片的最相似人物ID。


赛题介绍


76.png

image


赛题名:真实场景下的水表读数自动识别


赛道:训练赛道


背景:当前,尽管智能水表正在取代老式的机械水表,但在许多地区,由于环境、成本等因素的限制,机械水表无法被替换,仍就需要人工手动进行抄表。为了实现对老式机械水表的自动识别,本次大赛开展了真实场景下的水表读数自动识别竞赛。

任务:本次大赛要求参赛者使用机器学习、深度学习或者光学字符识别等技术来实现对老式机械水表读数区域的自动识别,任务如图1所示:


77.png

image


  • 本次大赛的难点主要在两个方面:1、水表读数区域(图1中的“00095/00095”区域)的准确估计;2、对估计出的读数区域中数字的准确识别。


数据说明


文件名称 说明
train_imgs.zip 训练集图片,里面包含1000张水表图片
train_labels.zip 训练集对应的标注答案结果,具体描述见本表后面文字
test_imgs.zip 测试集图片,里面包含500张待识别水表图片
submit_example.csv 提交样例,参赛者根据此格式进行提交


训练集结果文件说明:


78.png

image


标签文件的命名方式和训练集一致

标签中前八个值,为水表表盘的四个角点(x1, y1, x2, y2, x3, y3, x4, y4), 坐标值原点为图片的左上角,顺序为顺时针,且从左上角开始。后面的值为表盘的数值,由于最后一位出现半字符的情况,所以有两个数值。


图示:

79.png

image


提交要求


csv结果提交:针对算法竞赛,参赛者以csv文件格式,提交模型结果到大数据竞赛平台,平台进行在线评分,实时排名。

文件编码:UTF-8


提交示例


提交实例可参考submit_example.csv,内容如下

filename,result

test_1.jpg,00323

test_2.jpg,00323

test_3.jpg,00323

test_4.jpg,00323

test_5.jpg,00323

test_6.jpg,00323


评测标准


对于参赛者提交的结果,要求完全识别出读数区域的数字,如图1所示,5个数字全部识别正确才算正确识别出一张水表图片。水表图片中的数字没有全部识别正确,或者识别出了读数区域之外的其他任何字符都算作识别失败,最终将根据500张测试图像的正确率进行由高到低的排序。


80.png

image

相关文章
|
Java 大数据 Linux
【回望2022,走向2023】一个双非二本非科班的学生的旅途
【回望2022,走向2023】一个双非二本非科班的学生的旅途
129 0
【回望2022,走向2023】一个双非二本非科班的学生的旅途
|
3月前
|
人工智能 运维 安全
【年终总结系列 2023】成长与收获:回顾过去、展望未来,加油2024!
【1月更文挑战第1天】年关将至,富余的时间也稍显多了些,遂写下此文,好好回顾一下自己这一年的收获,同时也立下2024年的新年flag。
|
10月前
|
监控 架构师 安全
速读《技术人修炼之道》-看到最后定有收获
最近一段时间读完了《技术人修炼之道》,书中内容涵盖了作者多年实践和思想的结晶,整体读来有许多观点深有同感,也学习到了一些新的理念,在这里感谢黄哲铿老师。本文主要结合我自身十几年的IT行业经验,以及创业多年的感受,从书中提炼了一些个人觉得非常有价值并且好落地的点进行分享。
|
物联网 5G
你的第一堂创业“心法”课开课啦,来听听15位创业者的声音!
摘要:你的第一堂创业“心法”课开课啦,本次课程将带你走进有阿里云创新中心全新出品的《看见新力量》电子书第四期。用亲耳聆听的方式走进创业者和创新背后的故事,让你听到创业者的真实声音,看见科技创新的力量。
你的第一堂创业“心法”课开课啦,来听听15位创业者的声音!
|
程序员 开发者
十年老友记 | @民工哥:梦想是动力,但人终究要认清现实
十年老友记 | @民工哥:梦想是动力,但人终究要认清现实
123 0
|
前端开发 Java 程序员
十年老友记 | @Peter 谭老师:编程路上,梦想占比更重
十年老友记 | @Peter 谭老师:编程路上,梦想占比更重
140 0
|
机器学习/深度学习 XML JSON
DataFountain训练赛汇总,成长在于不断学习(上)
DataFountain训练赛汇总,成长在于不断学习(上)
291 0
DataFountain训练赛汇总,成长在于不断学习(上)
|
机器学习/深度学习 算法 大数据
DataFountain训练赛汇总,成长在于不断学习(中)
DataFountain训练赛汇总,成长在于不断学习(中)
183 0
DataFountain训练赛汇总,成长在于不断学习(中)
通往至高境界的磨刀石:读书(深度好文)
# 前言 读书,是通往至高境界的磨刀石。 在书中,你会与世界上那些思维最深,境界最高的大师相遇。在潜移默化的阅读中,在良性环境的影响中,会使你的心胸逐渐开阔,人格逐渐完整。 慢慢地,你看待事物的角度会更加多样,对本质的思考会更加深入。每一次的阅读,都是你与大师的心灵交流,在这里,你会遇见更好的自己,重塑一个全新的自我。 # 本文大纲 ![](https://p3-juejin.bytei
|
机器学习/深度学习 人工智能 自然语言处理
春节在家不再无聊,这份2019 AI研究进展回顾陪伴你
新春快乐!2019 年刚刚过去,去年有哪些最重要的研究是必须要记住的?本文将带你一并回顾
270 0
春节在家不再无聊,这份2019 AI研究进展回顾陪伴你