DataFountain训练赛汇总,成长在于不断学习(下)

简介: DataFountain训练赛汇总,成长在于不断学习(下)

赛题介绍

74.png

image


赛题名:漫画照片人脸识别竞赛


赛道:训练赛道


背景:计算机视觉研究领域对漫画的识别和生成越来越感兴趣。漫画识别的研究目的是研究计算机是否能从特定的照片中识别出漫画。近年来,这方面的研究越来越多,其主要原因之一是可以帮助理解人类如何识别脸,并且缩小人类感知和机器识别脸之间的差距。另一个主要原因则是有了更好的漫画识别机制,可以在保留内在身份的同时合成更好的漫画。过去的研究表明,对人类对照片人脸和漫画人脸的感知的研究可能有助于理解人类大脑是如何表征和编码面孔的。


任务:通过部分人物的漫画数据和照片数据,对漫画与照片之间的对映射关系进行建模,通过机器学习等相关技术,建立准确的漫画-照片人脸识别模型,判断漫画和照片身份之间的对应关系。


数据简介


数据来源于WebCaricature数据集,原数据集共包括属于252个人物的6042幅漫画和5974张照片。同时由于所有的漫画图片均来自网络爬虫爬取,因此数据集中的漫画的艺术风格是多种多样。此外,该数据集中也并不对光照条件、姿态、表情、遮挡和年龄等信息进行约束。训练赛道给出的数据是预处理裁剪好的部分数据,不需要再进行人脸检测和对齐,完整数据可从https://cs.nju.edu.cn/rl/WebCaricature.htm申请获取。


WebCaricature/train 训练集图片文件夹,子目录文件夹对应人物(以人物姓名命名),人物姓名文件夹下存放该人物对应的图片,其中P开头表示照片,C开头表示漫画
WebCaricature/test 测试集图片文件夹
WebCaricature/protocols/ FR_Train_dev.txt 训练数据,每行分别表示人物身份,漫画数量以及照片数量
WebCaricature/protocols/C2P FR_Gallery_C2P.txt,C2P设置下的Gallery数据集(由照片构成),FR_Probe_C2P.txt,C2P设置下的Probe数据集(由漫画构成)。
WebCaricature/protocols/P2C FR_Gallery_P2C.txt,P2C设置下的Gallery数据集(由漫画构成),FR_Probe_P2C.txt,P2C设置下的Probe数据集(由照片构成)。

评测标准


参赛队员的算法需要计算找出与Probe中的图片人物身份相同的Gallery图片,返回该图片的名称作为Probe图片的匹配结果,赛方计算Rank-1准确率。

75.png

image


其中,Pi为第i个Probe图片的人物ID,Gi1为算法找出的第i个Probe图片的最相似人物ID。


赛题介绍


76.png

image


赛题名:真实场景下的水表读数自动识别


赛道:训练赛道


背景:当前,尽管智能水表正在取代老式的机械水表,但在许多地区,由于环境、成本等因素的限制,机械水表无法被替换,仍就需要人工手动进行抄表。为了实现对老式机械水表的自动识别,本次大赛开展了真实场景下的水表读数自动识别竞赛。

任务:本次大赛要求参赛者使用机器学习、深度学习或者光学字符识别等技术来实现对老式机械水表读数区域的自动识别,任务如图1所示:


77.png

image


  • 本次大赛的难点主要在两个方面:1、水表读数区域(图1中的“00095/00095”区域)的准确估计;2、对估计出的读数区域中数字的准确识别。


数据说明


文件名称 说明
train_imgs.zip 训练集图片,里面包含1000张水表图片
train_labels.zip 训练集对应的标注答案结果,具体描述见本表后面文字
test_imgs.zip 测试集图片,里面包含500张待识别水表图片
submit_example.csv 提交样例,参赛者根据此格式进行提交


训练集结果文件说明:


78.png

image


标签文件的命名方式和训练集一致

标签中前八个值,为水表表盘的四个角点(x1, y1, x2, y2, x3, y3, x4, y4), 坐标值原点为图片的左上角,顺序为顺时针,且从左上角开始。后面的值为表盘的数值,由于最后一位出现半字符的情况,所以有两个数值。


图示:

79.png

image


提交要求


csv结果提交:针对算法竞赛,参赛者以csv文件格式,提交模型结果到大数据竞赛平台,平台进行在线评分,实时排名。

文件编码:UTF-8


提交示例


提交实例可参考submit_example.csv,内容如下

filename,result

test_1.jpg,00323

test_2.jpg,00323

test_3.jpg,00323

test_4.jpg,00323

test_5.jpg,00323

test_6.jpg,00323


评测标准


对于参赛者提交的结果,要求完全识别出读数区域的数字,如图1所示,5个数字全部识别正确才算正确识别出一张水表图片。水表图片中的数字没有全部识别正确,或者识别出了读数区域之外的其他任何字符都算作识别失败,最终将根据500张测试图像的正确率进行由高到低的排序。


80.png

image

相关文章
|
3月前
|
算法 JavaScript 前端开发
探索编程之美:从小白到大牛的旅程
【10月更文挑战第9天】编程,这个听起来高深莫测的词汇,实际上就像是一场奇妙的探险。它不仅仅是冷冰冰的代码和算法,更是一扇打开新世界大门的钥匙。本文将带你领略编程的魅力所在,从最初的迷茫与困惑,到逐渐找到自己的方向,最终在技术的海洋里遨游。无论你是编程新手,还是希望进一步提升的开发者,都能在这段旅程中找到属于自己的光芒。
|
2月前
|
程序员 定位技术
编程之路:从迷茫到精通的心路历程
在编程的世界里,每个新手都像是一名初登航船的航海者,面对着波涛汹涌的知识海洋。本文将分享一位程序员的成长故事,从大学毕业时的迷茫,到勇敢尝试新领域的冒险,再到不断学习和提升,最终找到属于自己的人生方向。正如乔布斯所说:“人生中的每一个点都会在未来某个时刻连接起来。”让我们跟随这段旅程,探索如何在编程之路上,从初心到精通,绘制出一幅精彩纷呈的技术地图。
34 11
|
2月前
|
机器学习/深度学习 前端开发 算法
探索代码之美:从小白到专家的技术成长之路
【10月更文挑战第36天】技术之路,犹如攀登一座座高峰,每一步都充满挑战与惊喜。本文将带你走进编程世界,从基础语法到复杂算法,从简单项目到大型架构,一起感受代码的魅力和力量。无论你是初学者还是资深开发者,都能在这里找到共鸣和启发。让我们一起在代码的海洋中遨游,探索那些隐藏在每一行代码背后的智慧与哲理。
|
4月前
|
算法 安全 小程序
编程之旅:从小白到专家的蜕变之路
【9月更文挑战第8天】本文是一篇个人技术成长历程的分享,通过作者的亲身经历,展示了一个编程新手如何逐步成长为一名技术专家。文章不仅包含了编程学习的心得体会,还探讨了持续学习、实践和社区参与对于技术提升的重要性。适合所有对编程感兴趣的读者,尤其是那些正在寻找学习路线和动力的初学者。
63 7
|
7月前
|
机器学习/深度学习 人工智能 前端开发
探索编程之美:我的技术感悟之旅
在数字世界的迷宫中,我以代码为笔,算法为墨,勾勒出一幅幅技术的画卷。本文将带你领略编程的精妙与挑战,分享我在技术探索中的点滴感悟,以及如何通过持续学习与实践,不仅提升了个人技能,还拓宽了视野,最终找到了属于自己的技术之路。
33 0
|
8月前
|
人工智能 运维 安全
【年终总结系列 2023】成长与收获:回顾过去、展望未来,加油2024!
【1月更文挑战第1天】年关将至,富余的时间也稍显多了些,遂写下此文,好好回顾一下自己这一年的收获,同时也立下2024年的新年flag。
如何借助猎头的力量完成一次完美的跳槽?彭文华
如何借助猎头的力量完成一次完美的跳槽?彭文华
|
机器学习/深度学习 XML JSON
DataFountain训练赛汇总,成长在于不断学习(上)
DataFountain训练赛汇总,成长在于不断学习(上)
347 0
DataFountain训练赛汇总,成长在于不断学习(上)
|
机器学习/深度学习 算法 大数据
DataFountain训练赛汇总,成长在于不断学习(中)
DataFountain训练赛汇总,成长在于不断学习(中)
227 0
DataFountain训练赛汇总,成长在于不断学习(中)

热门文章

最新文章