DataFountain训练赛汇总,成长在于不断学习(下)

简介: DataFountain训练赛汇总,成长在于不断学习(下)

赛题介绍

74.png

image


赛题名:漫画照片人脸识别竞赛


赛道:训练赛道


背景:计算机视觉研究领域对漫画的识别和生成越来越感兴趣。漫画识别的研究目的是研究计算机是否能从特定的照片中识别出漫画。近年来,这方面的研究越来越多,其主要原因之一是可以帮助理解人类如何识别脸,并且缩小人类感知和机器识别脸之间的差距。另一个主要原因则是有了更好的漫画识别机制,可以在保留内在身份的同时合成更好的漫画。过去的研究表明,对人类对照片人脸和漫画人脸的感知的研究可能有助于理解人类大脑是如何表征和编码面孔的。


任务:通过部分人物的漫画数据和照片数据,对漫画与照片之间的对映射关系进行建模,通过机器学习等相关技术,建立准确的漫画-照片人脸识别模型,判断漫画和照片身份之间的对应关系。


数据简介


数据来源于WebCaricature数据集,原数据集共包括属于252个人物的6042幅漫画和5974张照片。同时由于所有的漫画图片均来自网络爬虫爬取,因此数据集中的漫画的艺术风格是多种多样。此外,该数据集中也并不对光照条件、姿态、表情、遮挡和年龄等信息进行约束。训练赛道给出的数据是预处理裁剪好的部分数据,不需要再进行人脸检测和对齐,完整数据可从https://cs.nju.edu.cn/rl/WebCaricature.htm申请获取。


WebCaricature/train 训练集图片文件夹,子目录文件夹对应人物(以人物姓名命名),人物姓名文件夹下存放该人物对应的图片,其中P开头表示照片,C开头表示漫画
WebCaricature/test 测试集图片文件夹
WebCaricature/protocols/ FR_Train_dev.txt 训练数据,每行分别表示人物身份,漫画数量以及照片数量
WebCaricature/protocols/C2P FR_Gallery_C2P.txt,C2P设置下的Gallery数据集(由照片构成),FR_Probe_C2P.txt,C2P设置下的Probe数据集(由漫画构成)。
WebCaricature/protocols/P2C FR_Gallery_P2C.txt,P2C设置下的Gallery数据集(由漫画构成),FR_Probe_P2C.txt,P2C设置下的Probe数据集(由照片构成)。

评测标准


参赛队员的算法需要计算找出与Probe中的图片人物身份相同的Gallery图片,返回该图片的名称作为Probe图片的匹配结果,赛方计算Rank-1准确率。

75.png

image


其中,Pi为第i个Probe图片的人物ID,Gi1为算法找出的第i个Probe图片的最相似人物ID。


赛题介绍


76.png

image


赛题名:真实场景下的水表读数自动识别


赛道:训练赛道


背景:当前,尽管智能水表正在取代老式的机械水表,但在许多地区,由于环境、成本等因素的限制,机械水表无法被替换,仍就需要人工手动进行抄表。为了实现对老式机械水表的自动识别,本次大赛开展了真实场景下的水表读数自动识别竞赛。

任务:本次大赛要求参赛者使用机器学习、深度学习或者光学字符识别等技术来实现对老式机械水表读数区域的自动识别,任务如图1所示:


77.png

image


  • 本次大赛的难点主要在两个方面:1、水表读数区域(图1中的“00095/00095”区域)的准确估计;2、对估计出的读数区域中数字的准确识别。


数据说明


文件名称 说明
train_imgs.zip 训练集图片,里面包含1000张水表图片
train_labels.zip 训练集对应的标注答案结果,具体描述见本表后面文字
test_imgs.zip 测试集图片,里面包含500张待识别水表图片
submit_example.csv 提交样例,参赛者根据此格式进行提交


训练集结果文件说明:


78.png

image


标签文件的命名方式和训练集一致

标签中前八个值,为水表表盘的四个角点(x1, y1, x2, y2, x3, y3, x4, y4), 坐标值原点为图片的左上角,顺序为顺时针,且从左上角开始。后面的值为表盘的数值,由于最后一位出现半字符的情况,所以有两个数值。


图示:

79.png

image


提交要求


csv结果提交:针对算法竞赛,参赛者以csv文件格式,提交模型结果到大数据竞赛平台,平台进行在线评分,实时排名。

文件编码:UTF-8


提交示例


提交实例可参考submit_example.csv,内容如下

filename,result

test_1.jpg,00323

test_2.jpg,00323

test_3.jpg,00323

test_4.jpg,00323

test_5.jpg,00323

test_6.jpg,00323


评测标准


对于参赛者提交的结果,要求完全识别出读数区域的数字,如图1所示,5个数字全部识别正确才算正确识别出一张水表图片。水表图片中的数字没有全部识别正确,或者识别出了读数区域之外的其他任何字符都算作识别失败,最终将根据500张测试图像的正确率进行由高到低的排序。


80.png

image

相关文章
|
1月前
|
人工智能 Java 新能源
我的2024总结 | 降薪优化、焦虑生病、读书写作、逆势成长
本文回顾了作者在2024年的经历与感悟,涵盖了职业发展、健康管理、读书写作等多个方面。面对工作压力和身体不适的双重挑战,作者通过阅读心理学书籍找到了应对焦虑的方法,并坚持写作分享,逐步实现自我救赎与成长。展望2025,作者强调“知行合一”,希望通过持续努力突破困境,迎接新的开始。文中还推荐了几本有助于个人成长的书籍,如《正面管教》和《被讨厌的勇气》,鼓励读者共同进步,健康顺利地度过新的一年。
|
4月前
|
人工智能 大数据
技术感悟:从迷茫到坚定的旅程
在这篇文章中,我将分享我的技术感悟,从大学毕业时的迷茫,到大胆尝试新领域,再到不断学习和提升,我找到了人生的方向。通过这段旅程,我深刻体会到了“你必须成为你希望在世界上看到的改变”这句话的意义。让我们一起探索这个充满挑战和机遇的世界吧!
|
5月前
|
前端开发 安全 JavaScript
从迷茫到精通:我的编程之旅与技术感悟
【9月更文挑战第26天】在编程的世界里,每一步都充满了挑战和机遇。本文是一段个人的技术旅程,从最初的迷茫不安到逐渐找到自己的方向,再到深入理解编程的本质。通过分享个人的经验和感悟,旨在启发读者思考如何在技术的海洋中航行,找到属于自己的灯塔。
|
安全 架构师 项目管理
快速成长的秘诀|自我成长的方法有哪些?
快速成长总共三篇,分别是《完成自我升级》、《自我成长的方法》、《学会自我培养或培养他人》。本文为第二篇,会从9个维度分享自我成长。
2256 66
|
9月前
|
人工智能 运维 安全
【年终总结系列 2023】成长与收获:回顾过去、展望未来,加油2024!
【1月更文挑战第1天】年关将至,富余的时间也稍显多了些,遂写下此文,好好回顾一下自己这一年的收获,同时也立下2024年的新年flag。
|
机器学习/深度学习 算法 大数据
DataFountain训练赛汇总,成长在于不断学习(中)
DataFountain训练赛汇总,成长在于不断学习(中)
230 0
DataFountain训练赛汇总,成长在于不断学习(中)
|
机器学习/深度学习 XML JSON
DataFountain训练赛汇总,成长在于不断学习(上)
DataFountain训练赛汇总,成长在于不断学习(上)
357 0
DataFountain训练赛汇总,成长在于不断学习(上)
|
程序员 开发者
十年老友记 | @民工哥:梦想是动力,但人终究要认清现实
十年老友记 | @民工哥:梦想是动力,但人终究要认清现实
155 0
|
前端开发 Java 程序员
为者常成,行者常至(进步、收获、成长、自信)
📝为者常成,行者常至。意思是努力去做的人常常可以成功,不倦前行的人常常可以达到目的
143 0