1.引言
足球是世界上非常受欢迎的运动之一,在全球范围内吸引了众多的参与者。成千上万的职业足球运动员参与到专业的足球比赛中,许多重大的足球赛事(如国际足联世界杯等)受到数以百万计的球迷的关注。可视分析技术能够对分析的流程和结果进行清晰直观的展示,并支持用户对数据进行交互式的探索,被广泛应用到不同领域的数据分析中。
在体育数据可视分析领域中,足球比赛数据的可视分析吸引了众多研究人员的关注。例如,ESPN和WhoScored等足球比赛数据网站大量采用图标和时间轴等可视化元素对比赛过程进行展示,采用柱状图和雷达图等统计图表对球员统计数据进行比较分析。在专业的足球比赛数据分析中,定制的可视分析系统被广泛采用,其可以帮助数据分析师对比赛形势以及比赛中采取的战术进行直观的分析和探索。
足球比赛数据主要包括统计数据、事件数据、轨迹数据等。针对不同的比赛数据类型,相关的可视分析工作可以按照分析任务分为不同的类别。例如针对统计数据,可以分为比赛排名的可视化分析和统计指标的可视化分析等;针对事件数据,可以分为关键事件的可视分析和传球事件的可视分析等;针对轨迹数据,可以分为比赛视频的可视分析、比赛时空轨迹的可视分析、比赛阵形的可视分析等。
2022年卡塔尔世界杯(英语:FIFA World Cup Qatar 2022)是第二十二届世界杯足球赛,是历史上首次在卡塔尔和中东国家境内举行、也是第二次在亚洲举行的世界杯足球赛。除此之外,卡塔尔世界杯还是首次在北半球冬季举行、首次由从未进过世界杯决赛圈的国家举办的世界杯足球赛。
2020年7月15日,2022年卡塔尔世界杯赛程公布,全部比赛在卡塔尔境内8座球场举行。2022年6月15日,决赛阶段球队全部确定。 该届赛事揭幕战于11月21日0时(当地时间11月20日19时)进行,由东道主卡塔尔对阵厄瓜多尔;决赛于12月18日23时(当地时间12月18日18时)在卢塞尔体育场进行。
2.项目简介
2.1数据集介绍
数据集来源于天池,世界杯成绩信息表:WorldCupsSummary
包含了所有21届世界杯赛事(1930-2018)的比赛主办国、前四名队伍、总参赛队伍、总进球数、现场观众人数等汇总信息,包括如下字段:
Year: 举办年份
HostCountry: 举办国家
Winner: 冠军队伍
Second: 亚军队伍
Third: 季军队伍
Fourth: 第四名队伍
GoalsScored: 总进球数
QualifiedTeams: 总参赛队伍数
MatchesPlayed: 总比赛场数
Attendance: 现场观众总人数
HostContinent: 举办国所在洲
WinnerContinent: 冠军国家队所在洲
2.2技术工具
Python版本: 3.9
代码编辑器:jupyter notebook
3.数据可视化
首先导入本次项目用到的第三方包并且导入数据集
3.1往届世界杯获奖国家TOP5
这里我们先是分别从原始数据集中提取出获得冠亚季的国家,最后通过merge进行合并可视化
从图中看出,TOP5中的国家有巴西、意大利、德国和法国,可以看出这几个国家在足球方面实力确实很强。
3.2往届世界杯比赛数据情况
这里我们画出世界杯总进球、参赛队伍、比赛场次数的历届数据线图
从结果看出整体趋势都是在上升,中间有几届出现较大的波动。
3.3往届世界杯观众人数情况
从图中看出,现场观众人数跟比赛队伍情况都是一样的有着不断上升趋势,说明世界杯越来越受欢迎。
3.4往届世界杯主办方情况
从图中看出,世界杯的主办方一般都在欧洲和美洲,很少会在亚洲和非洲举办,这可能跟经济实力或者国家足球实力有关吧。
3.5往届世界杯冠军队情况
从图中看出,历届的世界杯冠军队伍都是在欧洲和美洲,说明这两个洲的国家足球实力是真的很强,也难怪举办方也主要是这两个洲,主场光环加成吧。
好了,以上就是本次世界杯往届数据分析可视化,希望对学习可视化的你有所帮助。