Python 带你分析,英超是否已经大结局

简介: Python 带你分析,英超是否已经大结局

引子

随着本轮英超战罢,领头羊利物浦已经领先第二名曼城8分之多,新赛季的8连胜,不仅彰显着红军将士誓夺英超首冠的决心,也似乎在提醒着英超诸强,利物浦的复兴已然来临。


而曼城意外的输给狼队,不仅被拉大了和榜首的差距,也被身后的娜娜迎头赶上,看来英超亚军之争也是分外激烈。


不过足球本身就是一项偶然性很强的运动,在足球场上,分分秒秒都可能发生意想不到的事情,何况是漫长的一整个赛季。今天我们就从数据上出发,通过分析英超各个球队的数据,来看看哪些球队更具有冠军相,英超五强,谁人称雄。




抓取数据

我这里选择的是“懂球帝”网站上提供的数据


https://www.dongqiudi.com/data?competition=8


首先可以在数据页面拿到英超各个球队的战绩,进球数和净胜球等信息




https://www.dongqiudi.com/team/50000516.html


之后就是在每个球队的主页上,抓取球队所有球员的信息




下面给出部分抓取代码


抓取球队信息

def get_team_data():
    qiudui_url = 'https://www.dongqiudi.com/data?competition=8'
    qiudui_res = requests.get(qiudui_url, headers=header, cookies=session).text
    content = BeautifulSoup(qiudui_res, 'html.parser')
    team_content = content.find('table').find_all('tr')
    team_list = list(map(deal_element_list, team_content[2:]))
    save_to_csv(team_list)
    print('get player data now...')
    for i in team_list:
        print("爬取url:", i[0])
        get_players_urls(i[0])


对于球员信息,这里使用 selenium 来模拟浏览网页

def get_players_urls(u):
    Chrome_driver = webdriver.Chrome(options=options)
    u = u
    Chrome_driver.get(u)
    ele_div = Chrome_driver.find_element_by_xpath('//*[@id="__layout"]/div/div[2]/div[2]/div[1]/div[2]/div[2]/div[2]')
    ele_p = ele_div.find_elements_by_tag_name('p')
    ...


最后,我们可以得到两个数据文件,分别是 yingchao_data.csv 和 player_data.csv。


分析数据




1. 英超球队进球数据



首先先来看看各支球队在进球方面的数据,我选取了球队的进球和净胜球的数据



可以看出基本上排在前列的球队无论是进球数量还是净胜球数量,都是比较高的,其中曼城和利物浦更是独一档的存在,绝对的英超巨无霸。


而排在下游的球队,净胜球就惨不忍睹了,副班长伍德福德8轮联赛下来,进4球失20球的成绩还是太扎眼,保级之路漫漫,劝君珍惜英超时啊。




2. 球队球员综合得分



接下来再来看看每个球队球员的综合得分情况,也许球员的综合得分也能够从侧面反应出每支球队的整体战斗力吧



从球员的综合得分来看,曼城还是高居榜首,热刺和利物浦紧随其后。


看来曼城无论从攻击力还是球员的综合实力来看,都是高居英超榜首的,但是现在竟然落后8分之多,是利物浦太过强势还是曼城自身出现了问题呢?


而目前排名中游的曼联,在这个榜单中的排位也不是很低,可以说曼联球员的能力还是有的,就是不知道怎么,在老爵爷隐退之后,曼联就不再是曾经的红魔了。




3. 各队前锋数据



下面我选择了各队前锋球员中的射术、速度和力量来作为分析数据,看看每支球队的前锋们,都是怎样的水平



曼城还是第一,他的锋线由阿奎罗、斯特拉,热苏斯等人组成,有冲击力,有速度,有技术,妥妥的英超第一锋线。


而由萨拉赫领衔的利物浦则排在第4位,感觉本赛季萨拉赫的状态有所下降,不过马内倒是依旧强势,不管怎么说,利物浦的锋线三叉戟依旧稳定恐怖。



还可以从上面的散点图中看出,阿森纳的前锋们,在速度方面是英超里最突出的,毕竟有奥巴梅扬的加持;而在射术方面,则是曼城最好,阿奎罗作为球王的女婿,也不是盖的;而在力量方面,应该是维拉队更加强悍一些,毕竟对于中下游球队来说,冲击力可是立身之本呢。




4. 各队中场数据



对于中场球员,我选择了传球、速度和盘带三项指标作为分析数据



曼城仍然占据首位,毕竟是由德布劳内和席尔瓦组成的中场啊,无论是控制力还是向前的传递能力,都是世界顶级的。而他们两人还同时处在助攻榜的前两位,想想曼城的前锋们真是幸福啊





5. 各队后卫数据



对于后防线上的球员,我选取了传球、防守和力量作为评判指标



曼城利物浦再次占据前两位,看来防守赢得胜利,不仅仅适用于 NBA,在足球场上也是同样适用啊。


而在这两份榜单中,都不见了阿森纳的身影,没有强大的中场,又没有稳固的后防,虽然现在位居积分榜的第三位,但是本赛季娜娜的联赛还是不好踢啊,祝好吧!




6. 英超五强数据



最后我们来看看英超五强的数据对比



可以看到,曼城还是在各个方面都要强于其他四支球队,而利物浦也不遑多让,毕竟联赛八连胜就是最好的佐证。


对于阿森纳来说,可能保住前四的位置,再次杀入欧冠才是更为实际的目标了。


而对于切尔西呢,当前的表现只能是中规中矩,期待它未来的爆发。


至于曼联,只求尽快回到赢球的轨迹上来!



不过联赛才刚刚开始,毕竟在漫长的联赛当中,要想赢得冠军,就要比拼阵容、板凳、任性,稳定性等待诸多因素。一切都还未定,无论是整体实力超强的蓝月亮后来居上,还是众志成城的红军一骑绝尘,这都是一个值得期待的盛世英超!



好了,今天的分享就到这里了,后台回复“英超”,可以获取完整代码哦!

相关文章
|
1月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费模式分析的深度学习模型
使用Python实现智能食品消费模式分析的深度学习模型
132 70
|
6天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python实现基于矩阵分解的长期事件(MFLEs)时间序列分析
在现代数据分析中,高维时间序列数据的处理和预测极具挑战性。基于矩阵分解的长期事件(MFLEs)分析技术应运而生,通过降维和时间序列特性结合,有效应对大规模数据。MFLE利用矩阵分解提取潜在特征,降低计算复杂度,过滤噪声,并发现主要模式。相比传统方法如ARIMA和深度学习模型如LSTM,MFLE在多变量处理、计算效率和可解释性上更具优势。通过合理应用MFLE,可在物联网、金融等领域获得良好分析效果。
25 0
使用Python实现基于矩阵分解的长期事件(MFLEs)时间序列分析
|
2月前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
8天前
|
数据可视化 算法 数据挖掘
Python时间序列分析工具Aeon使用指南
**Aeon** 是一个遵循 scikit-learn API 风格的开源 Python 库,专注于时间序列处理。它提供了分类、回归、聚类、预测建模和数据预处理等功能模块,支持多种算法和自定义距离度量。Aeon 活跃开发并持续更新至2024年,与 pandas 1.4.0 版本兼容,内置可视化工具,适合数据探索和基础分析任务。尽管在高级功能和性能优化方面有提升空间,但其简洁的 API 和完整的基础功能使其成为时间序列分析的有效工具。
60 37
Python时间序列分析工具Aeon使用指南
|
4天前
|
机器学习/深度学习 运维 数据可视化
Python时间序列分析:使用TSFresh进行自动化特征提取
TSFresh 是一个专门用于时间序列数据特征自动提取的框架,支持分类、回归和异常检测等机器学习任务。它通过自动化特征工程流程,处理数百个统计特征(如均值、方差、自相关性等),并通过假设检验筛选显著特征,提升分析效率。TSFresh 支持单变量和多变量时间序列数据,能够与 scikit-learn 等库无缝集成,适用于大规模时间序列数据的特征提取与模型训练。其工作流程包括数据格式转换、特征提取和选择,并提供可视化工具帮助理解特征分布及与目标变量的关系。
38 16
Python时间序列分析:使用TSFresh进行自动化特征提取
|
1月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费习惯分析的深度学习模型
使用Python实现智能食品消费习惯分析的深度学习模型
152 68
|
3天前
|
数据采集 缓存 API
python爬取Boss直聘,分析北京招聘市场
本文介绍了如何使用Python爬虫技术从Boss直聘平台上获取深圳地区的招聘数据,并进行数据分析,以帮助求职者更好地了解市场动态和职位需求。
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费市场分析的深度学习模型
使用Python实现智能食品消费市场分析的深度学习模型
130 36
|
1月前
|
数据可视化 算法 数据挖掘
Python量化投资实践:基于蒙特卡洛模拟的投资组合风险建模与分析
蒙特卡洛模拟是一种利用重复随机抽样解决确定性问题的计算方法,广泛应用于金融领域的不确定性建模和风险评估。本文介绍如何使用Python和EODHD API获取历史交易数据,通过模拟生成未来价格路径,分析投资风险与收益,包括VaR和CVaR计算,以辅助投资者制定合理决策。
80 15
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费趋势分析的深度学习模型
使用Python实现智能食品消费趋势分析的深度学习模型
129 18