NBA官方球衣销量榜“詹皇”居首,快看看你的偶像排第几

简介: NBA官方球衣销量榜“詹皇”居首,快看看你的偶像排第几

本期导读

近几日,NBA官方公布了NBA商店欧洲官网NBAStore.eu本赛季至今的球衣等周边产品销售情况。湖人前锋勒布朗-詹姆斯在球员球衣销量中名列第一,湖人在球队产品销量中名列第一,这是詹姆斯和湖人连续两年包揽欧洲地区NBA球衣/球队产品销量头名。本期我们使用python分析一下这份榜单中的球员近几年比赛数据,看看有什么新发现。


欧洲地区球衣销量排名前十的球员:

  1. 勒布朗-詹姆斯
  2. 凯文-杜兰特
  3. 斯蒂芬-库里
  4. 凯里-欧文
  5. 詹姆斯-哈登
  6. 卢卡-东契奇
  7. 扬尼斯-阿德托昆博
  8. 贾-莫兰特
  9. 吉米-巴特勒
  10. 扎克-拉文


1. 网页分析

球员数据网址:http://www.stat-nba.com/playerList.php

这里我们分析榜单前五球员11-12赛季至19-20赛季的数据,感兴趣的小伙伴也可以分析更多球员的数据。
以詹姆斯为例:

提取历年球员的篮板、助攻和得分三项数据,F12查看一下网页源码如下:

这个网页还是比较友好的,数据比较规整,仔细分析可以看出数据在一个table里面,每个tr标签代表一行数据(一个赛季的数据),第14/17/22列分别对应篮板、助攻和得分数据,注意这里列号从0开始,大家在学习的时候要养成列表索引从0开始的习惯。


2. 数据采集


詹姆斯数据网址:http://www.stat-nba.com/player/1862.html

def getdata():
    url = 'http://www.stat-nba.com/player/1862.html'
    ua = UserAgent()
    headers = {'User-Agent': ua.random}
    r = requests.get(url, headers=headers)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    soup = BeautifulSoup(r.text,'html.parser')
    lsts = soup.find_all('table',attrs={'class':'stat_box'})
    trb_sorce = []
    ast_sorce = []
    pts_sorce = []
    for index,lst in enumerate(lsts[1].find_all(attrs={'class':'sort'})[:9]):
        # 篮板
        trb = lst.find(attrs={'class':'normal trb change_color col14 row{}'.format(index)}).text
        # 助攻
        ast = lst.find(attrs={'class':'normal ast change_color col17 row{}'.format(index)}).text
        # 得分
                pts = lst.find(attrs={'class':'normal pts change_color col22 row{}'.format()}).text
        trb_sorce.append(int(trb))
        ast_sorce.append(int(ast))
        pts_sorce.append(int(pts))
    print(trb_sorce)
    print(ast_sorce)
    print(pts_sorce)
    # [472, 465, 709, 639, 565, 416, 533, 610, 492]
    # [636, 454, 747, 646, 514, 511, 488, 551, 387]
    # [1544, 1505, 2251, 1954, 1920, 1743, 2089, 2036, 1683]

以上就获取了詹姆斯11-12赛季至19-20赛季的三项数据。

接下来采集分列榜单2-5位的杜兰特,库里,欧文,哈登几个赛季的数据,网址如下:

# 杜兰特
'http://www.stat-nba.com/player/779.html'
# 库里
'http://www.stat-nba.com/player/526.html'
# 欧文
'http://www.stat-nba.com/player/1690.html'
# 哈登
'http://www.stat-nba.com/player/1628.html'

可以看到,各球员数据网址只有球员id不同,构建球员id字典:

dic = {'詹姆斯': 1862, '杜兰特': 779, '库里': 526, '欧文': 1690, '哈登': 1628}


数据采集

def getdata(number):
    url = 'http://www.stat-nba.com/player/{}.html'.format(number)
    ua = UserAgent()
    headers = {'User-Agent': ua.random}
    r = requests.get(url, headers=headers)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    soup = BeautifulSoup(r.text,'html.parser')
    lsts = soup.find_all('table',attrs={'class':'stat_box'})
    one_info = []
    trb_sorce = []
    ast_sorce = []
    pts_sorce = []
    for index,lst in enumerate(lsts[1].find_all(attrs={'class':'sort'})[:5]):
        # 篮板
        trb = lst.find(attrs={'class':'normal trb change_color col14 row{}'.format(index)}).text
        # 助攻
        ast = lst.find(attrs={'class':'normal ast change_color col17 row{}'.format(index)}).text
        # 得分
        pts = lst.find(attrs={'class':'normal pts change_color col22 row{}'.format(index)}).text
        trb_sorce.append(int(trb))
        ast_sorce.append(int(ast))
        pts_sorce.append(int(pts))
    trb_sorce.reverse()
    ast_sorce.reverse()
    pts_sorce.reverse()
    one_info.append(trb_sorce)
    one_info.append(ast_sorce)
    one_info.append(pts_sorce)
    print(trb_sorce)
    print(ast_sorce)
    print(pts_sorce)
    return one_info

采集效果:

# 詹姆斯
[492, 610, 533, 416, 565, 639, 709, 465, 472]
[387, 551, 488, 511, 514, 646, 747, 454, 636]
[1683, 2036, 2089, 1743, 1920, 1954, 2251, 1505, 1544]
# 杜兰特
[533, 527, 640, 598, 178, 589, 513, 464, 497]
[214, 231, 374, 445, 110, 361, 300, 366, 457]
[2161, 1850, 2280, 2593, 686, 2029, 1555, 1792, 2027]
# 库里
[88, 314, 334, 341, 430, 353, 261, 369, 26]
[138, 539, 666, 619, 527, 524, 310, 361, 33]
[383, 1786, 1873, 1900, 2375, 1999, 1346, 1881, 104]
# 欧文
[191, 216, 259, 237, 157, 230, 227, 335, 103]
[275, 350, 433, 389, 250, 418, 306, 464, 128]
[944, 1325, 1478, 1628, 1041, 1816, 1466, 1596, 548]
# 哈登
[252, 379, 344, 459, 501, 659, 389, 518, 387]
[229, 455, 446, 565, 612, 907, 630, 586, 450]
[1044, 2023, 1851, 2217, 2376, 2356, 2191, 2818, 2096]


3. 可视化

3.1 詹姆斯近五个赛季数据:

也可以做成双纵坐标:

3.2 赛季数据时间序列化:

完。


END


以上就是本期为大家整理的全部内容了,小伙伴们也可以从其他角度进行数据分析和可视化,赶快练习起来吧,如需代码,后台回复“NBA”即可,喜欢的朋友可以点赞、点在看也可以分享到朋友圈让更多人知道哦


相关文章
|
2月前
|
运维 Java 大数据
团子东子开奖了,这泼天的富贵!
团子东子开奖了,这泼天的富贵!
51 0
团子东子开奖了,这泼天的富贵!
|
8月前
|
数据采集 Web App开发 JSON
数说成龙电影|数据告诉你,成龙大哥真的老了吗
数说成龙电影|数据告诉你,成龙大哥真的老了吗
130 0
|
存储 数据采集 关系型数据库
国足晋级12强 | 爬取《NBA30支球队》“现役球员信息”,再来看看篮球吧!
国足晋级12强 | 爬取《NBA30支球队》“现役球员信息”,再来看看篮球吧!
国足晋级12强 | 爬取《NBA30支球队》“现役球员信息”,再来看看篮球吧!
|
新零售 人工智能 供应链
破壳2周造百万销量,荣耀20系列:三个超级炸弹的“寒潮逆袭”
破壳2周造百万销量,荣耀20系列:三个超级炸弹的“寒潮逆袭”
175 0
破壳2周造百万销量,荣耀20系列:三个超级炸弹的“寒潮逆袭”
|
Android开发
程序人生 - 为什么王者荣耀有排名没称号,周一几点有荣耀称号?
程序人生 - 为什么王者荣耀有排名没称号,周一几点有荣耀称号?
244 0
|
程序员 定位技术 双11
天猫双11:女生一天买了几十亿,程序员最爱还是格子衫
那些嘴上说不买的人,身体却很诚实地拼了一个10亿元的大单。
天猫双11:女生一天买了几十亿,程序员最爱还是格子衫
|
新零售 大数据 搜索推荐
8月17日科技联播:搜索热度赶超214情人节,七夕成中国情侣“撒狗粮”官方指定时间
行行好,给单身狗一条活路呗,七夕已经当仁不让地成为“过浪漫”、“撒狗粮”官方指定时间,红芯浏览器微信致歉不应强调国产自主,这样的道歉你接受吗?“靠脸吃饭”的时代真的来了,支付宝宣布刷脸支付已经具备商业化的能力!.....在.“七夕效应”的影响下,今天的科技圈比较平静,可能大家都去撒狗粮了!
2170 0
|
大数据
NBA球星是如何投篮的?把詹姆斯、库里的投篮数据图3D打印出来
2017-2018的NBA赛季已经落幕。虽然勇士夺冠的结果没有出乎太多人的意料,但是一些扣人心弦的戏码还是令人印象深刻。
2015 0