数据看Kobe,请让我以这样的方式说再见

简介:


“When we first met, I was just a kid.”

When you decide to leave, I am no longer a boy !

———献给看着Kobe打球长大的所有人


在2011年的时候,一位球迷为科比设计了一款T恤,样式上并无特别之处,文字上却打动人心,设计者在T恤上写道:“那些现在恨我的人,当我离开的时候,会想念我的。”


时间飞驰,转眼间飞侠真的要说再见了……


从1996年进入NBA,到如今已是飞侠的第20个赛季,由于近两年重大伤病,科比的状态下滑很快,本赛季他出场12次,场均上场30.8分钟,贡献15.7分、4.1个篮板、3.4次助攻,投篮命中率仅有31.5%左右。


作为看着飞侠打球长大的90后,实在感到很悲伤,一代传奇即将落幕!下面笔者,通过科比整个职业生涯的数据来简单分析下飞侠与其他传奇巨星的对比及职业生涯状态的变化!



技术说明:R语言抓取数据,数据来源:http://stats.nba.com/



以下是对科比以往比赛成绩数据的简单分析

一、抓取Kobe数据并对原始数据进行处理

利用R语言抓取科比职业生涯20个赛季的数据,并对初始数据作处理,得出以下数据:


本文,我们重点致敬飞侠,再加上篇幅所限,在此就不啰嗦爬虫程序及数据了。


二、Kobe数据分析

1、Kobe与乔丹差别在哪里?看下图:


两人除了在三分球数据上有点较大的出入外,其它数据二人旗鼓相当,NBA历史上最伟大SG,非两人莫属!


2、看一下NBA史上几大巨星的效率值




霍林格效率值,请参考度娘:http://baike.baidu.com/link?url=1SGJ38xBOFfODCiqX2tmjoIdB6eSdOyZXCh9OsZ3PmKf9oiFcIMsLWskgk1mQVGKAsstEwJkHbQYgX5sBKky-q


不难看出,几大传奇球星在职业生涯不同阶段的效率值变化趋势接近吻合,拉塞尔效率均值偏低但是最稳定;Kobe大神在22-33岁之间效率值稳定,其它年龄段起伏较大,变化趋势与Jordan类似,看来这两位在NBA历史上的地位排名注定相伴相随!


3、聚类分析

首先,了解的朋友知道,科比职业生涯的前两个赛季是比较惨淡的,除了在97年新秀赛季夺得扣篮赛冠军外,并未有太多释放光芒的地方;不过此后,星光开始绽放,截止12-13赛季,基本上都处于巨星状态;随后的三个赛季,由于伤病等的影响,状态明显下滑。所以,我们根据实际情况,将科比96-97、97-98、13-14、14-15、15-16赛季分类为“低谷”赛季,其它赛季分类为“巨星”赛季。

做一个简单的kmeans聚类分析,聚类的结果如下:



将聚类结果与上面的实际分类作比较,如下图:


可以看出聚类结果跟我们之前设想的差不多,仅有14-15赛季仍被判定为“巨星”赛季!


其它分类,感兴趣的童鞋可以去自己探索,这里时间有限就不再继续了!想要数据的童鞋,可以加笔者微信(lhf_Peter)索要!


最后:你巅峰时我慕名而来,你落寞时我无法转身离开! 送给Kobe……



原文发布时间为:2015-12-05

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
5月前
|
消息中间件 存储 Serverless
函数计算产品使用问题之想要请求持久化该怎么操作
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
6月前
|
存储 缓存 移动开发
详细介绍HTML5的离线储存(工作原理+使用场景+真实使用步骤)
详细介绍HTML5的离线储存(工作原理+使用场景+真实使用步骤)
|
人工智能 自动驾驶 新能源
“以终为始”的正确使用方式
“以终为始”的正确使用方式
145 0
|
JavaScript 前端开发 数据库
(简易)测试数据构造平台:36 - 复杂工具(页面自动获取数据模块)
(简易)测试数据构造平台:36 - 复杂工具(页面自动获取数据模块)
|
存储
V7768-320001 通常是以临时的方式构建
V7768-320001 通常是以临时的方式构建
132 0
V7768-320001 通常是以临时的方式构建
|
前端开发 JavaScript 数据库
(简易)测试数据构造平台:37 - 复杂工具(页面自动获取数据模块后端)
(简易)测试数据构造平台:37 - 复杂工具(页面自动获取数据模块后端)
系统通信方式操作
系统通信方式操作
75 0
系统通信方式操作
|
网络协议 Dubbo NoSQL
服务探活的五种方式
总之一句话总结起来就是Provider节点没有摘除流量前,就无法处理请求了。可以分为三类: 系统异常:如断电、断网、其他硬件故障、或操作系统异常退出 进程异常退出:进程异常退出,端口挂掉,如有注销机制但没来得及注销,如执行了kill -9 进程无法处理请求:端口还在,但服务无法正常响应,如Full GC期间
922 0
服务探活的五种方式
思考方式
思考方式
882 0