数据看Kobe,请让我以这样的方式说再见

简介:

0?wx_fmt=jpeg

0?wx_fmt=jpeg


“When we first met, I was just a kid.”

When you decide to leave, I am no longer a boy !

———献给看着Kobe打球长大的所有人


在2011年的时候,一位球迷为科比设计了一款T恤,样式上并无特别之处,文字上却打动人心,设计者在T恤上写道:“那些现在恨我的人,当我离开的时候,会想念我的。”


时间飞驰,转眼间飞侠真的要说再见了……

0?wx_fmt=jpeg


从1996年进入NBA,到如今已是飞侠的第20个赛季,由于近两年重大伤病,科比的状态下滑很快,本赛季他出场12次,场均上场30.8分钟,贡献15.7分、4.1个篮板、3.4次助攻,投篮命中率仅有31.5%左右。

0?wx_fmt=jpeg

作为看着飞侠打球长大的90后,实在感到很悲伤,一代传奇即将落幕!下面笔者,通过科比整个职业生涯的数据来简单分析下飞侠与其他传奇巨星的对比及职业生涯状态的变化!

0?wx_fmt=jpeg

技术说明:R语言抓取数据,数据来源:http://stats.nba.com/



以下是对科比以往比赛成绩数据的简单分析

一、抓取Kobe数据并对原始数据进行处理

利用R语言抓取科比职业生涯20个赛季的数据,并对初始数据作处理,得出以下数据:

0?wx_fmt=jpeg

0?wx_fmt=jpeg


本文,我们重点致敬飞侠,再加上篇幅所限,在此就不啰嗦爬虫程序及数据了。


二、Kobe数据分析

1、Kobe与乔丹差别在哪里?看下图:

0?wx_fmt=jpeg

两人除了在三分球数据上有点较大的出入外,其它数据二人旗鼓相当,NBA历史上最伟大SG,非两人莫属!


2、看一下NBA史上几大巨星的效率值


0?wx_fmt=jpeg



霍林格效率值,请参考度娘:http://baike.baidu.com/link?url=1SGJ38xBOFfODCiqX2tmjoIdB6eSdOyZXCh9OsZ3PmKf9oiFcIMsLWskgk1mQVGKAsstEwJkHbQYgX5sBKky-q


不难看出,几大传奇球星在职业生涯不同阶段的效率值变化趋势接近吻合,拉塞尔效率均值偏低但是最稳定;Kobe大神在22-33岁之间效率值稳定,其它年龄段起伏较大,变化趋势与Jordan类似,看来这两位在NBA历史上的地位排名注定相伴相随!


3、聚类分析

首先,了解的朋友知道,科比职业生涯的前两个赛季是比较惨淡的,除了在97年新秀赛季夺得扣篮赛冠军外,并未有太多释放光芒的地方;不过此后,星光开始绽放,截止12-13赛季,基本上都处于巨星状态;随后的三个赛季,由于伤病等的影响,状态明显下滑。所以,我们根据实际情况,将科比96-97、97-98、13-14、14-15、15-16赛季分类为“低谷”赛季,其它赛季分类为“巨星”赛季。

做一个简单的kmeans聚类分析,聚类的结果如下:

0?wx_fmt=jpeg


将聚类结果与上面的实际分类作比较,如下图:

0?wx_fmt=jpeg

可以看出聚类结果跟我们之前设想的差不多,仅有14-15赛季仍被判定为“巨星”赛季!


其它分类,感兴趣的童鞋可以去自己探索,这里时间有限就不再继续了!想要数据的童鞋,可以加笔者微信(lhf_Peter)索要!


最后:你巅峰时我慕名而来,你落寞时我无法转身离开! 送给Kobe……



原文发布时间为:2015-12-05

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
7天前
|
缓存 架构师 NoSQL
五种更新缓存的组合方式
【4月更文挑战第19天】更新缓存的步骤特别简单,共两步:更新数据库和更新缓存。但这简单的两步中需要考虑很多问题。
|
2月前
|
分布式计算 DataWorks 数据处理
DataWork数据处理问题之属性覆盖掉如何解决
DataWork数据处理是指使用DataWorks平台进行数据开发、数据处理和数据治理的活动;本合集将涵盖DataWork数据处理的工作流程、工具使用和问题排查,帮助用户提高数据处理的效率和质量。
27 0
|
4月前
|
缓存 NoSQL 关系型数据库
缓存的设计方式
缓存的设计方式
|
9月前
|
JavaScript
|
11月前
|
人工智能 自动驾驶 新能源
“以终为始”的正确使用方式
“以终为始”的正确使用方式
106 0
|
存储
V7768-320001 通常是以临时的方式构建
V7768-320001 通常是以临时的方式构建
107 0
V7768-320001 通常是以临时的方式构建
|
存储 SQL 自然语言处理
如何从800万数据中快速捞出自己想要的数据?
如何从800万数据中快速捞出自己想要的数据?
143 0
如何从800万数据中快速捞出自己想要的数据?
系统通信方式操作
系统通信方式操作
44 0
系统通信方式操作
|
网络协议 Dubbo NoSQL
服务探活的五种方式
总之一句话总结起来就是Provider节点没有摘除流量前,就无法处理请求了。可以分为三类: 系统异常:如断电、断网、其他硬件故障、或操作系统异常退出 进程异常退出:进程异常退出,端口挂掉,如有注销机制但没来得及注销,如执行了kill -9 进程无法处理请求:端口还在,但服务无法正常响应,如Full GC期间
838 0
服务探活的五种方式
思考方式
思考方式
810 0