NBA 举办编程马拉松 - 数据分析时代的到来

简介: 比赛规则很简单:每个团队对NBA提供的数据进行统计分析,数据本身不允许篡改,否则将被取消资格。时间从上午9点开始,在下午5:15结束,历时8小时15分钟。

据 TechCrunch 报道:NBA 最近在纽约曼哈顿举办了一项邀请活动:编程马拉松(Hackathon)。 他们打算建立一种新的视角来看待比赛数据。



美国人很钟情于运动,棒球是其中之一。MLB(职棒大联盟)是使用统计分析和预测的先行者:打击、防守、投球、失误等。与此同时,NBA 近年来一直致力于提高评论员、教练和球员的统计分析能力--这次首届编程马拉松就是最新的尝试。



此次活动邀请的参赛人员包括本科生、研究生和博士生,200个程序员被分为三个等级,面对不同的挑战。


比赛规则很简单:每个团队对NBA提供的数据进行统计分析,数据本身不允许篡改,否则将被取消资格。时间从上午9点开始,在下午5:15结束,历时8小时15分钟。


这并不是件容易的任务:原始数据超过 5GB,包括投篮数据、回合数据、精确至1/25秒的球员追踪数据等。



最终,由哥伦比亚大学研究生 Alex Wainger、Zac Robertson、纽约大学本科生 Ella Kuzmenko 和佩斯大学本科生 William Robbins 组成的团队赢得了比赛冠军。


他们夺冠项目名为“反对英雄球”。


在分析数据库时,他们放弃了一些已有的可行建议,比如创建一个防御的效率公式或者分析如何能让投篮更准,而是选择将运动员在常规赛和季后赛中的运动趋势做一个对比。他们假设在常规赛中,运动员的打球方式更以团队为中心,而在季后赛中,他们更倾向于人们所谓的“英雄球”式的打法。最终他们用 python 处理了 5g 的数据库,抽丝剥茧取出了有用数据,建立一个 d3 的应用(d3.js,一个 JavaScript 库)挂载在 github 的网页上。一个坐标轴上显示常规赛的统计信息,另一个坐标轴上显示季后赛的统计信息,还有一个45度的直线表示在两种情况下的相同行为方式,可以选择一个数据并以交互的方式在图标上看团队的数据移动。数据表明最终在季后赛的队伍,相比常规赛,运动趋势数据中多了 15% 的运球,10% 站立,少了 4% 的传球和 4% 的持球得分。也就是说,球员在季后赛往往会更自私地打球。



问起他们为什么参加 NBA 编程马拉松,其中一名队员表示,他看到了在这里的学习机会。作为一个NBA的数据控,他对比赛背后的教练方法和数据分析非常感兴趣,通过这个活动可以认识更多在数据分析领域中杰出的人。


他们的项目也发布在了 Github 上:

https://github.com/alexwainger/NBASubstitutionPatterns

在线演示地址:

http://alexwainger.github.io/NBASubstitutionPatterns/

如今像篮球这样的运动都已经开始大量地依赖计算机程序做数据分析,可想而知,还有什么领域可以置身事外。如果现在还觉得,不是程序员,不是搞理工科的,是否懂计算机懂编程都无所谓,那这恐怕是个很危险的想法。不要再只顾着抱怨别人用脚本抢走你的月饼了,或许不久后的某一天,计算机就会抢走你的饭碗……

附:The NBA’s first hackathon: How is the future coming for the league?

https://techcrunch.com/2016/10/05/the-nbas-first-hackathon-how-is-the-future-coming-for-the-league/


近期文章推荐阅读:

刷票有风险,抢购需谨慎

爆款游戏《贪吃蛇大作战》的 Python 实现

Python 与 Excel 不得不说的事

想用 Python 做数据分析?先玩玩这个再说

用 Python 实现你的量化交易策略

Python爬虫:一些常用的爬虫技巧总结

Python 抓取网页乱码原因分析

一些常见的新手问题

相关文章
|
数据采集 Python 数据挖掘
Python爬虫系列实战-采集NBA常规赛数据分析三分命中率
爬取的网站为:stat-nba.com,这里爬取的是NBA2016-2017赛季常规赛至2017年1月7日的数据; 改变url_header和url_tail即可爬取特定的其他数据。
|
23天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
70 4
数据分析的 10 个最佳 Python 库
|
4月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
91 2
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
215 4
|
4月前
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
94 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
|
1月前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
数据分析之旅:用Python探索世界
数据分析之旅:用Python探索世界
35 2
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
【9月更文挑战第2天】数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
66 5
|
4月前
|
供应链 数据可视化 数据挖掘
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
本文详细介绍了第十一届泰迪杯数据挖掘挑战赛B题的解决方案,涵盖了对产品订单数据的深入分析、多种因素对需求量影响的探讨,并建立了数学模型进行未来需求量的预测,同时提供了Python代码实现和结果可视化的方法。
141 3
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
|
4月前
|
机器学习/深度学习 数据采集 数据挖掘
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二
本文提供了第十一届泰迪杯数据挖掘挑战赛B题问题二的详细解题步骤,包括时间序列预测模型的建立、多元输入时间预测问题的分析、时间序列预测的建模步骤、改进模型的方法,以及使用Python进行SARIMA模型拟合和预测的具体实现过程。
101 1