电影《点球成金》告诉我们,数据科学家能解决球队老板用钱解决不了的问题:打造一支冠军球队。“这并不奇怪”,哈佛大学定量社会科学研究院的主任Gary King说,“如果你总结一下那些数据分析能够起到巨大作用的行业的特点,你就会发现,职业体育行业基本具备了这些特点,这也就是为什么数据分析在职业体育中具有如此重要的作用的原因。”文中所说职业体育的特点就是可定量,而大数据则是通过定量的数据比对,来找到解决问题的方法。这一点对于世界第一运动的足球尤为重要,先来说说马云要来搅局的中超。
好不好的联赛
大数据是有能力帮助提升一个联赛的水平。2004年创立的中超,只是模仿英超取个名字,可是水平不怎么样,但差在什么地方,要从哪些方面来看提升,好像没有太明确的方向。当方向不确定的时候,出现笑话也就再所难免,我们在追求足球风格时,曾经提出了一个莫须有的“欧洲拉丁派”,甚至提出要锻炼 “叉腰肌”,而大数据时代则大不同了。
以前,关于足球的数据统计只有角球、任意球、红黄牌和射门次数,大数据时代,联赛水平的体现有了许多直观的参数,如跑动距离、有效比赛时间、移动轨迹、控球时间、传球次数等等。以跑动距离、有效比赛时间作比即可一分高下,2010年国际足联的相关统计,职业足球运动员全场跑动距离平均为10000米,中超球员为7000米左右;有效比赛时间,2011年中超的实际有效时间为场均49分03秒,韩国联赛为56分09秒,欧冠联赛场均比赛有效时间为62分39秒。
再从大数据的角度来看,2012年和2013年的中超平均跑动距离都是超过万米;有效时间,2012年超过50分钟,2014年的目标是60分钟,中超的水平确实有了提升,要不也不会有场均1.8万人的现场观众,好歹也是亚洲第一,世界第十。
一个联赛的水平,不光体现在竞技水平上,还会体现在对媒体、对球迷的服务上,从这个方面再看大数据对已经高度职业化的NBA的帮助。NBA官方网站之前有内部的统计工具,只有一些授权的媒体可以使用做一些高级的深入数据分析,2012年,NBA与数据分析解决方案公司合作,NBA从得分、进攻、防守、做球等几大类统计了多达90多项技术指标,数据公司帮助处理NBA高达4500万亿条分割的统计数据。
所以到当2013年圣诞节时,NBA可以很快地告诉一个球迷从1947年开始NBA圣诞节特别节目开始,他喜欢的球队多少次出现在圣诞节比赛中。解说员经常会说“第三节时科比和奥尼尔合起来得分超过55分,湖人队没有输过”之类的话语,一边说一边可能感谢万能的大数据。
累不累的训练
联赛水平的根基在于日常训练,这一点大家应该没有什么疑义。但这一切没有在大数据时,训练更多地是从精神层面来要求,比如“女排精神”“三从一大”(从难、从严、从实战出发,大运动量),这种口号好提但是具体怎么做却无从下手。
当年流行于中国的12分钟体测,之前一直说是提高运动员的体能,到最后足协官员也承认“无氧耐力法测试的是一种精神力量”。
正是由于训练中长期缺乏数据,尤其是大数据的指导,才会只沦落到精神层面为主导。现在训练中应用大数据的例子,在足球发达国家例子已经很多了,而这两年中超的球队也在注重训练中大数据的使用,广州恒大、山东鲁能、江苏舜天等等。
新浪体育是这么介绍,山东鲁能采用的GPSports系统:
这套高科技系统对队员们在训练中的心率、速度,距离,加速度和减速度等指标进行记录、分析和监控,监控队员的训练量是否达到或超过相应的指标,同时,也能预防队员在训练中出现的伤病。通过科学的训练方法,对队员们训练提高和预防伤病起到很大的作用。
不知道当年被称为“亚洲第一前锋”的郝海东,足协体测困难户,多次面临拿不到上岗证的他,现在了解到这种基于大数据的训练方法会作何感想?
中超的球队普遍是今年刚用上这些设备,可能还没有来得及享受到大数据的好处,英超球队埃弗顿、英格兰主力鲁尼的老东家这个方面有发言权,他们是这么评价大数据的作用:
我们用GPS和心率测量仪来监测每个球员的状态。从体能的角度来说,最显著的数据是冲刺数量、冲刺距离和每个球员投入的高强度运动次数。我们这样监测一整个赛季下来,就能知道一个球员目前状态是否疲劳,以及他需要多久的休息时间。
快不快的速滑
说完了团体运动的足球,再来看看更侧重于个人的速度滑冰,虽然它不是那么的职业化,但是这种更强调个人技巧的运动,大数据对其的作用更大。
2010年,4年前的温哥华冬奥会,前4项比赛,韩国速度滑冰运动员获得2金1银的优异表现,要知道这是在堪称“短道速滑之国”的国家在温哥华大道赛场上所取得的,其中的秘诀何在?
之后,人们从数据方面分析,发现韩国队的拐弯时候,速度比其他国家的要快。通过这个大数据的分析,再结合慢镜头,人们发现了韩国队的先进技术:在过弯时,通过身体重点心转移,步点的转换,达到一个不减速的效果,甚至还可以加速。
就是凭借这个先进技术,一时间在温哥华的赛场刮起“韩流”。
大数据已经很大程度上影响到职业体育的水平,另一方面,对于职业体育来说,所从事的运动不同对于大数据有不同的应用需求,例如,足球和篮球所遇到的大数据问题是不一样的,团体与个人的运动又会是大不同。海量数据处理的复杂性,对数据中心的计算能力提出了挑战,英特尔就正利用自己在计算领域长久的积累,从支撑计算的芯片产品,到实现分析的解决方案,在职业体育上发挥着不可替代的作用。 好教练难求,但是经过计算和处理的多维度的数据却是可以普及和借鉴的。大数据改变职业体育,并赋予职业体育全新的商业价值,并非一件遥不可及的事。
当然大数据也有其局限性,埃弗顿主教练马丁内斯和他的球探里弗斯和布朗都认为“光凭数据就能买进某个球员”这种想法是十分荒谬的,博尔顿的分析研究总监布莱恩·普莱斯迪奇甚至举出了一个反例:自从他们的守门员开始研究对方的点球手的数据以后,他的扑点球效率反而降低了,过去两个赛季只有9%的成功率。
职业体育与大数据结合,确实对职业体育影响很大,也得出了很多有用的结论,但通过大数据彻底影响比赛结果,目前可能性不大,体育运动,其最大的魅力恰恰在于不可完全预测的下一秒。
原文发布时间为:2014-07-05
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号