各大公司的数据分析业务纷纷进入体育领域
“取得好成绩的不是使用最多数据的,而是使用得最聪明的”
你一定很好奇一艘双体帆船如何能在风速只有不到20节的海面上以70公里每小时的速度行进。船员的技术和经验当然是重要因素。但当丹麦SAP船队出现在5月1日的青岛国际极限帆船赛场上时,是赛前收集的数以TB计的数据资料帮助它在第四轮甩开第二名几十米率先冲线。
“每场比赛都会产生海量的数据,风力、风速和距离数据都对我们在比赛中的表现至关重要。”SAP极限帆船队联合船长Jes Gram-Hansen说。
每艘竞赛帆船上都安装有两个GPS跟踪传感器,这些传感器会把帆船的位置信息、速度和风向距离传送到赛事技术服务商的云服务器上。除此之外,跟踪比赛帆船的裁判船上还配备了用来收集风力风向数据的传感器,这些数据也同时被收集起来。
极限帆船赛的规则很简单——发令枪响,十二只参赛帆船一齐向终点浮标进发,最先到达的船只即为获胜。由于船速甚至可以超过风速,故名“极限”。然而,要想在风云变幻水流不定的海面上名列前茅,船长和舵手必须重点考虑三个要素——与风向的最佳夹角、最佳风向距离和最佳路线。
极限帆船系列赛的官方技术合作伙伴SAP公司的商业信息顾问Milan Cerny表示:“风向距离与绝对距离不同,它是帆船行驶方向与风向夹角所对的直角边。这些数据难以目测和标准化,大数据分析技术却可以实时精确地进行记录分析。”
由于风力和水流因素的影响,直线路线未必最短,也未必最快。计算出帆船在离风力线多远的距离做哪个动作可以让它最快地到达终点就变得十分重要。而这正是大数据分析技术所擅长的。
“由于比赛过程中禁止使用任何电子设备,所以我们会在赛前根据预测做出准确的战术和战略决策,”Jes Gram-Hansen表示,“比赛结束后,大数据会帮助我们分析本场比赛中有哪些问题、哪些需要提高以及哪里做得比较好。”
国际极限帆船比赛一直是各大公司比拼技术的竞技场。每年于美国旧金山海湾举办的美洲杯帆船赛便有甲骨文公司的身影。参加该项比赛的每艘船上都装有三百多个传感器,每秒钟收集10次3000个变量的数据,从船的速度到风力,再到主帆尾帆的角度。而由甲骨文公司提供技术支持的美国队已经连续两年问鼎该项赛事冠军。
甲骨文首席营销官Judy Sim表示:“美国队利用收集到的数据来确定比赛过程中的某个特定阶段更适合用备用的哪艘帆船,而这些分析结果在比赛开始前一小时就能计算完成。”和国际极限帆船赛一样,美洲杯禁止在比赛过程中使用数据分析工具。比赛开始前,这些设备要被打包进一个黑色的漂浮箱,放置在船体两侧,赛后对数据进行回收。
事实上,SAP、甲骨文和IBM等公司的野心远不止于极限帆船这一个项目,它们早已经把触角伸向了网球、F1赛车和NBA等多项国际主流体育赛事的赛场上。
IBM公司从2005年便开始通过Slamtracker追踪网球四大满贯赛事8年来全部8128场、每场4100万个数据点。由这些数据生成的报告Keys to the Match不仅为对阵双方选手呈现出三项获胜的关键指标,还给出了具体的量化标准。
在今年澳网李娜与齐布尔科娃的对战中,Keys to the Match为李娜提供的三项关键指标分别是一发得分率、发球局3拍及以下得分率和ACE球比例。它告诉李娜要想战胜齐布尔科娃,一发得分率必须要达到40%以上;而反过来,齐布尔科娃则要超过60%。
尽管大数据分析技术强大有效,但它的应用却不是一劳永逸的。数据可以帮助运动员理清决定性因素,却不能代替运动员做出决定。Jes Gram-Hansen还是要自己转舵,李娜还是要自己决定要不要来到网前。
“最终使用哪些数据还是要基于人类的判断,那些能够取得好成绩的不是使用最多数据的,而是使用得最聪明的。”Milan Cerny表示。
正如Nate Silver在《信息与噪声》中所说,我们收集的数据越多,从噪声中分辨出信号的难度就越大。过度使用数据反而会不利于有好的表现。“由于旧金山湾地区复杂且瞬息万变的天气状况,数据反而可能产生误导作用。”Judy Sim说。
原文发布时间为:2014-06-01
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号