大数据分析,足球运动的“料理师”

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

球赛开始2小时前,ProZone公司的数据分析师们就已经早早的坐在了各种设备前。在接下来的4个小时内,他们将不断的进行比赛记录、慢镜回放、动作分析,四年轮回的等待换来这难得的丰收时刻。智慧的他们知道,即使一天之隔的两场比赛,队员的表现也是截然不同的。凭借对数据本能的直觉,每场比赛,他们都会穿梭于不同的城市,尽量将这份自然的馈赠完美的保存下来……

这不是舌尖上的中国,而是欧洲杯期间常见的一幕场景。随着大数据技术在足球运动中的应用日益广泛,大数据分析师正逐渐成为现代足球中一种另类的“食材料理师”,用数字化的方式解读比赛,帮助教练、俱乐部这些“大厨”们烹饪出更美味的“食物”。

大数据分析,足球运动的“料理师” 

大数据分析,现代足球的“食材料理师”

大数据和足球的关系,人们理解或者是接触最多的就是对比赛结果的预测。如高盛和德银等投行就通过将FIFA排名、过往战绩、近期表现、球员身价、赌球赔率、国家经济等一系列数据综合反映出的球队实力作为预测依据去考量比赛结果。其实,在足球赛场上大数据分析,已经被运用在了战术布置、球员训练等各个领域。

现在,英超的20支球队都在主场配备了8-10台数码摄像机来捕捉球员在球场上的表现。现在的统计技术可以精确到每一秒,一场比赛下来会记录下22名球员的10个技术统计项目,共140万项数据。而类似ProZone这样的大数据服务公司接下来会把这些数据进行编码,分析每一次拦截、射门或者传球,供主教练和数据分析师来判断场上到底发生了什么。

大数据分析,足球运动的“料理师” 

而对于主教练来说,使用大数据的价值在于寻找到关键的1%部分。比如说,在2006年德国与阿根廷的点球大战中,德国门将莱曼得到了一张小纸条,上面记录着阿根廷核心球员的点球习惯:里克尔梅,惯射左;克雷斯波,助跑距离长为右,助跑距离短为左;海因策,惯射左下;阿亚拉,等待时间长+助跑距离长为右;梅西,惯射左;艾马尔,等待时间长为左;罗德里格斯,惯射左。根据这张纸条的内容,莱曼选对了所有点球的方向,并扑出了阿亚拉和坎比亚索的点球,让德国顺利挺进半决赛。

这张小纸条的提供者便是科隆德国体育学院的一个志愿者团队“科隆团队”,他们在2010年打造的“梅西计划”帮助德国队在八强战中又一次重创阿根廷队。经过分析,他们为德国队如何防守梅西提出一个解决方案:在梅西每一次拿球的时候,德国队都应该有两名后卫在他的身旁,一个在梅西前方一码的位置,另一个在梅西后方一码的位置。最终德国队4-0完胜阿根廷队,梅西几乎全场隐身。

 “科隆团队”在2006年的时候还只是由16名学生组成一个团队,负责分析31支球队;而到了2012年欧洲杯的时候,这个团队已经拥有了45名成员,负责15支球队的分析。在四年前的欧洲杯开幕之前,德国队教练组得到了一份几百页的资料;而在欧洲杯进行的过程当中,他们还得到了一份40页的简报,和记录了对手们详细情况的视频光盘。这些文件已经变得越来越精密:后卫们的转身时间,边锋们常用的进球线路,一名后卫阻断对手进攻的最佳距离——这些现代数据使得数据分析上升到了一个全新的层次。

大数据需要天资聪颖的“弟子”

虽然大数据分析对提升球队水平价值巨大,但想要真正发挥这项技术的价值并非吃饭喝水那么简单。如果将ProZone、Opta等数据服务公司看作是一个个“流派”,那么天资聪颖、根骨奇佳的“弟子”与天生驽钝、根骨不好的“弟子”,学习同样的“秘笈”所消耗的时间与学习效果,显然不可同日而语。因此,虽然大数据技术的核心是软件,但大数据处理平台的好坏同样也非常重要。

那么如何选择一个好的大数据处理平台呢?简单来说有三点,就是存的起、扩的开、算的快。要知道,足球大数据的足球运动中产生的数据量远远超出了我们的想象。打个比方,10个球员用3个球进行训练,10分钟就能产生出700万个可供分析的数据点,这仅仅是运动传感数据的一部分,要进行全面的分析,还要对视频录像、监控等非结构化数据、现场采集的球员运动数据以及历史存档数据进行采集处理和分析,数据规模可达上百GB甚至达到TB级,而每支球队每年的比赛时间以30场计算都要达到2700分钟,其中生产出来的数据规模可想而知有多大。

浪潮近期推出的云海Insight大数据处理平台,所包含的三个产品组件:云海Insight HD、云海Insight MPP、云海Insight MemDB,可以分别对应不同的大数据应用场景,涵盖了当前主流的分布式数据存储和计算组件,能支持结构化、非结构化、半结构化等几乎全部数据类型的处理。帮助用户方便快捷地架起完整的大数据处理平台,对各类数据进行整理、交叉分析、比对碰撞、内容检索、深度挖掘、特征提取等。帮助用户构建海量数据的“极速”处理能力,应对大数据的复杂应用场景,发掘大数据的真正价值。

大数据分析,足球运动的“料理师”

当足球遭遇大数据,人们不禁会疑虑,未来的比赛胜负到底是靠计算还是直觉?其实,大数据技术从现在来看,更多的还是在提升球员水平、制定合理战术层面发挥作用,而决定比赛胜负的除了这些,还有球员的临场发挥等不确定因素,偶然性恰恰是足球比赛最大的魅力所在。因此,比赛数据落后的葡萄牙最终获得欧洲杯冠军,才会让葡萄牙球迷更加欣喜若狂,却让法国球迷无法接受。我们只需要知道,大数据会让比赛对抗更加激烈、好看就足够了,不是吗?


原文发布时间为:2016-07-19

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。



相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
67 4
|
26天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
88 2
|
2月前
|
SQL 消息中间件 分布式计算
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
72 5
|
15天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
32 4
|
16天前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
30 4
|
17天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
104 5
|
29天前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
109 14
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
84 2
|
1月前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
1月前
|
机器学习/深度学习 搜索推荐 大数据
大数据与教育:学生表现分析的工具
【10月更文挑战第31天】在数字化时代,大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用,介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具,帮助教育者更好地理解学生需求,制定个性化教学策略,提升教学效果。尽管面临数据隐私等挑战,大数据仍为教育创新带来巨大机遇。