大数据更懂球?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

足球乃至体育运动天生和数字相关。比分牌上的比分,球衣背后的号码还有教练和电视解说员念念叨叨的各种阵型……竞技场上,数字无处不在。

2010年,时逢南非世界杯,英国体育记者西蒙·库珀和经济学者史蒂芬·西曼斯基合写的《足球经济学》一书在国内引进,我们得见大数据理论是如何评球的。今年法国欧洲杯鸣哨之时,又一本关于大数据的足球著作《数字游戏》引进国内。《数字游戏》和《足球经济学》用大数据统计给出众多颠覆性观点,不过结论并不一致。比如《数字游戏》坚持认为足球在全球化的进程中越来越平衡了;《足球经济学》则力主足球生来不平衡,坐落在超大城市的富有俱乐部将垄断冠军。

大数据并非只有微观关注,计较于球场上的一战得失,更关注足球在全球化背景下的宏观趋势。

欧洲杯之夏,英国“脱欧”抢了头条。已故美国历史学家托尼·朱特预言欧盟危机,其在《战后欧洲史》中写道:“真正把整个欧洲连在一起的,还是足球。”足球的影响力,远超球场。

一、赢得比赛是靠实力还是靠运气

《数字游戏》一书的答案是:一半靠运气,一半靠实力。

德国明斯特大学的理论化学家安德列亚斯·霍伊尔和他的团队研究了近20年的德甲比赛,结果发现,从数学角度来说,一场足球比赛非常类似于两个球队各抛三枚硬币,三次都正面朝上代表一个进球。他们断定运气是决定胜负的关键因素,其次才是球队的实力。

德国慕尼黑理工大学教授马丁·拉姆斯是拜仁慕尼黑队的高参。拉姆斯和他的团队观看了超过2500个进球、上万小时的视频录像,分析足球场上的“运气球”。最终的数字是44.4%,同时,幸运进球经常发生在0比0的僵持局面时。

来自美国洛斯阿拉莫斯国家实验室的三位科学家,分析了从1888年开始的英格兰足球顶级联赛、1901年起的美国职棒大联盟比赛、1917年开始的美国冰球联赛和1922年诞生的美式橄榄球联盟的30万场比赛,同样发现足球是其中最难预测的。在超过43000场足球比赛中,黑马获胜的比例竟然达到了45.2%。

二、为什么进球越来越少

大家总在抱怨足球大赛进球越来越少,本届欧洲杯也不例外。欧洲杯36场小组赛,场均进球数只有1.92个,这一数字远逊上届的2.5球和巴西世界杯的2.83球。

为什么进球反而越来越少?因为当梅西、C罗或伊布这样的进攻球员的能力达到新高度时,限制他们的战术同样在提高。曾经足球是以进攻为主导的运动,如今已经演化为进球和不丢球同等重要。足球运动中的进攻和防守基本实现了平衡。比如在一个赛季的英超联赛中,每多进10个球,可以多赢得2.3场比赛。而少丢10个球则相当于多获得2.16场比赛的胜利。

《数字游戏》一书认为,这是当今足球运动发展更加平衡导致的。眼下,足球运动的知识库被全球各地共享,成功的战术打法被各队效法,全世界的球队变得越来越相似。

三、角球重要吗

英国球迷喜欢角球。前切尔西主教练穆里尼奥曾经反问记者:“请你掰手指头算算,全世界有几个国家的球迷给予角球和进球几乎相同的掌声?在我看来只有一个。这样的情况只出现在英格兰。”

数据证明,角球数和射门数是成正比的。射门越多,角球越多。但是,射门和角球次数越多的球队并不一定进球越多。2010/2011赛季的134场英超比赛中出现了1434个角球,每完成4次角球才能形成一次射门,也就意味着有四次都是徒劳。而由角球创造的射门数中,每9次才进一个球。简而言之,一支英超球队平均每十场比赛才能通过角球得分。





====================================分割线================================


本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
传感器 人工智能 大数据
大数据
第二节 大数据 1.大数据的概念 麦肯锡公司对大数据的定义: 大数据是指大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。 维基百科对大数据的定义: 大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间限制的数据集。这并不是一个精确的定义,因为无法确定常用软件工具的范围,可容忍时间也是个概略的描述。 2.大数据的特点 大数据具有5V特点(IBM提出),即: Volume(规模大)、Variety (种类多) 、Velocity (处理速度快)、Value (价值密度低)、Veracity (真实性) 2.大数据的特点 规模大: 数据规模大是大数据的基本属性。
|
大数据
大数据的深入理解
大数据的概念、作用、应用
180 0
|
SQL 弹性计算 运维
初识大数据
了解大数据
111 0
|
新零售 存储 Java
关于大数据最常见的10个问题,必看!
1、云计算与大数据是什么关系?   云计算的关键词在于“整合”,无论你是通过现在已经很成熟的传统的虚拟机切分型技术,还是通过google后来所使用的海量节点聚合型技术,他都是通过将海量的服务器资源通过网络进行整合,调度分配给用户,从而解决用户因为存储计算资源不足所带来的问题。
1276 0
|
存储 人工智能 大数据