大数据更懂球?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

足球乃至体育运动天生和数字相关。比分牌上的比分,球衣背后的号码还有教练和电视解说员念念叨叨的各种阵型……竞技场上,数字无处不在。

2010年,时逢南非世界杯,英国体育记者西蒙·库珀和经济学者史蒂芬·西曼斯基合写的《足球经济学》一书在国内引进,我们得见大数据理论是如何评球的。今年法国欧洲杯鸣哨之时,又一本关于大数据的足球著作《数字游戏》引进国内。《数字游戏》和《足球经济学》用大数据统计给出众多颠覆性观点,不过结论并不一致。比如《数字游戏》坚持认为足球在全球化的进程中越来越平衡了;《足球经济学》则力主足球生来不平衡,坐落在超大城市的富有俱乐部将垄断冠军。

大数据并非只有微观关注,计较于球场上的一战得失,更关注足球在全球化背景下的宏观趋势。

欧洲杯之夏,英国“脱欧”抢了头条。已故美国历史学家托尼·朱特预言欧盟危机,其在《战后欧洲史》中写道:“真正把整个欧洲连在一起的,还是足球。”足球的影响力,远超球场。

一、赢得比赛是靠实力还是靠运气

《数字游戏》一书的答案是:一半靠运气,一半靠实力。

德国明斯特大学的理论化学家安德列亚斯·霍伊尔和他的团队研究了近20年的德甲比赛,结果发现,从数学角度来说,一场足球比赛非常类似于两个球队各抛三枚硬币,三次都正面朝上代表一个进球。他们断定运气是决定胜负的关键因素,其次才是球队的实力。

德国慕尼黑理工大学教授马丁·拉姆斯是拜仁慕尼黑队的高参。拉姆斯和他的团队观看了超过2500个进球、上万小时的视频录像,分析足球场上的“运气球”。最终的数字是44.4%,同时,幸运进球经常发生在0比0的僵持局面时。

来自美国洛斯阿拉莫斯国家实验室的三位科学家,分析了从1888年开始的英格兰足球顶级联赛、1901年起的美国职棒大联盟比赛、1917年开始的美国冰球联赛和1922年诞生的美式橄榄球联盟的30万场比赛,同样发现足球是其中最难预测的。在超过43000场足球比赛中,黑马获胜的比例竟然达到了45.2%。

二、为什么进球越来越少

大家总在抱怨足球大赛进球越来越少,本届欧洲杯也不例外。欧洲杯36场小组赛,场均进球数只有1.92个,这一数字远逊上届的2.5球和巴西世界杯的2.83球。

为什么进球反而越来越少?因为当梅西、C罗或伊布这样的进攻球员的能力达到新高度时,限制他们的战术同样在提高。曾经足球是以进攻为主导的运动,如今已经演化为进球和不丢球同等重要。足球运动中的进攻和防守基本实现了平衡。比如在一个赛季的英超联赛中,每多进10个球,可以多赢得2.3场比赛。而少丢10个球则相当于多获得2.16场比赛的胜利。

《数字游戏》一书认为,这是当今足球运动发展更加平衡导致的。眼下,足球运动的知识库被全球各地共享,成功的战术打法被各队效法,全世界的球队变得越来越相似。

三、角球重要吗

英国球迷喜欢角球。前切尔西主教练穆里尼奥曾经反问记者:“请你掰手指头算算,全世界有几个国家的球迷给予角球和进球几乎相同的掌声?在我看来只有一个。这样的情况只出现在英格兰。”

数据证明,角球数和射门数是成正比的。射门越多,角球越多。但是,射门和角球次数越多的球队并不一定进球越多。2010/2011赛季的134场英超比赛中出现了1434个角球,每完成4次角球才能形成一次射门,也就意味着有四次都是徒劳。而由角球创造的射门数中,每9次才进一个球。简而言之,一支英超球队平均每十场比赛才能通过角球得分。





====================================分割线================================


本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
存储 数据采集 消息中间件
漫谈对大数据的思考(上)
“大数据”已跃升为我们行业中最受炒作的术语之一,但炒作不应使人们忽视这样一个事实,即这是数据在世界上的作用真正重要的转变。
漫谈对大数据的思考(上)
|
存储 分布式计算 大数据
什么是大数据?
  然而,什么是大数据?至今也没有一个比较权威的定义。   麦肯锡曾给出大数据的定义是:大数据是指大小超出了常规数据库工具获取、存储、管理和分析能力的数据集合。   维基百科也给出类似的定义:大数据指的是所涉及的数据量规模大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。   一句话,大数据就是数据量大?!   我觉得,这句话说了等于没说,还容易让人误解。你以为数据量大才是大数据?
389 0
|
SQL 弹性计算 运维
初识大数据
了解大数据
124 0
|
安全 大数据 定位技术
大数据之近古篇一
这是盛宣怀利用电报信息得到胡雪岩交易的大量数据,从而找出他的资金链漏洞,击败他的故事。
333 0
大数据之近古篇一
|
大数据 分布式计算 Hadoop
从0到1完全掌握大数据
经常听别人说“我要去学习大数据”,乍一听大数据应该是某个技术。而通俗来讲,大数据就是大到难以处理的数据集合,是社会技术发展过程中碰到的棘手问题。本文将从大数据的由来和相关技术分别展开进行讲解,从0到1系统地介绍如何学会使用大数据。
3423 0
|
SQL 存储 分布式计算
|
分布式计算 数据可视化 大数据
|
新零售 Web App开发 算法