数据过于完美就是造假?too sample,GDP数据更加完美!

简介: 数据过于完美就是造假?too sample,GDP数据更加完美!

这两天,天猫双十一交易额造假的事情持续发酵,因为曲线过于完美,所以受到了很多人的质疑。甚至有些人还用 Python 进行了拟合运算,最终的拟合结果和天猫发布的数据非常吻合,进而甚至已经预测出了明年双十一的预期交易金额,这可真的是出其不意,天外飞瓜啊!

下图就是通过多项式拟合得到的曲线,看起来还真是完美呢

不过天猫官方也出面澄清了:数据造假?没!必!要!哈哈哈,这真的是个门外吃瓜群众难以分辨的事情。

那么是否真的是当数据完美符合某种数学公式时,就会存在人为干涉的情况呢。

既然我们一时之间难以分辨天猫数据的真假,那么我们可以使用其他的数据来验证下呀,比如 GDP!这个数据可是代表着一个国家经济实力的重要指标,当年我国 GDP 超越邻居的时候,还狠狠的自豪了一把呢!

那么如果我们把某些国家的历年 GDP 数据也通过相同的方式进行拟合,如果也得出完美的曲线,哎呀,不敢想,有点小激动!

我们暂且就把这种拟合曲线叫做“天猫曲线”吧,谁让它体量大,影响度强呢!

数据整理

我们现在手中有一份全球各国历年 GDP 的数据文件,先来查看下2018全球 GDP 总量排行前几名

我们就以前五名为研究对象吧,看看他们的 GDP 总量的分布情况是怎样的

各国GDP历年数据曲线

这前五个国家,就依次排列吧

美国

中国

日本

德国

英国

这一圈看下来啊,貌似符合“天猫曲线”的,就是前两位的美国和我国了,那么就开始拟合吧。

数据拟合

关于“天猫曲线”的拟合过程,已经有好多教程写了,无非就是多项式回归,强大的 Python 完全搞得定,我们直接来看结果

没有任何问题,完美符合“天猫曲线”,难道说,美国的 GDP 是?哈哈哈哈,我们再来看看再符合该曲线的情况下,2019年美国的 GDP 总量应该是

20.75 万亿美元

是非成败,我们等到2019年的 GDP 数据出炉的时候再说吧。

下面再来看看我们国家的GDP曲线情况

没有任何意外,同样比较符合多项式回归曲线!如果再预测2019年的 GDP 的话,应该会是

14.88 万亿美元

现在我们已经得到了世界上 GDP 总量最高的两个国家的走势曲线,竟然都惊奇的符合多项式归回,是不是能够说明一些问题呢。

萝卜说


我们都应该都知道,很多数学公式的出现与创造,都是自然科学规律的积累,比如我们常见的正态回归,就是因为在我们的生活中有太多的现象、数据拥有同样的规律走势,所以前辈们才发现总结了对应的公式定律,用于统一描述这类数据。所以当我们看到身边的某些数据是符合正态回归形式的时候,都没有太多的惊讶。

而此时,我们先是发现了天猫双十一的交易金额符合多项式归回,现在又对比美国和我国的 GDP 总量数据,也是符合多项式归回的,而且两者都可以归结为经济类数据,且都可以在一定方面反映出这个国家的经济水平。那么我们是不是可以大胆的推测下,双十一天猫交易金额,正是我国 GDP 总量在国内消费水平上的某种体现呢。而且从其他几个国家的增长曲线能够看出,当国家的经济出现大的波动时,曲线就没有那么平滑了,比如日本、德国等,都是在大幅增长之后,出现了不同程度的退步,而在维持经济平稳发展上来说,我国和美国无疑是做的最好的两个国家了。

哇咔咔,不是专业搞经济的,不敢也不会说的多么深入,但是无论怎样,数据在这里,有一点是可以肯定的,国家的GDP总量在增长,人们的总体生活水平就会有所提升,那么消费水平也会相应的提升,至于它们之间是否有某种特殊的关联,就留给经济学家去操心吧!

相关文章
|
3月前
Google Earth Engine(GEE) ——世界人口网格化第4版行政单位中心点与人口数据集
Google Earth Engine(GEE) ——世界人口网格化第4版行政单位中心点与人口数据集
25 1
|
3月前
|
编解码 人工智能 数据挖掘
基于加拿大降水分析 (CaPA) 系统的北美区域确定性降水数据集
基于加拿大降水分析 (CaPA) 系统的北美区域确定性降水数据集
20 0
|
9月前
|
算法 Python
2022-10-26-线性回归分析GDP与公交车数量的关系
2022-10-26-线性回归分析GDP与公交车数量的关系
126 0
|
编解码 算法 BI
叶面积指数(LAI)数据、NPP数据、GPP数据、植被覆盖度数据获取
叶面积指数(LAI)数据、NPP数据、GPP数据、植被覆盖度数据获取
叶面积指数(LAI)数据、NPP数据、GPP数据、植被覆盖度数据获取
|
编解码 BI 定位技术
全国多年平均降水量空间分布数据1951-2021年、气温分布数据、蒸散量数据、蒸发量数据、太阳辐射数据、日照数据、风速数据
全国多年平均降水量空间分布数据1951-2021年、气温分布数据、蒸散量数据、蒸发量数据、太阳辐射数据、日照数据、风速数据
全国多年平均降水量空间分布数据1951-2021年、气温分布数据、蒸散量数据、蒸发量数据、太阳辐射数据、日照数据、风速数据
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
|
API
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2018年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2018年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
258 0
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2018年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
|
API
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
127 0
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
|
API
Google Earth Engine——街区数据集包含2010年的人口普查街区,最小单位大致相当于一个城市街区。超过1100万个多边形特征,覆盖美国、哥伦比亚特区、波多黎各和岛屿地区。
Google Earth Engine——街区数据集包含2010年的人口普查街区,最小单位大致相当于一个城市街区。超过1100万个多边形特征,覆盖美国、哥伦比亚特区、波多黎各和岛屿地区。
144 0
Google Earth Engine——街区数据集包含2010年的人口普查街区,最小单位大致相当于一个城市街区。超过1100万个多边形特征,覆盖美国、哥伦比亚特区、波多黎各和岛屿地区。
|
编解码
Google Earth Engine——臭氧总量绘图分光仪(TOMS)数据集代表了过去25年中可用于监测全球和区域臭氧总量趋势的主要长期、连续的卫星观测记录
Google Earth Engine——臭氧总量绘图分光仪(TOMS)数据集代表了过去25年中可用于监测全球和区域臭氧总量趋势的主要长期、连续的卫星观测记录
393 0
Google Earth Engine——臭氧总量绘图分光仪(TOMS)数据集代表了过去25年中可用于监测全球和区域臭氧总量趋势的主要长期、连续的卫星观测记录