天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊

简介: 天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊

双11结束了,大家已经无手可剁 ,你们都贡献了多少啊?

天猫官方公布了今年的双11成交额为2684亿元,成功刷新了自己创下的商业纪录。按理说大家已经习惯了逐年增长,没想到。。。

由于过于完美,引发网友提出质疑。

screenshot

该微博在天猫公布2019年销售额后,引发大量讨论,成功登上热搜。

一些人提出了相反意见:某大V表示天猫双11数据是精确地控制了交易额,从而形成了理想的曲线。

而天猫相关负责人回应称,符合趋势就假?造谣要负法律责任。

我们且不评论是真是假,先想想我们能干点什么呢?

不如先照着这位微博网友的步骤来复现一遍吧。

利用Excel进行拟合

这位微博网友使用的工具似乎是Excel,我安装的是WPS,应该也能胜任。

先将天猫2009年-2018年的双十一历年销售额历史数据导入到一张表里。

screenshot

点击插入一张散点图。

screenshot

screenshot

左键点击一下任意一个散点数据,出现散点数据选择状态。

鼠标右击,弹出提示框,点击“添加趋势线”。

在WPS表格右侧,找到趋势线属性按钮,左键单击一下,弹出趋势线属性框。

screenshot

选择三次多项式,得到结果√
screenshot

其中R²=0.9994,这与微博网友的预测值一致,说明我们的方法是对的。

天猫双11数据过于完美,引网友质疑,用Python算算就知道了啊
over。

停一停,

作为Python专业爱好者,怎么能能少了Python呢?

利用Python进行拟合并预测

我们在Python中可以利用numpy求解多项式以及多项式拟合。

尝试用numpy的polyfit函数进行拟合,并作图。

代码如下:

import matplotlib.pyplot as plt
import numpy as np

x = np.array([year for year in range(2009,2019)])
y = np.array([0.5,9.36,52,191,352,571,912,1207,1682.69,2135])
z1 = np.polyfit(x, y, 3) # 用3次多项式拟合
p1 = np.poly1d(z1)

yvals=p1(x)
plot1=plt.plot(x, y, '*',label='实际销售额')
plot2=plt.plot(x, yvals, 'r',label='拟合销售额')
plt.xlabel('年份')
plt.ylabel('销售额(亿)')
plt.legend(loc=4) # 指定legend的位置
plt.title('2009-2018淘宝双十一销售额拟合曲线')
plt.figure(figsize=(10, 10))
plt.show()

print('拟合多项式:',p1) #打印拟合多项式
p1 = np.poly1d(z1)
print("-"*40)
print('2019年预测值:',p1(2019)) #打印预测值
运行结果:

screenshot

screenshot

利用三次多项式预测的数据与公布的结果确实很相近。

我们继续搞事情。

将今年2019年的2684亿导入,预测一下后面三年:

screenshot

按照网上的阴谋论,后面几年的数据应该如此。

碎碎谈:

看了网络上的好几篇文章,众说纷纭。

作为一个技术er,就不去对此事做评价了。

只写一些其中跟我们相关的数据知识就够了。

网络大众对此事的看法到底如何?

不妨看下腾讯科技发起的一个投票。

screenshot

大众的看法就像这个投票。

相关文章
|
18小时前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
15 1
|
2天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
26 9
|
4天前
|
索引 Python
如何使用Python的Pandas库进行数据透视表(pivot table)操作?
使用Pandas在Python中创建数据透视表的步骤包括:安装Pandas库,导入它,创建或读取数据(如DataFrame),使用`pd.pivot_table()`指定数据框、行索引、列索引和值,计算聚合函数(如平均分),并可打印或保存结果到文件。这允许对数据进行高效汇总和分析。
9 2
|
4天前
|
JSON 关系型数据库 数据库
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
30 0
|
5天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
26 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
5天前
|
存储 机器学习/深度学习 数据可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
49 6
|
5天前
|
机器学习/深度学习 数据采集 供应链
从数据到决策:scikit-learn在业务分析中的应用
【4月更文挑战第17天】本文探讨了scikit-learn在业务分析中的应用,包括数据预处理、分类、回归和聚类模型的构建,以及模型评估与优化。通过使用scikit-learn,企业能有效处理数据、预测趋势、客户细分并制定决策,从而提升经营效率和市场策略。随着机器学习的发展,scikit-learn在业务分析领域的潜力将持续释放,创造更多价值。
|
6天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
6天前
|
BI 开发者 数据格式
Python代码填充数据到word模板中
【4月更文挑战第16天】
|
6天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
14 0