在线实验项目介绍|学习笔记

简介: 快速学习在线实验项目介绍

开发者学堂课程【场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量在线实验项目介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/523/detail/7071


在线实验项目介绍


内容介绍:

一、实验任务说明

二、实验任务流程

三、实验任务结果分析

四、课后任务


本次 club 的实验任务场景讲一下是从项目中选取的企业的业务背景和数据,销量预测所解决的问题,时间任务的大概流程,分析一下实验任务的结果以及给企业的参考意义,最后还会布置一个课后任务,使用本次学到的知识去解决另外一个有意思的问题。


一、实验任务说明

ABC 公司是一个位于北美的家具零售企业,主要在线下的实体店售卖各种沙发、桌椅、配饰、厨房用品等。

ABC 公司有时候会对产品进行促销活动,包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。

业务部门积累了一些线下的静态数据,现在有一个产品的数据集,具体信息如图。

实验的目的是通过促销幅度、促销活动和历史的销量,来预测该产品未来的销量,洞察销量提升的宣传手段和应该使用的促销幅度。

选取的家具零售企业主要的线下销售一些商品,包括沙发,桌椅,配饰,厨房用品等,公司会不定期的进行促销活动,但促销活动的持续时间一般是固定的,在每个促销周期中可能包括促销类型包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。业务部门累积了三年多的数据,取出了其中一种商品的交易数据,下图列出了所有的字段。

image.png

包括交易的 ID、交易的日期、产品的销量、单价,以及卖出的时候属于什么促销类型,实验任务的目的是通过促销速度类型还有历史的销量来预测该产品未来的销量,通过模型的结果来决定促进销量提升的宣传手段和应该使用的促销额度。使用模型就是价格弹性时间序列分解模型。


二、实验任务流程

1.开通数据

实名认证账号

开通计算资源

2.导入数据

新建数据表

上传本地资源

3.数据处理

聚合拆分

填充缺失值

4.构建模型

线性回归

时间序列分解

5.预测评估

预测销量

评估准确率

首先要在阿里云上开拓服务,能够使用相关的产品,要在 dateid 中新建数据表,然后上传实验数据,数据是以附件形式存在的一个 csv,可以在实验环境里面下载。将实验数据制作到需要的程度,将其拆分为训练集和测试集。然后填充缺失值。下一步是构建模型,对销量进行线性回归和时间序列的分解。最后是在预测期中对销量进行预测和评估分析。


三、实验任务结果分析

pcnt_price 的回归系数为462.68

经过计算后的弹性为0.57,属于缺乏弹性的产品销量对价格的变动是比较不敏感的

考虑减少促销甚至提升价格来提高该产品的利润

如果要促销的话

flyer 的回归系数明显大于 other_events 所以 flyer 对销量的影响是最大的。

image.png

结果可以从几个方面来分析,首先从回归模型的参数来看,pcnt_price 的回归系数为462.68,

代表的意义是商家每增加1%的促销幅度,产品的销量大约就会增加4.62。根据系数和平均销量经过计算后的价格需求弹性为0.57,属于缺乏弹性的产品。说明产品的销量对价格的变动是比较不敏感的。企业可以考虑减少产品的促销幅度,甚至提升价格来提高该产品的利润,如果仍然要促销的话,比如需要清库存,那么可以看一下促销手段,因为产品没有买到,只需要看 fly 和 other_events 的系数,fly 是2000多,而 other_events 只有600多,因此fly对销量的影响是比较大的。

从时间序列的分解参数来看,产品的长期趋势T是一个下降的趋势,T序列从大于1逐渐降低到小于1,说明该产品的销量有一个逐渐下降的长期趋势,可以推测该产品可能处于生命周期的末期。

image.png

产品的季节波动的最大值是1.7,最小值是0.6,说明他的季节性波动幅度还是比较大的,可以结合定价策略在季节波动的波峰提成利润。

image.png

从模型的预测准确率来看,第一个月的误差在10%以内,为7.309%。预测的前两个月误差较小,到了第3个月误差较大。说明短期内模型的预测还是有一定效果的,但是无法保证长期预测准确率所以模型重跑的调度周期可以设为一个月。

image.png


四、课后任务

完成实验手册之后,可以使用自己擅长的语言或者工具做一下课后任务,美国芝加哥是美国暴力事件频发的城市之一,一直被称为罪恶之城,近年来芝加哥警察局每年的预算都超过了10亿美元,2016年的预算甚至达到了14亿美元。

探因︰谁该对此负责?经济情况?

任务∶根据芝加哥当地的失业率预测案件数量,数据可以在附件中进行下载。

Chicago_City_Crimes.csv

字段英文名

描述

DATE

日期

CASES

案件数

Chicagop_City_Unemployment_Rate.csv

字段英文名

描述

YEAR

PERIOD

LABEL

年月标签

VALUE

失业率

相关文章
|
机器学习/深度学习 存储 人工智能
Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
|
6月前
|
数据采集 Web App开发 NoSQL
【数据采集】实验01-工作环境配置与基础编程
【数据采集】实验01-工作环境配置与基础编程
44 2
|
7月前
|
监控 Unix Shell
实验模拟搭建 elfk 日志分析系统
实验模拟搭建 elfk 日志分析系统
|
7月前
|
SQL Java 关系型数据库
手把手教学在线考试系统本地部署完美运行
手把手教学在线考试系统本地部署完美运行
156 0
|
弹性计算 前端开发 Linux
实验手册指导文档
主要介绍实验手册中的基本信息、实验资源配置、实验手册编写三项信息的填写规范,测试并提交审核和操作指南功能的使用方式。
|
机器学习/深度学习 人工智能 自然语言处理
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
|
前端开发
实验:CSS+Div基础 - 预习报告
网页设计技术实验预习报告。
293 1
实验:CSS+Div基础 - 预习报告
|
前端开发
第24/90步《前端篇》第5章 平台功能优化 第15课
今天学习《前端篇》第5章 平台功能优化 第15课 添加游戏反馈,这节课我们尝试在小游戏特定的时间节点添加一些互动提示,例如在用户得分时添加一个得分弹窗提示,并且这个提示会自动消失;再如在游戏结束时,弹出一个弹窗,当用户确定时,让游戏重启,等等。
91 0
|
前端开发 JavaScript
第25/90步《前端篇》第5章 平台功能优化 第16课
今天学习《前端篇》第5章 平台功能优化 第16课 添加超时限制,这节课我们尝试给游戏加一个时间限制,例如 30秒。
74 0
|
缓存 小程序 算法
第23/90步《前端篇》第5章 平台功能优化 第14课
今天学习第5章平台功能优化的第14课,绘制微信用户头像。
99 0