开发者学堂课程【场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量:在线实验项目介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/523/detail/7071
在线实验项目介绍
内容介绍:
一、实验任务说明
二、实验任务流程
三、实验任务结果分析
四、课后任务
本次 club 的实验任务场景讲一下是从项目中选取的企业的业务背景和数据,销量预测所解决的问题,时间任务的大概流程,分析一下实验任务的结果以及给企业的参考意义,最后还会布置一个课后任务,使用本次学到的知识去解决另外一个有意思的问题。
一、实验任务说明
ABC 公司是一个位于北美的家具零售企业,主要在线下的实体店售卖各种沙发、桌椅、配饰、厨房用品等。
ABC 公司有时候会对产品进行促销活动,包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。
业务部门积累了一些线下的静态数据,现在有一个产品的数据集,具体信息如图。
实验的目的是通过促销幅度、促销活动和历史的销量,来预测该产品未来的销量,洞察销量提升的宣传手段和应该使用的促销幅度。
选取的家具零售企业主要的线下销售一些商品,包括沙发,桌椅,配饰,厨房用品等,公司会不定期的进行促销活动,但促销活动的持续时间一般是固定的,在每个促销周期中可能包括促销类型包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。业务部门累积了三年多的数据,取出了其中一种商品的交易数据,下图列出了所有的字段。
包括交易的 ID、交易的日期、产品的销量、单价,以及卖出的时候属于什么促销类型,实验任务的目的是通过促销速度类型还有历史的销量来预测该产品未来的销量,通过模型的结果来决定促进销量提升的宣传手段和应该使用的促销额度。使用模型就是价格弹性时间序列分解模型。
二、实验任务流程
1.开通数据
实名认证账号
开通计算资源
2.导入数据
新建数据表
上传本地资源
3.数据处理
聚合拆分
填充缺失值
4.构建模型
线性回归
时间序列分解
5.预测评估
预测销量
评估准确率
首先要在阿里云上开拓服务,能够使用相关的产品,要在 dateid 中新建数据表,然后上传实验数据,数据是以附件形式存在的一个 csv,可以在实验环境里面下载。将实验数据制作到需要的程度,将其拆分为训练集和测试集。然后填充缺失值。下一步是构建模型,对销量进行线性回归和时间序列的分解。最后是在预测期中对销量进行预测和评估分析。
三、实验任务结果分析
pcnt_price 的回归系数为462.68
经过计算后的弹性为0.57,属于缺乏弹性的产品销量对价格的变动是比较不敏感的
考虑减少促销甚至提升价格来提高该产品的利润
如果要促销的话
flyer 的回归系数明显大于 other_events 所以 flyer 对销量的影响是最大的。
结果可以从几个方面来分析,首先从回归模型的参数来看,pcnt_price 的回归系数为462.68,
代表的意义是商家每增加1%的促销幅度,产品的销量大约就会增加4.62。根据系数和平均销量经过计算后的价格需求弹性为0.57,属于缺乏弹性的产品。说明产品的销量对价格的变动是比较不敏感的。企业可以考虑减少产品的促销幅度,甚至提升价格来提高该产品的利润,如果仍然要促销的话,比如需要清库存,那么可以看一下促销手段,因为产品没有买到,只需要看 fly 和 other_events 的系数,fly 是2000多,而 other_events 只有600多,因此fly对销量的影响是比较大的。
从时间序列的分解参数来看,产品的长期趋势T是一个下降的趋势,T序列从大于1逐渐降低到小于1,说明该产品的销量有一个逐渐下降的长期趋势,可以推测该产品可能处于生命周期的末期。
产品的季节波动的最大值是1.7,最小值是0.6,说明他的季节性波动幅度还是比较大的,可以结合定价策略在季节波动的波峰提成利润。
从模型的预测准确率来看,第一个月的误差在10%以内,为7.309%。预测的前两个月误差较小,到了第3个月误差较大。说明短期内模型的预测还是有一定效果的,但是无法保证长期预测准确率所以模型重跑的调度周期可以设为一个月。
四、课后任务
完成实验手册之后,可以使用自己擅长的语言或者工具做一下课后任务,美国芝加哥是美国暴力事件频发的城市之一,一直被称为罪恶之城,近年来芝加哥警察局每年的预算都超过了10亿美元,2016年的预算甚至达到了14亿美元。
探因︰谁该对此负责?经济情况?
任务∶根据芝加哥当地的失业率预测案件数量,数据可以在附件中进行下载。
Chicago_City_Crimes.csv
字段英文名 |
描述 |
DATE |
日期 |
CASES |
案件数 |
Chicagop_City_Unemployment_Rate.csv
字段英文名 |
描述 |
YEAR |
年 |
PERIOD |
月 |
LABEL |
年月标签 |
VALUE |
失业率 |