在线实验项目介绍|学习笔记

简介: 快速学习在线实验项目介绍

开发者学堂课程【场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量在线实验项目介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/523/detail/7071


在线实验项目介绍


内容介绍:

一、实验任务说明

二、实验任务流程

三、实验任务结果分析

四、课后任务


本次 club 的实验任务场景讲一下是从项目中选取的企业的业务背景和数据,销量预测所解决的问题,时间任务的大概流程,分析一下实验任务的结果以及给企业的参考意义,最后还会布置一个课后任务,使用本次学到的知识去解决另外一个有意思的问题。


一、实验任务说明

ABC 公司是一个位于北美的家具零售企业,主要在线下的实体店售卖各种沙发、桌椅、配饰、厨房用品等。

ABC 公司有时候会对产品进行促销活动,包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。

业务部门积累了一些线下的静态数据,现在有一个产品的数据集,具体信息如图。

实验的目的是通过促销幅度、促销活动和历史的销量,来预测该产品未来的销量,洞察销量提升的宣传手段和应该使用的促销幅度。

选取的家具零售企业主要的线下销售一些商品,包括沙发,桌椅,配饰,厨房用品等,公司会不定期的进行促销活动,但促销活动的持续时间一般是固定的,在每个促销周期中可能包括促销类型包括flyer (海报优惠券) .markdown(直接打折)和 other_events (其他活动)这三种。业务部门累积了三年多的数据,取出了其中一种商品的交易数据,下图列出了所有的字段。

image.png

包括交易的 ID、交易的日期、产品的销量、单价,以及卖出的时候属于什么促销类型,实验任务的目的是通过促销速度类型还有历史的销量来预测该产品未来的销量,通过模型的结果来决定促进销量提升的宣传手段和应该使用的促销额度。使用模型就是价格弹性时间序列分解模型。


二、实验任务流程

1.开通数据

实名认证账号

开通计算资源

2.导入数据

新建数据表

上传本地资源

3.数据处理

聚合拆分

填充缺失值

4.构建模型

线性回归

时间序列分解

5.预测评估

预测销量

评估准确率

首先要在阿里云上开拓服务,能够使用相关的产品,要在 dateid 中新建数据表,然后上传实验数据,数据是以附件形式存在的一个 csv,可以在实验环境里面下载。将实验数据制作到需要的程度,将其拆分为训练集和测试集。然后填充缺失值。下一步是构建模型,对销量进行线性回归和时间序列的分解。最后是在预测期中对销量进行预测和评估分析。


三、实验任务结果分析

pcnt_price 的回归系数为462.68

经过计算后的弹性为0.57,属于缺乏弹性的产品销量对价格的变动是比较不敏感的

考虑减少促销甚至提升价格来提高该产品的利润

如果要促销的话

flyer 的回归系数明显大于 other_events 所以 flyer 对销量的影响是最大的。

image.png

结果可以从几个方面来分析,首先从回归模型的参数来看,pcnt_price 的回归系数为462.68,

代表的意义是商家每增加1%的促销幅度,产品的销量大约就会增加4.62。根据系数和平均销量经过计算后的价格需求弹性为0.57,属于缺乏弹性的产品。说明产品的销量对价格的变动是比较不敏感的。企业可以考虑减少产品的促销幅度,甚至提升价格来提高该产品的利润,如果仍然要促销的话,比如需要清库存,那么可以看一下促销手段,因为产品没有买到,只需要看 fly 和 other_events 的系数,fly 是2000多,而 other_events 只有600多,因此fly对销量的影响是比较大的。

从时间序列的分解参数来看,产品的长期趋势T是一个下降的趋势,T序列从大于1逐渐降低到小于1,说明该产品的销量有一个逐渐下降的长期趋势,可以推测该产品可能处于生命周期的末期。

image.png

产品的季节波动的最大值是1.7,最小值是0.6,说明他的季节性波动幅度还是比较大的,可以结合定价策略在季节波动的波峰提成利润。

image.png

从模型的预测准确率来看,第一个月的误差在10%以内,为7.309%。预测的前两个月误差较小,到了第3个月误差较大。说明短期内模型的预测还是有一定效果的,但是无法保证长期预测准确率所以模型重跑的调度周期可以设为一个月。

image.png


四、课后任务

完成实验手册之后,可以使用自己擅长的语言或者工具做一下课后任务,美国芝加哥是美国暴力事件频发的城市之一,一直被称为罪恶之城,近年来芝加哥警察局每年的预算都超过了10亿美元,2016年的预算甚至达到了14亿美元。

探因︰谁该对此负责?经济情况?

任务∶根据芝加哥当地的失业率预测案件数量,数据可以在附件中进行下载。

Chicago_City_Crimes.csv

字段英文名

描述

DATE

日期

CASES

案件数

Chicagop_City_Unemployment_Rate.csv

字段英文名

描述

YEAR

PERIOD

LABEL

年月标签

VALUE

失业率

相关文章
|
监控 数据可视化 项目管理
WBS元素是什么?在项目管理中的作用与类型定义
工作分解结构(WBS)是项目管理中的重要工具,用于将复杂项目分解为更小、更易管理的任务或工作包。本文介绍了WBS的概念、特点、核心目标及其在项目管理中的作用,包括项目范围定义、任务分配、进度管理、预算控制和风险管理等方面。同时,文章还探讨了几种常见的WBS类型,如交付物导向型、阶段导向型、功能导向型和混合型WBS,并提供了创建有效WBS的步骤建议。最后,推荐了几款实用的项目管理工具,帮助团队更高效地管理和执行项目。
1974 7
MATLAB-Simulink仿真实现OFDM通信系统
【8月更文挑战第7天】本文介绍了在MATLAB-Simulink环境中实现OFDM通信系统仿真的方法,包括发送机、信道和接收机的设计,支持BPSK、QAM等多种调制方式,并考虑了Rician、AWGN、Rayleigh等信道模型。
1149 12
MATLAB-Simulink仿真实现OFDM通信系统
|
存储 文字识别 数据可视化
让你的电脑变得与众不同的冷门小工具
本文推荐了5款冷门但功能强大的小工具:1. MiniBin,轻量级回收站管理工具;2. AltairSimLab,多物理场仿真平台;3. 燃精灵,微信空号检测软件;4. IrfanView,经典图像查看器;5. Folder Size View,磁盘空间分析工具。这些软件体积小巧,功能出色,可大幅提升工作效率。
395 4
|
IDE Linux 开发工具
在Linux中,如何查看当前工作目录?
在Linux中,如何查看当前工作目录?
|
存储 算法 Java
GoLang GPM模型
本文介绍了 Go 语言中的 goroutine 及其调度器(Go Scheduler)的工作原理。goroutine 并非传统意义上的协程,而是基于两级线程模型实现的轻量级并发单元。文章详细解释了三种主流线程模型(内核级、用户级和两级线程模型)的特点,并重点阐述了 G-P-M 模型(Goroutine、Processor、Machine)的工作机制,包括调度算法、阻塞处理等。通过动态栈管理和高效的调度器,Go 程序能够轻松支持成千上万个并发任务。
398 0
GoLang GPM模型
|
Java 开发者
通义灵码一周年:通义灵码个人版测评
本文介绍了JAVA开发工程师如何利用通义灵码个人版进行源代码分析与优化,包括源代码解释、生成代码优化、workspace和@terminal四个方面的具体操作实例,展示了该工具在提高开发效率上的显著效果,提效达40%。
|
人工智能 算法
AI+脱口秀,笑点能靠算法创造吗
脱口秀是一种通过幽默诙谐的语言、夸张的表情与动作引发观众笑声的表演艺术。每位演员独具风格,内容涵盖个人情感、家庭琐事及社会热点。尽管我尝试用AI生成脱口秀段子,但AI缺乏真实的情感共鸣和即兴创作能力,生成的内容显得不够自然生动,难以触及人心深处的笑点。例如,AI生成的段子虽然流畅,却少了那份不期而遇的惊喜和激情,无法真正打动观众。 简介:脱口秀是通过幽默语言和夸张表演引发笑声的艺术形式,AI生成的段子虽流畅但缺乏情感共鸣和即兴创作力,难以达到真人表演的效果。
|
Ubuntu Linux 应用服务中间件
在Linux中,如何启动、停止或重启服务?
在Linux中,如何启动、停止或重启服务?
|
机器学习/深度学习 自然语言处理 算法
|
安全 Linux 开发者