目录
Big Mart Sales数据集的简介
BigMart的数据科学家收集了不同城市10家商店1559种产品,这是2013年的销售数据。其目的是建立一个预测模型,并找出每种产品在特定商店的销售情况。使用这种预测模型,数据科学家atBigMart可以了解产品和商店的属性,这些属性对增加销售额起着关键作用。
BigMart Sales面临的挑战是构建一个预测模型来估算特定门店中每种商品的销售额,这将有助于BigMart的决策者找出每一个产品或门店的重要属性,这对提高整体销售起着关键性作用。
竞赛地址:https://datahack.analyticsvidhya.com/contest/practice-problem-big-mart-sales-iii/
1、特征解释
变量 |
描述 |
Item_Identifier |
商品编号 |
Item_Weight |
商品重量 |
Item_Fat_Content |
是否是低脂商品 |
Item_Visibility |
该商品展示区域占门店中所有商品展示区域的比例 |
Item_Type |
商品所属分类 |
Item_MRP |
商品最高售价 |
Outlet_Identifier |
门店编号 |
Outlet_Establishment_Year |
门店建立年份 |
Outlet_Size |
门店占地面积 |
Outlet_Location_Type |
门店所在城市类型 |
Outlet_Type |
门店类型(杂货店或超市) |
Item_Outlet_Sales |
门店商品销售额(即需要预测的输出变量) |
Big Mart Sales数据集的下载
数据集下载地址:https://download.csdn.net/download/qq_41185868/13715309
Big Mart Sales数据集的案例应用
1、基础案例
更新……
Data Exploration Data QAQC Outlier detection and missing data replacement strategy Data ETL Understanding about sales domain Feature Engineering*Advanced Data Analysis Regression modeling Techniques Hybrid modeling Techniques Specific measure to Evaluate Model |
数据探索 数据进程 离群点检测与缺失数据替换策略 数据ETL 了解销售领域 功能工程*高级数据分析 回归建模技术 混合建模技术 评价模型的具体措施 |