数据挖掘-二手车价格预测 Task01:赛题理解

简介: 赛题以预测二手车的交易价格为任务,数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。

数据挖掘-二手车价格预测系列

4ace1cca8477a420c4b992c88bf0610e_watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2E1NjIwMjQ3NDM=,size_16,color_FFFFFF,t_70#pic_center.jpg

1.赛题概况


赛题以预测二手车的交易价格为任务,数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。


2.分析赛题


此题为传统的数据挖掘问题,通过数据科学以及机器学习深度学习的办法来进行建模得到结果。


此题是一个典型的回归问题。


主要应用xgb、lgb、catboost,以及pandas、numpy、matplotlib、seabon、sklearn、keras等等数据挖掘常用库或者框架来进行数据挖掘任务。


通过EDA来挖掘数据的联系和自我熟悉数据。


3.数据概况


train.csv


SaleID - 销售样本ID


name - 汽车编码


regDate - 汽车注册时间


model - 车型编码


brand - 品牌


bodyType - 车身类型


fuelType - 燃油类型


gearbox - 变速箱


power - 汽车功率


kilometer - 汽车行驶公里


notRepairedDamage - 汽车有尚未修复的损坏


目录
相关文章
|
机器学习/深度学习 数据可视化 算法
【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)
【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)
|
数据采集 机器学习/深度学习 数据可视化
数据挖掘导论——分类与预测(三)
数据挖掘导论——分类与预测
261 0
数据挖掘导论——分类与预测(三)
|
数据挖掘
数据挖掘导论——分类与预测(二)
数据挖掘导论——分类与预测
263 0
数据挖掘导论——分类与预测(二)
|
数据挖掘
数据挖掘导论——分类与预测(一)
数据挖掘导论——分类与预测
277 0
数据挖掘导论——分类与预测(一)
|
机器学习/深度学习 数据挖掘 存储
数据挖掘二手车价格预测 Task05:模型融合
模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起。模型融合主要通过几部分来实现:从提交结果文件中融合、stacking和blending。
191 0
数据挖掘二手车价格预测 Task05:模型融合
|
数据挖掘
数据挖掘-二手车价格预测 Task04:建模调参
利用xgb进行五折交叉验证查看模型的参数效果
214 0
数据挖掘-二手车价格预测 Task04:建模调参
|
机器学习/深度学习 存储 数据可视化
数据挖掘-二手车价格预测 Task03:特征工程
数据挖掘-二手车价格预测 Task03:特征工程
161 0
数据挖掘-二手车价格预测 Task03:特征工程
|
数据可视化 数据挖掘
数据挖掘-二手车价格预测 Task02:数据分析
数据挖掘-二手车价格预测 Task02:数据分析
185 0
数据挖掘-二手车价格预测 Task02:数据分析

热门文章

最新文章