Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略

简介: Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略

OttoGroup数据集的简介


官网:https://www.kaggle.com/c/otto-group-product-classification-challenge/overview/description


image.png


    Otto Group数据集来源于《Otto Group Product Classification Challenge》。Otto集团是世界上最大的电子商务公司之一,在20多个国家拥有子公司,包括Crate & Barrel (USA), Otto.de (Germany) and 3 Suisses (France)。我们每天在全球销售数百万种产品,在我们的产品线中添加了数千种产品。

      我们公司对我们产品性能的一致性分析至关重要。然而,由于我们的全球基础设施不同,许多相同的产品被分类不同。因此,我们的产品分析的质量在很大程度上取决于对类似产品进行准确分类的能力。分类越好,我们对产品范围的了解就越多。

      在这次竞争中,我们为超过200000种产品提供了一个具有93项功能的数据集。目的是建立一个预测模型,能够区分我们的主要产品类别。获奖模型将采用开源模式。


1、电商商品分类


– Target:共9个商品类别

– 93个特征:整数型特征


2、数据集简介


       Each row corresponds to a single product. There are a total of 93 numerical features, which represent counts of different events. All features have been obfuscated and will not be defined any further.

       There are nine categories for all products. Each target category represents one of our most important product categories (like fashion, electronics, etc.). The products for the training and testing sets are selected randomly.


       每行对应一个产品。共有93个数字特征,代表不同事件的计数。所有功能都已模糊化,将不再定义。

       所有产品都有九个类别。每个目标类别代表我们最重要的产品类别之一(如时装、电子等)。培训和测试集的产品是随机选择的。


image.png



File descriptions


trainData.csv - the training set

testData.csv - the test set

sampleSubmission.csv - a sample submission file in the correct format

Data fields


id - an anonymous id unique to a product   产品独有的匿名ID

feat_1, feat_2, ..., feat_93 - the various features of a product    产品的各种特性

target - the class of a product                    产品的类别


OttoGroup数据集的下载


如需资料,请留言向博主索取。





OttoGroup数据集的案例应用


后期更新……




 


相关文章
|
机器学习/深度学习 算法 大数据
Dataset之CASIA-WebFace:CASIA-WebFace 数据集的简介、安装、使用方法之详细攻略
Dataset之CASIA-WebFace:CASIA-WebFace 数据集的简介、安装、使用方法之详细攻略
Dataset之CASIA-WebFace:CASIA-WebFace 数据集的简介、安装、使用方法之详细攻略
|
机器学习/深度学习 算法 程序员
Dataset之GermanCreditData:GermanCreditData数据集的简介、下载、使用方法之详细攻略
Dataset之GermanCreditData:GermanCreditData数据集的简介、下载、使用方法之详细攻略
Dataset之GermanCreditData:GermanCreditData数据集的简介、下载、使用方法之详细攻略
|
算法 数据可视化
Dataset:GiveMeSomeCredit数据集的简介、下载、使用方法之详细攻略
Dataset:GiveMeSomeCredit数据集的简介、下载、使用方法之详细攻略
|
机器学习/深度学习 算法 图形学
Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介、安装、使用方法之详细攻略
Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介、安装、使用方法之详细攻略
Dataset之JFT:JFT/FastEval14k数据集的简介、下载、案例应用之详细攻略
Dataset之JFT:JFT/FastEval14k数据集的简介、下载、案例应用之详细攻略
|
机器学习/深度学习 数据挖掘 TensorFlow
Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介、下载、使用方法之详细攻略
Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介、下载、使用方法之详细攻略
|
传感器 编解码 算法
Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略
Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略
Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略
|
算法 数据库
Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略
Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略
Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略
|
计算机视觉
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之Rotten Tomatoes:Rotten Tomatoes影评数据集简介、下载、使用方法之详细攻略
Dataset之Rotten Tomatoes:Rotten Tomatoes影评数据集简介、下载、使用方法之详细攻略