OttoGroup数据集的简介
官网:https://www.kaggle.com/c/otto-group-product-classification-challenge/overview/description
Otto Group数据集来源于《Otto Group Product Classification Challenge》。Otto集团是世界上最大的电子商务公司之一,在20多个国家拥有子公司,包括Crate & Barrel (USA), Otto.de (Germany) and 3 Suisses (France)。我们每天在全球销售数百万种产品,在我们的产品线中添加了数千种产品。
我们公司对我们产品性能的一致性分析至关重要。然而,由于我们的全球基础设施不同,许多相同的产品被分类不同。因此,我们的产品分析的质量在很大程度上取决于对类似产品进行准确分类的能力。分类越好,我们对产品范围的了解就越多。
在这次竞争中,我们为超过200000种产品提供了一个具有93项功能的数据集。目的是建立一个预测模型,能够区分我们的主要产品类别。获奖模型将采用开源模式。
1、电商商品分类
– Target:共9个商品类别
– 93个特征:整数型特征
2、数据集简介
Each row corresponds to a single product. There are a total of 93 numerical features, which represent counts of different events. All features have been obfuscated and will not be defined any further.
There are nine categories for all products. Each target category represents one of our most important product categories (like fashion, electronics, etc.). The products for the training and testing sets are selected randomly.
每行对应一个产品。共有93个数字特征,代表不同事件的计数。所有功能都已模糊化,将不再定义。
所有产品都有九个类别。每个目标类别代表我们最重要的产品类别之一(如时装、电子等)。培训和测试集的产品是随机选择的。
File descriptions
trainData.csv - the training set
testData.csv - the test set
sampleSubmission.csv - a sample submission file in the correct format
Data fields
id - an anonymous id unique to a product 产品独有的匿名ID
feat_1, feat_2, ..., feat_93 - the various features of a product 产品的各种特性
target - the class of a product 产品的类别
OttoGroup数据集的下载
如需资料,请留言向博主索取。
OttoGroup数据集的案例应用
后期更新……