目录
White Wine Quality白葡萄酒品质数据集的简介
White Wine Quality白葡萄酒品质数据集的下载
White Wine Quality白葡萄酒品质数据集的使用方法
White Wine Quality白葡萄酒品质数据集的简介
White Wine Quality白葡萄酒品质数据集,经常被用于回归或分类建模的简单而干净的练习数据集。
这两个数据集与葡萄牙“Vinho Verde”葡萄酒的红色和白色变种有关。由于隐私和逻辑问题,只有物理化学(输入)和感官(输出)变量可用(例如,没有关于葡萄类型、葡萄酒品牌、葡萄酒售价等的数据)。
这些数据集可以被视为分类或回归任务。 等级是有序的并且不平衡(例如,普通葡萄酒比优质或劣质葡萄酒多得多)。 异常值检测算法可用于检测少数优秀或劣质的葡萄酒。 此外,我们不确定是否所有输入变量都是相关的。 因此,测试特征选择方法可能会很有趣。
1、输入变量(基于物理化学测试):
序号 |
英文 |
中文 |
1 |
fixed acidity |
固定酸度 |
2 |
volatile acidity |
挥发性酸度 |
3 |
citric acid |
柠檬酸 |
4 |
residual sugar |
残糖 |
5 |
chlorides |
氯化物 |
6 |
free sulfur dioxide |
游离二氧化硫 |
7 |
total sulfur dioxide |
二氧化硫总量 |
8 |
density |
密度 |
9 |
pH |
pH值 |
10 |
sulphates |
硫酸盐 |
11 |
alcohol |
酒精 |
12 |
quality (score between 0 and 10) Output variable (based on sensory data) |
质量(得分在 0 到 10 之间),输出变量(基于感官数据) |
White Wine Quality白葡萄酒品质数据集的下载
UCI数据集下载:UCI Machine Learning Repository: Wine Quality Data Set
数据集下载:White Wine Quality | Kaggle
White Wine Quality白葡萄酒品质数据集的使用方法
ML之回归预测之Lasso:利用Lasso算法对红酒品质wine数据集实现红酒口感评分预测(实数值评分预测)
ML之回归预测:利用FSR/RiR/BasisExpand/ Lasso/DT/RF/GB算法对红酒品质wine数据集实现红酒口感评分预测(实数值评分预测)