Sklean数据集(2)-红酒

简介: Sklean数据集(2)-红酒

原文:


Wine recognition dataset

**Data Set Characteristics:**

Number of Instances: 178 (50 in each of three classes)

Number of Attributes: 13 numeric, predictive attributes and theclass

Attribute Information:

  • Alcohol
  • Malic acid
  • Ash
  • Alcalinity of ash
  • Magnesium
  • Total phenols
  • Flavanoids
  • Nonflavanoid phenols
  • Proanthocyanins
  • Color intensity
  • Hue
  • OD280/OD315 of diluted wines
  • Proline
  • class:
  • class_0
  • class_1
  • class_2

Summary Statistics:

                           Min   Max   Mean  SD

Alcohol:                         11.0  14.8    13.0  0.8

Malic Acid:                       0.74  5.80    2.34  1.12

Ash:                            1.36  3.23    2.36  0.27

Alcalinity of Ash:                 10.6  30.0   19.5   3.3

Magnesium:                      70.0  162.0   99.7  14.3

Total Phenols:                    0.98  3.88   2.29   0.63

Flavanoids:                      0.34 5.08    2.03   1.00

Nonflavanoid Phenols:             0.13 0.66    0.36   0.12

Proanthocyanins:                  0.41 3.58    1.59   0.57

Colour Intensity:                  1.3  13.0     5.1  2.3

Hue:                            0.48  1.71   0.96   0.23

OD280/OD315 of diluted wines:  1.27  4.00   2.61   0.71

Proline:                        278 1680    746   315

Missing Attribute Values: None

Class Distribution: class_0 (59), class_1 (71), class_2 (48)

Creator: R.A. Fisher

Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)

Date: July, 1988

This is a copy of UCI ML Wine recognition datasets.

https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

The data is the results of a chemical analysis of wines grown in thesame region in Italy by three different cultivators. There are thirteendifferent measurements taken for different constituents found in the threetypes of

wine.

Original Owners:

Forina, M. et al, PARVUS -

An Extendible Package for Data Exploration, Classification andCorrelation. Institute of Pharmaceutical and Food Analysis and Technologies,ViaBrigata Salerno, 16147 Genoa, Italy.

Citation:

Lichman, M. (2013). UCI Machine LearningRepository[https://archive.ics.uci.edu/ml]. Irvine, CA: University of California,Schoolof Information and Computer Science.

topic:: References

(1) S. Aeberhard, D. Coomansand O. de Vel, Comparison of Classifiers in High Dimensional Settings, Tech.Rep. no. 92-02, (1992), Dept. of Computer Science and Dept. of  Mathematics and Statistics, James CookUniversity of North Queensland. (Also submitted to Technometrics).

The data was used with many others for comparing variousclassifiers. The classes are separable, though only RDA has achieved 100%correct classification. (RDA : 100%, QDA 99.4%, LDA 98.9%, 1NN 96.1%(z-transformed data))  (All results usingthe leave-one-out technique)

(2) S. Aeberhard, D. Coomansand O. de Vel, "THE CLASSIFICATION PERFORMANCE OF RDA" Tech. Rep. no.92-01, (1992), Dept. of Computer Science and Dept. of  Mathematics and Statistics, James CookUniversity of North Queensland. (Also submitted to Journal of Chemometrics).


译文:


葡萄酒识别数据集

**数据集特征:**

实例数:178(三个类各50个)

属性数:13个数值、预测属性和类

属性信息:

  • 酒精
  • 苹果酸
  • 灰烬
  • 灰分的碱性

  • 总酚类
  • 黄酮类化合物
  • 非黄酮类酚类
  • 原花青素
  • 颜色强度
  • 色调
  • 稀释葡萄酒的OD280/OD315
  • 脯氨酸
  • 类:
  • -0
  • -1
  • -2

摘要统计:

最小最大平均标准差

酒精:11.0 14.8 13.0 0.8

苹果酸:0.74 5.80 2.34 1.12

灰分:1.36 3.23 2.36 0.27

灰分的碱性:10.6 30.0 19.5 3.3

镁:70.0 162.0 99.7 14.3

总酚:0.98 3.88 2.29 0.63

黄酮类化合物:0.34 5.08 2.03 1.00

非黄酮类酚类:0.13 0.66 0.36 0.12

原花青素:0.41 3.58 1.59 0.57

颜色强度:1.3 13.0 5.1 2.3

色调:0.48 1.71 0.96 0.23

稀释葡萄酒的OD280/OD315:1.27 4.00 2.610.71

脯氨酸:278 1680 746 315

缺少属性值:无

等级分布:类059),类171),类248

创建者:R.A.Fisher

捐赠者:迈克尔·马歇尔(Marshall%PLU@io.arc.nasa.gov)

日期:19887

这是UCI-ML葡萄酒识别数据集的副本。

https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

这些数据是对生长在同一地区的葡萄酒进行化学分析的结果由三个不同的种植者在意大利的地区。有十三种不同对三种类型中发现的不同成分进行测量葡萄酒。


原所有者:

ForinaM.等人,PARVUS-

一种用于数据勘探、分类和对比的可扩展软件包。意大利热那亚16147Via Brigata Salerno制药和食品分析与技术研究所。

引用:

LichmanM.2013年)。UCI机器学习库[https://archive.ics.uci.edu/ml]. 加州欧文:加州大学信息与计算机科学学院。

主题::参考文献

1 1992年,昆士兰大学数学与计算机科学与统计系第92号计算机科学与统计系。(同时提交给Technometrics)。这些数据与许多其他数据一起用于比较各种分类器。虽然只有RDA实现了100%的正确分类,但这些类是可分离的。(RDA:100%QDA 99.4%LDA 98.9%1NN 96.1%z变换数据))(所有结果均采用“留一”技术)

2 S.AeberhardD.CoomansO.de Vel,“RDA的分类性能”技术报告第92-01号,(1992年),北昆士兰詹姆斯库克大学计算机科学系和数学与统计系。(也提交给化学计量学杂志)。


—————————————————————————————————


软件安全测试

https://study.163.com/course/courseMain.htm?courseId=1209779852&share=2&shareId=480000002205486

接口自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209794815&share=2&shareId=480000002205486

DevOps 和Jenkins之DevOps

https://study.163.com/course/courseMain.htm?courseId=1209817844&share=2&shareId=480000002205486

DevOps与Jenkins 2.0之Jenkins

https://study.163.com/course/courseMain.htm?courseId=1209819843&share=2&shareId=480000002205486

Selenium自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209835807&share=2&shareId=480000002205486

性能测试第1季:性能测试基础知识

https://study.163.com/course/courseMain.htm?courseId=1209852815&share=2&shareId=480000002205486

性能测试第2季:LoadRunner12使用

https://study.163.com/course/courseMain.htm?courseId=1209980013&share=2&shareId=480000002205486

性能测试第3季:JMeter工具使用

https://study.163.com/course/courseMain.htm?courseId=1209903814&share=2&shareId=480000002205486

性能测试第4季:监控与调优

https://study.163.com/course/courseMain.htm?courseId=1209959801&share=2&shareId=480000002205486

Django入门

https://study.163.com/course/courseMain.htm?courseId=1210020806&share=2&shareId=480000002205486

啄木鸟顾老师漫谈软件测试

https://study.163.com/course/courseMain.htm?courseId=1209958326&share=2&shareId=480000002205486

目录
相关文章
|
运维 Serverless Nacos
nacos常见问题之连接异常如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
723 0
nacos常见问题之连接异常如何解决
|
机器学习/深度学习 算法 Python
一文速学-时间序列分析算法之加权移动平均法详解+Python代码实现
一文速学-时间序列分析算法之加权移动平均法详解+Python代码实现
1584 0
一文速学-时间序列分析算法之加权移动平均法详解+Python代码实现
|
应用服务中间件 PHP nginx
|
存储 Prometheus 监控
Grafana 系列文章(十四):Helm 安装 Loki
Grafana 系列文章(十四):Helm 安装 Loki
|
Docker 容器 网络协议
|
JavaScript 前端开发
umi + antd 动态主题色
这篇文章讲解的是动态主题色的变化,也就是,页面可能会有10种,或者20种颜色需要切换,不知道到底有多少种颜色;同时,文档也考虑到多人协助开发,开发人员只需要按照约定方式去编写样式、主题文件名、目录等命名规范即可。
1973 0
umi + antd 动态主题色
|
网络安全 数据库 数据可视化
HeidiSQL使用SSH Tunnel连接数据库
HeidiSQL SSH Tunnel登录远程数据库服务
4833 0
|
4月前
|
Java 关系型数据库 数据库连接
Spring Boot项目集成MyBatis Plus操作PostgreSQL全解析
集成 Spring Boot、PostgreSQL 和 MyBatis Plus 的步骤与 MyBatis 类似,只不过在 MyBatis Plus 中提供了更多的便利功能,如自动生成 SQL、分页查询、Wrapper 查询等。
408 3
|
11月前
|
人工智能 运维 算法
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
南加州大学提出TS-Reasoner,一种基于大型语言模型的时间序列一站式多步推理框架。它能将复杂任务分解为多个子任务,如预测、异常检测等,通过组合现有模型完成多步推理。实验显示,TS-Reasoner在金融和能源领域的多步推理任务中表现出色,但需大量计算资源且灵活性有限。论文链接:https://arxiv.org/pdf/2410.04047
198 14
|
8月前
|
运维 测试技术
当一个按键“摆烂”时,需要更换整个键盘吗?
键盘按键失灵时,别急着更换整个键盘!本文教你通过三步解决:诊断病因、对症下药、预防复发。首先进行“键盘体检”,包括跨设备验证、软件驱动测试、BIOS检测及硬件检查,找出是污垢、物理损坏还是电路故障。接着针对问题提供治疗方案,如更新驱动、清洁键槽或更换零件。最后提醒大家优先排查软件问题,温柔清洁,理性对待物理损坏,并建议选购可维护性强的键盘。记住,善待键盘,远离零食屑,让输入更顺畅!
447 3