Sklean数据集(1)-鸢尾花

本文涉及的产品
性能测试 PTS,5000VUM额度
简介: Sklean数据集(1)-鸢尾花

顾老师新书《全栈软件测试工程师宝典》

https://item.m.jd.com/product/10023427978355.html

以前两本书的网上购买地址:

《软件测试技术实战设计、工具及管理》:

https://item.jd.com/34295655089.html

《基于Django的电子商务网站》:

https://item.jd.com/12082665.html


原文:


    Iris plantsdataset

--------------------

 

**Data SetCharacteristics:**

 

   :Number of Instances: 150 (50 in each ofthree classes)

   :Number of Attributes: 4 numeric,predictive attributes and the class

   :Attribute Information:

       - sepal length in cm

       - sepal width in cm

       - petal length in cm

       - petal width in cm

       - class:

               - Iris-Setosa

               - Iris-Versicolour

               - Iris-Virginica          


:Summary Statistics:
                    Min  Max   Mean    SD     Class Correlation
    sepal length:   4.3  7.9   5.84    0.83   0.7826
    sepal width:    2.0  4.4   3.05    0.43   -0.4194
    petal length:   1.0  6.9   3.76    1.76   0.9490  (high!)
    petal width:    0.1  2.5   1.20    0.76   0.9565  (high!)


   :Missing Attribute Values: None

   :Class Distribution: 33.3% for each of 3classes.

   :Creator: R.A. Fisher

   :Donor: Michael Marshall(MARSHALL%PLU@io.arc.nasa.gov)

   :Date: July, 1988

The famous Irisdatabase, first used by Sir R.A. Fisher. The dataset is taken from Fisher'spaper. Note that it's the same as in R, but not as in the UCI Machine LearningRepository, which has two wrong data points.

This is perhapsthe best known database to be found in the patternrecognition literature.  Fisher's paperis a classic in the field and is referencedfrequently to this day.  (See Duda &Hart, for example.)  The data setcontains 3 classes of 50 instances each, where each class refers to a type of irisplant.  One class is linearly separablefrom the other 2; the latter are NOTlinearly separable from each other.

.. topic::References

  - Fisher, R.A. "The use of multiplemeasurements in taxonomic problems" Annual Eugenics, 7, Part II, 179-188(1936); also in "Contributions to Mathematical Statistics" (John Wiley,NY, 1950).

  - Duda, R.O., & Hart, P.E. (1973)Pattern Classification and Scene Analysis.     (Q327.D83) John Wiley & Sons.  ISBN 0-471-22361-1.  See page 218.

  - Dasarathy, B.V. (1980) "Nosing Aroundthe Neighborhood: A New System Structure and Classification Rule forRecognition in Partially Exposed Environments".  IEEE Transactions on Pattern Analysis andMachine    Intelligence, Vol. PAMI-2, No. 1, 67-71.

  - Gates, G.W. (1972) "The ReducedNearest Neighbor Rule".  IEEETransactions  on Information Theory, May 1972, 431-433.

  - See also: 1988 MLC Proceedings,54-64.  Cheeseman et al"s AUTOCLASSII  conceptual clustering system finds 3classes in the data.

  - Many, many more ...


译文


鸢尾属植物数据集

--------------------

**数据集特征:**

:实例数:150(三个类各50个)

:属性数:4个数值、预测属性和类

:属性信息:

-萼片长度(厘米)

-萼片宽度(cm

-花瓣长度(cm

-花瓣宽度(cm

-类:

-刚毛鸢尾

-彩色鸢尾

-维吉尼卡鸢尾

:摘要统计:

最小-最大平均SD类相关性

萼片长: 4.3 7.9 5.84 0.83 0.7826

萼片宽度:2.0 4.4 3.05 0.43-0.4194

花瓣长度:1.0 6.9 3.76 1.76 0.9490(高!)

花瓣宽度:0.1 2.5 1.20 0.76 0.9565(高!)

:缺少属性值:无

:类分布:3个班级各占33.3%

:创建者:R.A.Fisher

:捐赠者:迈克尔·马歇尔(Marshall%PLU@io.arc.nasa.gov)

:日期:19887

著名的Iris数据库,首先由R.A.Fisher爵士使用。获取数据集

来自费舍尔的报纸。请注意,它与R中的相同,但与UCI中的不同

机器学习库,它有两个错误的数据点。

这可能是在模式识别文献。费舍尔的论文是该领域的经典经常提到今天。(例如,见Duda&Hart。)数据集包含3个类,每个类有50个实例,其中每个类引用鸢尾属植物的类型。一类与另两类线性可分后者不能线性分离。

.. 主题::参考文献

-FisherR.A.“分类学问题中多重测量的使用”年度优生学,7,第二部分,179-188年(1936年);也在“贡献《数理统计》(约翰威利,纽约,1950)。

-DudaR.O.HartP.E.1973),模式分类和场景分析。(Q327.D83)约翰威利父子公司。国际标准书号0-471-22361-1。见第218页。

-DasarathyB.V.1980),“探察邻里:一个新系统部分曝光识别的结构与分类规则环境”。IEEE模式分析与机器汇刊情报,PAMI-2卷,第1期,67-71页。

-盖茨,G.W.1972)“简化最近邻规则”。IEEE事务处理信息论,19725月,431-433

-另见:《1988年跨国公司诉讼录》,第54-64页。Cheeseman等人的汽车II类概念聚类系统在数据中发现了3个类。

-更多,更多…

—————————————————————————————————


软件安全测试

https://study.163.com/course/courseMain.htm?courseId=1209779852&share=2&shareId=480000002205486

接口自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209794815&share=2&shareId=480000002205486

DevOps 和Jenkins之DevOps

https://study.163.com/course/courseMain.htm?courseId=1209817844&share=2&shareId=480000002205486

DevOps与Jenkins 2.0之Jenkins

https://study.163.com/course/courseMain.htm?courseId=1209819843&share=2&shareId=480000002205486

Selenium自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209835807&share=2&shareId=480000002205486

性能测试第1季:性能测试基础知识

https://study.163.com/course/courseMain.htm?courseId=1209852815&share=2&shareId=480000002205486

性能测试第2季:LoadRunner12使用

https://study.163.com/course/courseMain.htm?courseId=1209980013&share=2&shareId=480000002205486

性能测试第3季:JMeter工具使用

https://study.163.com/course/courseMain.htm?courseId=1209903814&share=2&shareId=480000002205486

性能测试第4季:监控与调优

https://study.163.com/course/courseMain.htm?courseId=1209959801&share=2&shareId=480000002205486

Django入门

https://study.163.com/course/courseMain.htm?courseId=1210020806&share=2&shareId=480000002205486

啄木鸟顾老师漫谈软件测试

https://study.163.com/course/courseMain.htm?courseId=1209958326&share=2&shareId=480000002205486

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
目录
相关文章
|
4月前
|
机器学习/深度学习 数据采集 存储
数据集
【7月更文挑战第10天】数据集
123 1
|
5月前
鸢尾花数据集分类问题(3)
鸢尾花数据集分类问题
30 2
|
5月前
鸢尾花数据集分类问题(1)
鸢尾花数据集分类问题
31 1
|
5月前
|
机器学习/深度学习
鸢尾花数据集分类问题(2)
鸢尾花数据集分类问题
34 1
|
5月前
鸢尾花数据集分类问题(4)
鸢尾花数据集分类问题
23 0
|
6月前
|
数据可视化 算法 数据挖掘
R语言鸢尾花iris数据集的层次聚类分析
R语言鸢尾花iris数据集的层次聚类分析
|
机器学习/深度学习 前端开发 测试技术
数据集相关知识
数据集相关知识
295 0
|
机器学习/深度学习 Python
【统计学习方法】K近邻对鸢尾花(iris)数据集进行多分类
【统计学习方法】K近邻对鸢尾花(iris)数据集进行多分类
227 0
|
数据采集 机器学习/深度学习 Python
【统计学习方法】朴素贝叶斯对鸢尾花(iris)数据集进行训练预测
【统计学习方法】朴素贝叶斯对鸢尾花(iris)数据集进行训练预测
381 0
【统计学习方法】朴素贝叶斯对鸢尾花(iris)数据集进行训练预测
|
机器学习/深度学习 Python
【统计学习方法】感知机对鸢尾花(iris)数据集进行二分类
【统计学习方法】感知机对鸢尾花(iris)数据集进行二分类
715 0
【统计学习方法】感知机对鸢尾花(iris)数据集进行二分类