Sklean数据集(3)-手写数字

简介: Sklean数据集(3)-手写数字

原文


Optical recognition of handwritten digits dataset

**Data Set Characteristics:**

Number of Instances: 5620

Number of Attributes: 64

Attribute Information: 8x8 image of integer pixels in the range0..16.

Missing Attribute Values: None

Creator: E. Alpaydin (alpaydin '@' boun.edu.tr)

Date: July; 1998

This is a copy of the test set of the UCI ML hand-written digitsdatasets

https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

The data set contains images of hand-written digits: 10 classeswhere each class refers to a digit.

Preprocessing programs made available by NIST were used to extractnormalized bitmaps of handwritten digits from a preprinted form. From a totalof 43 people, 30 contributed to the training set and different 13 to the testset. 32x32 bitmaps are divided into nonoverlapping blocks of 4x4 and the numberof on pixels are counted in each block. This generates an input matrix of 8x8where each element is an integer in the range 0..16. This reducesdimensionality and gives invariance to small distortions.

For info on NIST preprocessing routines, see M. D. Garris, J. L.Blue, G.T. Candela, D. L. Dimmick, J. Geist, P. J. Grother, S. A. Janet, andC.L. Wilson, NIST Form-Based Handprint Recognition System,NISTIR 5469,1994.

topic:: References

  • C. Kaynak (1995) Methods of Combining Multiple Classifiers and TheirApplications to Handwritten Digit Recognition, MSc Thesis, Institute ofGraduate Studies in Science and Engineering, Bogazici University.
  • E. Alpaydin, C. Kaynak (1998) Cascading Classifiers, Kybernetika.
  • Ken Tang and Ponnuthurai N. Suganthan and Xi Yao and A. Kai Qin.Linear dimensionalityreduction using relevance weighted LDA. School ofElectrical and Electronic Engineering Nanyang Technological University.2005.
  • Claudio Gentile. A New Approximate Maximal MarginClassification  Algorithm. NIPS. 2000.

译文


手写数字数据集的光学识别

**数据集特征:**

实例数:5620

属性数:64

属性信息:0..16范围内整数像素的8x8图像。

缺少属性值:无

创建者:E.AlpaydinAlpaydin'@'教育部)

日期:19987

这是UCI ML手写数字数据集测试集的副本

https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+手写+数字

数据集包含手写数字的图像:10个类,其中每个类引用一个数字。

使用NIST提供的预处理程序从预打印表单中提取手写数字的标准化位图。在总共43人中,30人参加了培训,13人参加了测试。32x32位图被分成4x4的非重叠块,每个块中的on像素数被计数。这将生成一个8x8的输入矩阵,其中每个元素都是0..16范围内的整数。这降低了维数,并赋予小变形不变性。

有关NIST预处理程序的信息,请参见M.D.GarrisJ.L.BlueG.T.CandelaD.L.DimmickJ.GeistP.J.GrotherS.A.JanetC.L.WilsonNIST基于表格的手印识别系统,NISTIR54691994

主题::参考文献

  • C.Kaynak1995)多分类器组合方法及其在手写数字识别中的应用,博加西大学理工研究所硕士论文。
  • E.AlpaydinC.Kaynak1998)《级联分类器》,Kybernetika
  • 邓肯、庞努图赖、苏嘉全、奚瑶、秦启红。使用相关加权LDA进行线性维数推导。南洋理工大学电气与电子工程学院.2005

克劳迪奥·金蒂莱。一种新的近似最大边缘分类算法。尼普斯。2000


—————————————————————————————————


软件安全测试

https://study.163.com/course/courseMain.htm?courseId=1209779852&share=2&shareId=480000002205486

接口自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209794815&share=2&shareId=480000002205486

DevOps 和Jenkins之DevOps

https://study.163.com/course/courseMain.htm?courseId=1209817844&share=2&shareId=480000002205486

DevOps与Jenkins 2.0之Jenkins

https://study.163.com/course/courseMain.htm?courseId=1209819843&share=2&shareId=480000002205486

Selenium自动化测试

https://study.163.com/course/courseMain.htm?courseId=1209835807&share=2&shareId=480000002205486

性能测试第1季:性能测试基础知识

https://study.163.com/course/courseMain.htm?courseId=1209852815&share=2&shareId=480000002205486

性能测试第2季:LoadRunner12使用

https://study.163.com/course/courseMain.htm?courseId=1209980013&share=2&shareId=480000002205486

性能测试第3季:JMeter工具使用

https://study.163.com/course/courseMain.htm?courseId=1209903814&share=2&shareId=480000002205486

性能测试第4季:监控与调优

https://study.163.com/course/courseMain.htm?courseId=1209959801&share=2&shareId=480000002205486

Django入门

https://study.163.com/course/courseMain.htm?courseId=1210020806&share=2&shareId=480000002205486

啄木鸟顾老师漫谈软件测试

https://study.163.com/course/courseMain.htm?courseId=1209958326&share=2&shareId=480000002205486

目录
相关文章
|
传感器
STM32--TIM定时器(1)
STM32--TIM定时器(1)
1086 0
|
JavaScript 前端开发
将本地HTML文件转换成EXE可执行文件
将本地HTML文件转换成EXE可执行文件
1014 0
|
存储 缓存 图形学
Vulkan 围炉夜话3
Vulkan 围炉夜话
258 9
Vulkan 围炉夜话3
麒麟系统mate-indicators进程占用内存过高问题解决
【10月更文挑战第7天】麒麟系统mate-indicators进程占用内存过高问题解决
1680 2
|
搜索推荐 Python
制作圆形公章,园公章制作生成器
Python制作正圆形公章代码
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
527 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
存储 并行计算 测试技术
NumPy 性能优化:提升 Python 数值计算的速度
【8月更文第30天】Python 是一种广泛使用的编程语言,在科学计算领域尤其受欢迎。然而,由于 Python 的动态类型和解释执行机制,其在处理大规模数值数据时可能会显得相对较慢。为了克服这一限制,NumPy(Numerical Python)库提供了高性能的多维数组对象以及一系列用于操作这些数组的函数。本文将探讨如何利用 NumPy 来提高 Python 中数值运算的效率。
1371 1
|
芯片
STM32CubeMX TM1637驱动数码管
STM32CubeMX TM1637驱动数码管
1412 6
|
消息中间件 Kafka 程序员
Kafka内幕:详解Leader选举与副本同步的那些事儿
大家好,我是小米,今天给大家带来一篇关于 Kafka 核心机制的深度解析文章。本文将详细讲解 Kafka 的 Leader 选举、副本消息同步以及相关概念 LEO 和 HW,帮助大家更好地理解和应用 Kafka,提升处理分布式系统的能力。快来一起学习吧!
1038 0
|
存储 运维 监控
运维面试必看的22个项目经验(真实) 学会薪资翻倍
运维面试必看的22个项目经验(真实) 学会薪资翻倍
3682 0