《Visual C++数字图像模式识别技术详解(第2版)》一1.2 模式识别基本概念

简介: 本节书摘来自华章出版社《Visual C++数字图像模式识别技术详解(第2版)》一 书中的第1章,第1.2节,作者:冯伟兴 贺波 王臣业,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 模式识别基本概念

模式识别是20世纪60年代迅速发展起来的一门前沿学科,在许多领域得到了广泛应用。本节简要介绍模式识别的基本概念和系统组成,以及模式识别在图像识别中的应用方法。

1.2.1 模式和模式识别的概念

模式识别的目的就是利用计算机模仿人的识别能力,它往往包含推理过程,需要专家系统、知识工程等相关学科的支持。当前的模式识别理论主要是对人的低级识别能力的模拟,即实现“观察对象是什么”的判断。
模式是指具有某种特定性质的观察对象。特定性质是指可以用来区分观察对象是否相同或相似而选择的特性。观察对象是指人类感官直接或间接接收的外界信息。例如,一个数字、一句话、一张照片等都是观察对象。而把具有某些共同特性的模式的集合称为模式类。
模式识别是研究一些自动技术,依靠这些技术,计算机自动地(或者人进行少量干涉)把待识别的模式分到各模式类中。即,模式识别技术就是根据模式的特性,将其判定为某一模式类的技术。

1.2.2 模式空间、特征空间和类别空间

从技术途径来说,模式识别实质上完成的是从模式空间经过特征空间到类别空间的映射过程。
在物理上可以觉察到的世界里,适当地选择某些物体和事件,把它们称为样本。对它们分别进行观察所得到的观测数据的集合就构成了模式,所有的观察样本数据则构成模式空间。显然模式空间的维数与所选择的样本和观测方法有关,也与特定的应用有关,一般是一个很大的有限值。在模式空间中,每个样本都是一个点,点的位置由该模式在各维上的数据来确定。由物理上可以觉察到的世界到模式空间所经历的过程称为模式采集。
模式空间的维数虽多,但有些并不能揭示样本的实质。对模式空间里的各坐标元素进行综合分析,获取最能揭示样本属性的观测量作为主要特征,这些主要特征就构成了特征空间。显然,特征的维数大大压缩了。由模式空间到特征空间所需要的综合分析,往往包含适当的变换和选择,称之为特征提取和选择。
利用某些知识和经验可以确定分类原则,称之为判别规则。根据适当的判别规则,将特征空间里的样本区分成不同的类型,从而将特征空间转换成了类别空间。类别空间中不同类别的分界面,常称为决策面。类别空间的维数与类别的数目相等,一般来说小于特征空间的维数。由特征空间到类别空间所需要的操作是分类判别。

1.2.3 模式识别系统的组成

一个典型的模式识别系统(如图1-1所示),由数据获取、预处理、特征提取、分类决策和分类器设计5部分组成。可以分为上下两部分:上半部分完成未知类别模式的分类;下半部分完成分类器的设计训练过程。

screenshot

模式识别系统各组成单元的功能如下:
1)数据获取:利用计算机可以运算的符号来表示所研究的对象,对应于外界物理空间向模式空间的转换。一般,获取的信息类型有以下几种。
 一维波形:心电图、脑电波、声波、震动波形等。
 二维图像:文字、地图、照片等。
 物理参量:体温、化验数据、温度、压力、电流、电压等。
2)预处理:对由于信息获取装置或其他因素所造成的信息退化现象进行复原、去噪,加强有用信息。
3)特征提取:由信息获取部分获得的原始信息,其数据量一般相当大。为了有效地实现分类识别,应对经过预处理的信息进行选择或变换,得到最能反映分类本质的特征,构成特征向量。其目的是将维数较高的模式空间转换为维数较低的特征空间。
4)分类决策:在特征空间中用模式识别方法(由分类器设计确定的分类判别规则)对待识模式进行分类判别,将其归为某一类别,输出分类结果。这一过程对应于特征空间向类别空间的转换。
5)分类器设计:为了把待识模式分配到各自的模式类中,必须设计出一套分类判别规则。基本做法是收集一定数量的样本作为训练集,在此基础上确定判别函数,改进判别函数和误差检验。
模式识别的关键是解决如何利用计算机进行模式识别,并对样本进行分类。执行模式识别的基于计算机的系统(可以是台式机、笔记本电脑或基于单片机、DSP和ARM等有计算能力的系统)称为模式识别系统。

1.2.4 数字图像模式识别

在各种信息中,图像含有的信息最多,也是人类视觉的基础,因此基于视觉的图像识别具有特别重大的意义。图像可以是各种物体的黑白或彩色图画、手写字符、遥感图片、X射线透视胶片等。图像识别的目的在于用计算机自动处理图像上的信息,以代替人去完成图像分类及辨识的任务。
图像识别作为模式识别的一类,其识别过程与模式识别的过程类似。图像识别的4个主要步骤如图1-2所示。

screenshot

1.图像预处理
为了研究图像内容的识别,首先要对获得图像进行预处理,滤去干扰、噪声,当图像中的信息微弱得无法识别时,还须对图像进行增强处理、几何调整、颜色校正等,以便进行进一步的人机分析。
2.图像分割
为了从图像中找到需要识别的物体,还需要对图像进行分割,也就是定位和分离出不同的待识别物体。这一过程输入的是整幅图像,输出的是像元图像。
3.图像特征抽取
在图像中需要识别的物体被分割出来的基础上,提取需要的特征,并对某些参数进行计算、测量,根据测量的结果进行分类。
4.图像分类
根据提取的特征值,利用模式识别方法进行分类,确定类别名称,以便对图像的重要信息得到一种理解和解释。这一过程输入的是特征信息,输出的是类别名称。

相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
25天前
|
设计模式 存储 缓存
【C++ 基本概念】深入探索C++ RTTI 特性
【C++ 基本概念】深入探索C++ RTTI 特性
61 0
|
25天前
|
安全 编译器 C++
【C++20概念】编译时多态性的力量
【C++20概念】编译时多态性的力量
46 0
|
30天前
|
Linux 数据处理 C++
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用(一)
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用
69 0
|
25天前
|
算法 安全 编译器
【C++20 新特性Concepts 概念】C++20 Concepts: Unleashing the Power of Template Programming
【C++20 新特性Concepts 概念】C++20 Concepts: Unleashing the Power of Template Programming
42 0
|
30天前
|
存储 Linux API
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用(三)
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用
31 1
|
30天前
|
消息中间件 Linux 数据处理
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用(二)
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用
30 1
|
30天前
|
存储 编解码 vr&ar
用C++实现视频编码器:FFmpeg与SDL技术结合,轻松编写高效编解码器
用C++实现视频编码器:FFmpeg与SDL技术结合,轻松编写高效编解码器
68 0
|
30天前
|
存储 算法 编译器
C/C++编译器局部优化技术:局部优化是针对单个函数或基本块进行的优化
C/C++编译器局部优化技术:局部优化是针对单个函数或基本块进行的优化
31 0
|
17天前
|
存储 C++
【C++】Visual Studio C++ 配置并使用gtest(不好用你捶我)
【C++】Visual Studio C++ 配置并使用gtest(不好用你捶我)
|
25天前
|
设计模式 存储 安全
【C++ 基本概念】C++编程三剑客:模板、多态与泛型编程的交织与差异
【C++ 基本概念】C++编程三剑客:模板、多态与泛型编程的交织与差异
102 0