1.2 模式识别的主要方法
1.2.1 决策理论方法
决策理论方法又称统计模式识别方法,是发展较早也比较成熟的一种方法。首先对要识别的对象数字化,变换为适合计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还进行预处理,以除去混入的干扰信息并减少某些变形和失真。随后是进行特征提取,即从数字化后或预处理后的输入模式中提取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征提取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征向量表示,这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征提取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征提取后可进行分类,即从特征空间再映射到决策空间。为此引入鉴别函数,通过特征向量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。
1.2.2 句法方法
句法方法又称为结构模式识别方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述。底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能为模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。
1.2.3 模糊模式识别方法
这类技术运用模糊数学的理论和方法解决模式识别问题,因此适用于分类识别对象本身或要求的识别结果具有模糊性的场合。目前,模糊模式识别方法较多,这类方法的有效性主要在于对象的隶属函数是否良好。
1.2.4 人工神经网络方法
人工神经网络是由大量简单的基本单元——神经元相互连接而构成的非线性动态系统,每个神经元结构和功能比较简单,而由其组成的系统却可以非常复杂,具有生物神经网络的某些特征,在自学习、自组织、联想及容错方面具有较强的能力,能用于联想、识别和决策。在模式识别方面,人工神经网络方法与前述方法显著不同的特点之一是学习过程中具有自动提取特征的能力。
1.2.5 人工智能方法
人类具有极完善的分类识别能力,人工智能是研究如何使机器具有人脑功能的理论和方法,模式识别从本质上讲就是如何根据对象的特征进行类别的判断,因此,可以将人工智能中有关学习、知识表示、推理等技术用于模式识别。
上述五种方法各有其特点及应用范围,显然,它们不能相互取代,只能共存,相互促进、借鉴、渗透和融合。一个较完善的识别系统很可能是综合利用上述各类识别方法的观点、概念和技术而形成的。