
1.2 模式识别基本概念
模式识别是20世纪60年代迅速发展起来的一门前沿学科,在许多领域得到了广泛应用。本节简要介绍模式识别的基本概念和系统组成,以及在图像识别中的应用方法。
1.2.1 模式和模式识别的概念
模式识别可以说是伴随人们生活的每一天。听到某个人说话,就能分辨出这个人是谁;当某种东西出现在视觉范围之内时,就能认出这一东西是什么,如此等等。在模式识别技术出现之前,人们从来没有过多地关注自己所具备的识别能力,而认为是理所当然的。
模式识别的目的就是利用计算机模仿人的识别能力,它往往包含有推理过程,需要有专家系统、知识工程等相关学科的支持。当前的模式识别理论主要是对人的低级识别能力的模拟,即是实现“观察对象是什么”的判断。
模式是指具有某种特定性质的观察对象。特定性质是指可以用来区分观察对象是否相同或相似而选择的特性。观察对象是指凡是人类感官直接或间接接受的外界信息。例如,一个数字、一句话、一张照片等都是观察对象。而把具有某些共同特性的模式的集合称为模式类。
模式识别是研究一些自动技术,依靠这些技术,计算机自动地(或者人进行少量干涉)把待识别的模式分到各自模式类中。即模式识别技术就是根据模式的特性,将其判定为某一模式类的技术。
1.2.2 模式空间、特征空间和类别空间
从技术途径来说,模式识别实质上完成的是从模式空间经过特征空间到类别空间的映射过程。
在物理上可以觉察到的世界里,适当地选择某些物体和事件,把它们称为样本。对它们分别进行观察所得到的观测数据的集合就构成了模式,所有的观察样本数据则构成模式空间。显然,模式空间的维数与所选择的样本和观测方法有关,也与特定的应用有关,一般是一个很大的有限值。在模式空间中,每个样本都是一个点,点的位置由该模式在各维上的数据来确定。有物理上可以觉察到的世界到模式空间所经历的过程称为模式采集。
模式空间的维数虽多,但有些并不能揭示样本的实质。对模式空间里的各坐标元素进行综合分析,获取最能揭示样本属性的观测量作为主要特征,这些主要特征就构成了特征空间。显然,特征的维数大大压缩了。由模式空间到特征空间所需要的综合分析,往往包含适当的变换和选择,称之为特征提取和选择。
利用某些知识和经验可以确定分类原则,称之为判别规则。根据适当的判别规则,将特征空间里的样本区分成不同的类型,从而将特征空间转换成了类别空间。类别空间中不同类别的分界面,常称为决策面。类别空间的维数与类别的数目相等,通常小于特征空间的维数。由特征空间到类别空间所需要的操作是分类判别。
1.2.3 模式识别系统的组成
一个典型的模式识别系统如图1-1所示,由信息获取、预处理、特征提取和选择、分类决策和分类器设计五部分组成。可以分为上下两部分:上半部分完成未知类别模式的分类;下半部分完成分类器的设计训练过程。
模式识别系统各组成单元的功能如下。
(1)信息获取
利用计算机可以运算的符号来表示所研究的对象,对应于外界物理空间向模式空间的转换。一般获取的信息类型有以下几种。
■一维波形:心电图、脑电波、声波、震动波形等。
■二维图像:文字、地图、照片等。
■物理参量:体温、化验数据、温度、压力、电流、电压等。

图1-1 模式识别系统的组成
(2)预处理
对由于信息获取装置或其他因素所造成的信息退化现象进行复原、去噪,加强有用信息。
(3)特征提取
由信息获取部分获得的原始信息,其数据量一般相当大。为了有效地实现分类识别,应对经过预处理的信息进行选择或变换,得到最能反映分类本质的特征,构成特征向量。其目的是将维数较高的模式空间转换为维数较低的特征空间。
(4)分类决策
在特征空间中用模式识别方法(由分类器设计确定的分类判别规则)对待识模式进行分类判别,将其归为某一类别,输出分类结果。这一过程对应于特征空间向类别空间的转换。
(5)分类器设计
为了把待识模式分配到各自的模式类中,必须设计出一套分类判别规则。基本做法是收集一定数量的样本作为训练集,在此基础上确定判别函数,改进判别函数和误差检验。
模式识别的关键是解决如何利用计算机进行模式识别,并对样本进行分类。执行模式识别的基于计算机系统(可以是台式机、笔记本电脑或基于单片机、DSP和ARM等有计算能力的系统)称为模式识别系统。
1.2.4 数字图像模式识别
在各种信息中,图像含有的信息最多,也是人类视觉的基础,因此基于视觉的图像识别具有特别重大的意义。图像可以是各种物体的黑白或彩色图画、手写字符、遥感图片、X射线透视胶片等等。图像识别的目的在于用计算机自动处理图像上的信息,以代替人去完成图像分类及辨识的任务。
图像识别作为模式识别的一类,其识别过程与模式识别的过程类似。图像识别的四个主要步骤如图1-2所示。

图1-2 图像识别的四个主要步骤
(1)图像预处理
为了研究图像内容的识别,首先要对获得图像进行预处理,滤去干扰、噪声,当图像中的信息微弱无法辨识时,还需对图像进行增强处理,几何调整,颜色校正等,以便进一步进行人机分析。
(2)图像分割
为了从图像中找到需要识别的物体,还需要对图像进行分割,也就是定位和分离出不同的待识别物体。这一过程输入的是整幅图像,输出的是像元图像。
(3)图像特征抽取
在图像中需要识别的物体被分割出来的基础上,提取需要的特征,并对某些参数进行计算、测量,根据测量的结果进行分类。
(4)图像分类
根据提取的特征值,利用模式识别方法进行分类,确定类别名称,以便对图像的重要信息得到一种理解和解释。这一过程的输入是特征信息,输出是类别名称。