I
目 录
第一章 绪论 ............................................................................................................................ 1
1.1 问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
概述 .................................................................................................................... 1
1.1.1 背景和意义 ...................................................................................................... 1
1.1.2 国内外研究现状 .............................................................................................. 1
1.2 课题目标及本文研究内容 ........................................................................................ 3
1.2.1 主要研究内容 .................................................................................................. 3
1.2.2 系统
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
.......................................................................................................... 3
1.3 本文的结构 ................................................................................................................ 3
第二章 相关知识和工具 ........................................................................................................ 5
2.1 图像特征 .................................................................................................................... 5
2.2 图像纹理特征提取方法 ............................................................................................ 5
2.3 图像分类算法 ............................................................................................................ 9
2.4 Matlab 及图像智能处理工具箱 .............................................................................. 11
第三章 图像纹理特征提取及 BP 分类算法 ....................................................................... 12
3.1 纹理特征提取 .......................................................................................................... 12
3.1.1 灰度共生矩阵(GLCM) ............................................................................ 12
3.1.2 Gabor 滤波方法 ............................................................................................. 14
3.2 BP 神经网络算法 .................................................................................................. 15
第四章 算法软件实现 .......................................................................................................... 18
4.1 软件功能及系统流程 .............................................................................................. 18
4.2 关键函数详述 .......................................................................................................... 18
4.2.1 图像灰度化 .................................................................................................... 18
4.2.2 灰度共生矩阵特征值 .................................................................................... 19
4.2.3 Gabor 滤波特征值 ......................................................................................... 21
4.2.4 BP 神经网络的建立和训练 .......................................................................... 22
4.3 GUI 界面编程 .......................................................................................................... 25
第五章 系统测试 .................................................................................................................. 27
5.1 系统界面 .................................................................................................................. 27
5.2 功能测试及统计 .................................................................................................... 28
5.2.1 训练样本 ........................................................................................................ 28
5.2.2 结果与比较 .................................................................................................... 28
II
第六章 结论与展望 .............................................................................................................. 30
6.1 结果与结论 .............................................................................................................. 30
6.2 问题与展望 .............................................................................................................. 30
6.3
心得体会
决胜全面小康心得体会学党史心得下载党史学习心得下载军训心得免费下载党史学习心得下载
.................................................................................................................. 30
参考文献 .................................................................................................................................. 32
致 谢 .................................................................................................................................. 33
北京邮电大学本科毕业
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
(论文)
1
第一章 绪论
1.1 问题概述
图像是多彩世界的生动表达.随着数码相机的普及,数码图像的数量呈现爆炸似的
增长,网络应用的发展使得人们对于图片检索的需求越来越多。近年来,许多应用领域
例如生物医药、军事、教育和网站都在数字图书馆中存储了大量的图像。随着智能信息
处理在现实生活中需求的不断增加,例如车牌照的识别、人脸识别、机械零件质检识别
等等,图像识别和分类日成为生活息息相关的组成部分。
面对纷繁复杂的图像数据,方便快捷的对图像进行分类已经成为图像处理领域的重
要需求,特别是图像的合理分类对提高基于内容的图像检索结果的准确度具有十分重要
的作用。
1.1.1 背景和意义
20世纪70年代,图像分类主要依靠人工标注的方法,既是用关键词描述图片。但是,
这种方法饱受人工图像分类之苦,因而对每天有几千图片要添加的数据库而言是不实用
的。此外,人为观察的主观和歧义以及用有限关键词描述带来的不完全,可能会大大降
低查询的有效性[1]。
随着计算机技术和数字化图像技术的发展,图像数据库的规模越来越大,人们逐渐
将研究的重点转移到基于图像内容分析的自动分类研究上。在这类研究中通常的方法是
从原始的图像中提取某些待识别的特征,然后把这些特征输入分类器进行分类,最终得
到识别结果。
图像模式识别是近20年来发展起来的一门新兴技术科学,是用现代信息处理技术与
计算机技术来完成人的认识、理解过程,它以研究根据图像的特征进行识别和分类为主
要内容,使得图像智能分类成为可能,大大降低了人工分类之苦,提高了图像分类及识
别的效率,使得其在大量存储和管理数据库相连等方面有无可替代的优越性,应用范围
非常广泛。
1.1.2 国内外研究现状
随着基于Internet的图像数据海量增长和广泛应用,图像分类检索变得越来越重要。
图像分类技术与计算机网络、机器视觉、数据库及知识发现,信息理论等技术的结合日
益增强。近年来,基于内容的图像分类技术得到了很大发展,许多研究人员对图像特征
提取和分类进行了深入研究,并提出了许多解决方案。
北京邮电大学本科毕业设计(论文)
2
由于图像数据本身固有的特点,传统的分类技术用于图像分类时遇到挑战:首先是
图像该如何表示。从不同的角度出发,图像可以分为不同的类别。在模式识别和计算机
视觉中,如何表示对象是至关重要的问题,它不仅直接影响后续分类器的设计和分类精
度,甚至关系到分类识别算法是否可行、分类识别系统是否有效。实际上,特征提取为
每幅图像提供了一个或几个特征向量,它是对图片的视觉内容的简化描述,因为图像本
身太大而不能直接用来分类,从而为图像分类器准备好输入向量。图像的低层可视特征
与高层语义特征之间存在着一道鸿沟,如何通过图像的低层特征表示高层语义,即图像
表示,也是图像预处理的工作重点。图像表示技术在图像检索领域已经得到广泛研究,
但到目前为止还是无法找到一种方法,能够在实际应用中达到令人满意的效果。目前图
像的低层语义特征主要包括颜色、纹理和形状等。
图像特征提取是图像识别的关键步骤,图像特征提取的效果如何直接决定着图像识
别的效果。用于图像模式识别的特征大致可归纳为:1)颜色或灰度的统计特征;2)纹理、
边缘特征;3)代数特征;4)变换系数特征或滤波器系数特征[2]。这些特征中纹理作为一
种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分析技术一直是计算
机视觉、图像处理、图像分析、图像检索等的活跃研究领域。1993年,Tuceryan和Jain
将纹理特征提取方法归为5类,即统计方法、几何方法、结构方法、模型方法和信号处
理方法。统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法,通过此矩
阵可得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。同时在信号处理方
法中,与人眼的生物作用相仿的Gabor变换可以在频域不同尺度、不同方向上提取相关
的特征,这使得Gabor滤波在图象处理中的特征提取等方面有许多应用,并取得了较好
的效果。
第二个是对于提取出来的高维图像特征如何降维,这是一个特征提取的过程。一张
图像的每个特征空间可能是几千维,甚至几万维,这就要求采取一些方法对特征空间进
行降维,以提高分类的效率,即目前图像处理领域的研究热点之一。
最后是如何建立图像的分类模型。近年来,基于内容的图像分类技术也取得了很大
发展:Nedeljkovic提出把模糊技术应用于图像分类,Rong Jin等人在现有分类模型基础
上提出了Bigram模型,Vailaya等通过二元贝叶斯分类器(binary Bayesian)成功地把度假图
片分为户外和户内两类,Li和Wang提出使用区域分割的方法对粗纹理和细纹理的图像进
行分类。
在目前使用的分类器中,主要可以分为三类:基于统计的,代表的有Bayes方法、
KNN方法、类中心向量和支持向量机等;基于规则的,代表的有决策树和粗糙集;还有
一类就是人工神经网络。支持向量机(Support Vector Machine(SVM))是在统计学习理论
的基础上发展而来的一种机器学习方法,基于结构风险最小化原理,将原始数据集合压
缩到支持向量集合,学习得到分类决策函数。其基本思想是构造一个超平面作为决策平
面,使正负模式之间的空白最大。BP神经网络是人工神经网络(ANN)众多模型中的一种。
北京邮电大学本科毕业设计(论文)
3
ANN是参照生物神经元模型发展起来,其基本单元为人工神经元。人工神经元相当于多
输入单输出的非线性阈值器件。BP神经网络具有较强的容错性和自适应学习能力,因而
在数字图像识别领域有着广泛的应用。
1.2 课题目标及本文研究内容
图像分类属于模式识别的范畴,其主要方法是将经过某些预处理(增强、复原、压
缩)后的图像,进行分割和特征提取,然后采用分类算法建立分类模型,最终利用模型
行待分类图像的分类。图像分类一般包括图像预处理、 图像特征提取、图像特征选择
和图像分类4个步骤。
本课题拟采用图像的灰度共生矩阵及Gabor滤波方法并实现特征提取,采用BP神经
网络算法实现图像分类,以实现基于纹理的图像分类。
1.2.1 主要研究内容
本文研究基于灰度共生矩阵与 Gabor 滤波的图像纹理特征提取方法,利用 BP 神经
网络实现图像分类。在灰度图像的基础上,首先对图像进行水平方向的扫描,建立灰度
共生矩阵,进而提取能量、对比度、相关和逆差距作为纹理特征值;再对灰度图像进行
不同方向不同尺度的 Gabor 滤波,并对变换结果求均值和方差作为提取的特征值。然后
建立 BP 神经网络模型,用提取的纹理特征值,来训练 BP 神经网络模型,使网络模型
能够识别图像的内容。
软件实现方面,本系统以 MATLAB 为平台,以用户界面形式实现了基于纹理的图
像分类软件,具有文件打开、训练网络、对任一图像实现分类并以图文结合方式显示分
类结果等功能,经过测试,本系统有效地解决了利用纹理特征完成图像分类的问题。
1.2.2 系统方案
将待分类图像依次进行以下处理:彩色 JPG 图进行灰度转换->特征提取(灰度及
Gabor 变换)->神经网络分类。
1.3 本文的结构
全文分为六章,各部分内容如下:第一章,绪论。介绍本系统要解决的问题。第二
章,相关知识和工具,介绍了开发本系统的相关基础知识和所需工具。第三章,图像纹
理特征提取及 BP 分类算法,对系统中采用的图像纹理特征提取方法和分类算法进行详
细描述。第四章,算法设计及实现,对系统核心算法,关键函数以及界面进行详细的说
明。第五章,系统功能测试,对系统功能进行测试并计算统计结果。第六章,结论与展
北京邮电大学本科毕业设计(论文)
4
望,对设计的系统进行整体的评价及展望。
北京邮电大学本科毕业设计(论文)
5
第二章 相关知识和工具
2.1 图像特征
图像特征的提取与表达是图像分类技术的基础。从广义上讲,图像的特征包括基于
文本的特征(如关键字、注释等)和视觉特征(如色彩、纹理、形状、对象表面等)两
类。视觉特征又可分为通用的视觉特征和领域相关的视觉特征。前者用于描述所有图像
共有的特征,与图像的具体类型或内容无关,主要包括色彩、纹理和形状;后者则建立
在对所描述图像内容的某些先验知识(或假设)的基础上,例如人的面部特征或指纹特
征等。
对于某个特定的图像特征,通常又有多种不同的表达方法。事实上,图像特征的不
同表达方式从各个不同的角度刻画了该特征的某些性质。下面,我们分别介绍一些由实
践证明对图像识别比较有效的特征。
颜色特征是在图像检索中应用最为广泛的视觉特征,主要原因在于颜色往往和图像
中所包含的物体或场景十分相关。此外,与其他的视觉特征相比,颜色特征对图像本身
的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。 其中,颜色直方图是实
践中最常用的图像统计特征。
纹理特征是表示图像的另一种重要的视觉特征,纹理结构反映图像亮度的空间变化
情况,具有局部与整体的自相似性,纹理是由纹理基元按某种确定性的规律或某种统计
规律排列组成的,在纹理区域内各部分具有大致相同的结构。在下节中,我们将着重介
绍那些在图像识别中所常用的纹理特征提取方法,主要有小波变换和共生矩阵等形式。
2.2 图像纹理特征提取方法
纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征。它是所有
物体表面共有的内在特性,例如云彩、树木、砖、织物等都有各自的纹理特征。纹理特
征包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。正因为如此,
纹理特征在基于内容的图像检索中得到了广泛的应用,用户可以通过提交包含有某种纹
理的图像来查找含有相似纹理的其他图像。
由于纹理特征对模式识别和计算机视觉等领域的重要意义,对纹理的分析研究在过
去的三十年中取得了重大的成果。本节按照纹理特征提取方法所基于的基础理论和研究
思路的不同,并借鉴非常流行的 Tuceryan 和 Jain 的分类方法,将纹理特征提取方法分
为四大家族:统计家族、模型家族、信号处理家族和结构家族[3]。
北京邮电大学本科毕业设计(论文)
6
图 2-1 纹理特征提取四大家族
1、统计家族
统计家族的方法是基于像元及其邻域的灰度属性,研究纹理区域中的统计特性,或
像元及其邻域内的灰度的一阶、二阶或高阶统计特性。统计家族发展至今已经 40 多年,
其方法思想简单,易于实现。实践证明,灰度共生矩阵(GLCM)在该家族中一支独秀,
具有旺盛的生命力;其次是半方差图方法。以下主要阐述前两种方法。此外,纹理谱方
法,比如 LBP,因其计算复杂度小,并且具有旋转不变性和多尺度特性,也备受关注。
灰度共生矩阵(GLCM)方法是建立在估计图像的二阶组合条件概率密度基础上的。
GLCM 是描述在方向上,相隔 d 像元距离的一对像元分别具有灰度层 i 和 j 的出现概
率。显然 GLCM 是一个对称矩阵,是距离和方向的函数,其阶数由图像中的灰度级 N
决定,由 GLCM 能够导出 14 种纹理特征。尽管由 GLCM 提取的纹理特征具有较好的鉴
别能力,但是这个方法在计算上是昂贵的,尤其是对于像素级的纹理分类更是应用受限。
首先计算 GLCM 很耗时,再者需要提取 14 个纹理特征,其所需时间可想而知。理特征。
Ulaby 等人研究发现:在基于 GLCM 的 14 个纹理特征中,仅有 4 个特征(对比度、逆差
矩、相关性、能量)是不相关的,这 4 个特征既便于计算又能给出较高的分类精度。2005
年,Kandaswamy 分析了 GLCM 的计算复杂度,受统计占有模型的启发,提出一种提高
纹理分析效率的方法,通过相似度评估,采用近似纹理特征分析雷达图像纹理特征,描
述了如何提取近似纹理特征,其结论为:近似纹理特征可以提高图像纹理分析的效率,
并没有引起分类正确率的下降。
半方差图(semivariogram)该方法是一种基于变差函数的方法,由于变差函数反映图
像数据的随机性和结构性,因而能很好地表达纹理图像的特征。Miranda 等人对该方法
纹理特征提取方法
统计家族
(矩阵方法)
信号处理家族
(小波变换、一般变换)
模型家族
(随机场模型)
结构家族
(句法纹理、数学形态)
北京邮电大学本科毕业设计(论文)
7
用于图像纹理分类做了较为深入的研究,他们认为该方法较适用于分析雷达图像纹理。
吴刚等人根据变差函数的这种性质将单步长变差函数值作为图像纹理特征进行分割,其
实验结果表 明它对人造纹理以及大多数自然纹理的分割效果是十分有效的,对结果做
进一步的后处理工作以精确定位纹理边缘有待进一步研究。
2、模型家族
在模型家族中,假设纹理是以某种参数控制的分布模型方式形成的,从纹理图像的
实现来估计计算模型参数,以参数为特征或采用某种分类策略进行图像分割,因此模型
参数的估计是该家族方法的核心问题。模型家族中主要有随机场方法和分形方法。
随机场模型方法试图以概率模型来描述纹理的随机过程,它们对随机数据或随机特
征进行统计运算估计纹理模型的参数,然后对一系列的模型参数进行聚类,形成和纹理
类型数一致的数类模型参数;由估计的模型参数对灰度图像可以进行逐点的最大后验概
率估计,确定像素及其邻域情况下该像素点最可能归属的概率。随机场模型实质上是描
述图像中像素对其邻域像素的统计依赖关系,其中最重要的、应用最广泛的是 MRF 模
型。
1975 年,美国数学家 Mandelbrot 首次提出了分形。分数维作为分形的重要特征和度
量,把图像的空间信息和灰度信息简单而又有机地结合起来,因而在图像处理中备受人
们的关注。
分数维在图像处理中的应用是以两点为基础的:一是自然界中不同种类的形态物质
一般具有不同的分数维;二是由于 Pentland 的假设,自然界中的分形与图像的灰度表示
之间存在着一定的对应关系。研究表明,人类视觉系统对于粗糙度和凹凸性的感受与分
形维数有着非常密切的联系,因此可以利用图像区域的分形维数来描述图像区域的纹理
特性。分数维描述纹理的核心问题是如何准确地估计分数维,目前人们已经提出了一些
分数维的估计方法,但在估计精度和计算复杂度之间还没有一个很好的折中方法,这也
是人们在分数维方面所一直探讨的问题。分数维最常用的算法有 Keller 的盒维数以及
Sarkar 和 Chaudhuri 提出差分计盒法等。
3、信号处理家族
信号处理的方法是建立在时、频分析与多尺度分析基础之上,对纹理图像中某个区
域内实行某种变换后,再提取保持相对平稳的特征值,以此特征值作为特征表示区域内
的一致性以及区域间的相异性。
信号处理家族方法的共同之处在于用某种线性变换、滤波器或滤波器组将纹理转到
变换域,然后应用某种能量准则提取纹理特征。信号处理方法也称滤波方法。大多数信
号处理方法的提出,基本基于这样一个假设:频域的能量分布能够鉴别纹理。基于该家
族方法的常规的纹理分类流程如图 2-2。
北京邮电大学本科毕业设计(论文)
8
图 2-2 滤波方法纹理分类流程
首先对图像进行滤波,各滤波通道的输出即为初始特征,初始特征的方差差异载有
纹理信息的差异;接下来的局部能量估计目的是估计局部区域中滤波器输出的能量。然
而,精确的边缘保持和精确的能量估计是矛盾的。对边缘定位而言,需要高的空间分辨
率,而能量估计要求高的频率分辨率,两者之间需要通过平滑滤波器进行折衷。局部能
量估计包括非线性处理和平滑处理。恰当的非线性操作可以优化纹理鉴别的性能,非线
性处理方法的选择不是很明确,大多数情况下都是根据经验。常用的平滑滤波器是矩形
的和高斯的,经验表明高斯滤波器是较好的选择。
4、结构家族
结构家族的方法基于“纹理基元”分析纹理特征,着力找出纹理基元,认为纹理由
许多纹理基元构成,不同类型的纹理基元、不同的方向及数目等,决定了纹理的表现形
式。
结构分析方法认为纹理是由纹理基元的类型和数目以及基元之间的“ 重复性”的空
间组织结构和排列规则来描述,且纹理基元几乎具有
规范
编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载
的关系,假设纹理图像的基元
可以分离出来,以基元特征和排列规则进行纹理分割。显然确定与抽取基本的纹理基元
以及研究存在 于纹理基元之 间的“重复性” 结构关系是结构方法要解决的问题。由
于结构方法强调纹理的规律性,较适用于分析人造纹理,而真实世界的大量自然纹理通
常是不规则的,且结构的变化是频繁的,因此对该类方法的应用受到很大程度的限制,
相应的研究没有其他三个家族的方法那么广泛和深入。
综上,四大家族中,信号处理家族的方法从变换域提取纹理特征,其他 3 个则直接
从图像域提取纹理特征。各个家族的方法既有区别,又有联系。正如许多分类方法一样,
只能认为某一种方法更大程度地属于某一家族,较小程度地属于其他家族。
北京邮电大学本科毕业设计(论文)
9
2.3 图像分类算法
图像分类(Image Classification)根据各自在图像信息中所反映的不同特征,把不同
类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像
中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。在目前使用的
分类器中,主要可以分为三类:基于统计的,代表的有Bayes方法、KNN方法、类中心
向量和支持向量机等;基于规则的,代表的有决策树和粗糙集;还有一类就是人工神经
网络[4]。
1、Naïve Bayes 分类(NB)
Naïve Bayes分类是一种概率型的判别分析,它主要是通过概率统计中的Naïve Bayes
公式进行判定。
ii iii CPCxP
CPCxPxCP
|
|
| (2-1)
其中, xCP i | 表示样本x属于类Ci的概率, iCxP | 为各个类别的分布密度函数, iCP 为样本点属于属于各个类别的先验概率。而分析过程结束时则计算每个样本点归
属于某个类别的最大概率,以确定各个样本点的预测类别归属。
Naïve Bayes方法具有较高的准确性,但它有个前提假设就是各特征间,必须是独立
无关的,当样本的各个特征不是相互独立的时候,Naïve Bayes分类的准确度就会大大降
低。而且由Naïve Bayes公式可以看出,各个类的概率密度分布的估计将对分类结果起着
决定性的影响,但是往往在现实世界中概率密度分布函数是难以估计的。
2、支持向量机(SVM)
支持向量机(Support Vector Machine(SVM))是在统计学习理论的基础上发展而来的
一种机器学习方法,它是由Boser,Guyon,Vapnik在OLT-92上首次提出。SVM基于结
构风险最小化原理,将原始数据集合压缩到支持向量集合,学习得到分类决策函数。其
基本思想是构造一个超平面作为决策平面,使正负模式之间的空白最大。
图2-3 线性可分情况下的最优分类线
北京邮电大学本科毕业设计(论文)
10
以图2-3的两类情况为例说明:实心点和空心点分别代表两类样本,H为分类线,H1,
H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分
类间隔。所谓最优分类线就是要求分类线不但能将两类正确分开,而且使分类间隔最大,
我们的目标就是要寻找出这条最优分类线。假设分类线方程为x·w + b = 0,其中x为我
们输入的样本,w和b分别称为权重向量和偏置。我们必须使得线性可分的两类样本集(xi,
yi),i=1,…,n,n∈Rd,yi∈{+1,-1},满足
11
11
ii
T
ii
T
yifbxw
yifbxw
(2-2)
此时分类间隔等于2/w,使间隔最大等价于使w最小,满足公式2且使
2
2
1 w
最小的分
类面称最优分类面,H1和H2上的训练样本称做支持向量。
3、BP 神经网络
目前,常用的神经网络主要有BP神经网络、Hopfield网络、Kohonen网络等,由于神
经网络自身的复杂性,选用哪种类型的网络并没有最优化的方式,主要是针对神经网络
进行分类的样本类型、数量决定。出于对图像识别自身特点的考虑,采用BP神经网络对
图像进行训练和识别。
BP神经网络采用误差反向传播学习算法[5],该网络可将一组样本的I/O问题转化为一
个非线性优化问题,并可近似实现从输入到输出的任意连续的非线性映射。BP神经网络
不仅有输入节点、输出节点,而且有隐含层节点(可以是一层或多层,本文采用含一个
隐含层的网络),如图2-3所示。
图2-4 层BP神经网络模型
该算法分为两个阶段,第一阶段是正向传播,第二阶段是反向传播。在正向传播过
程中,对号于输入信,要先向前传播到隐节点,经过作用函数后,再把隐节点的输出信
息传播到输出节点,最后给出输出结果,其中每一层神经元的状态只影响下一层神经元
的状态。如果在输出层不能得到期望输出,则转入反向传播,将误差信号沿原来的连接
北京邮电大学本科毕业设计(论文)
11
通路返回,通过修改各层神经元的权值,使得误差达到最小。
如图2-4,(x1, x2...xn)输入向量组,(y1, y2...yn)输出向量组。最下面一层为输入层,
中间一层为隐含层,最上面一层为输出层。
2.4 Matlab 及图像智能处理工具箱
MATLAB 是矩阵实验室(Matrix Laboratory)的简称,是美国 MathWorks 公司出品
的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算
语言和交互式环境,主要包括 MATLAB 和 Simulink 两大部分。
MATLAB 的强大优势主要表现在:
第一,友好的工作平台和编程环境。MATLAB 由一系列工具组成。这些工具方便用
户使用 MATLAB 的函数和文件,其中许多工具采用的是图形用户界面。
第二,简单易用的程序语言。MATLAB 一个高级的矩阵/阵列语言,
它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。基于 C++语
言基础上的,更加简单,这种语言可移植性好、可拓展性极强。
第三,强大的科学计算机数据处理能力。拥有 600 多个工程中要用到的数学运算函
数,可以方便的实现用户所需的各种计算功能。
第四,出色的图形处理功能。具有方便的数据可视化功能,包括二维和三维的可视
化、图象处理、动画和表达式作图。
第五,应用广泛的模块集合工具箱。对许多专门的领域都开发了功能强大的模块集
和工具箱。用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代
码。
本系统中,主要采用了 MATLAB 的计算灰度共生矩阵及其属性值的函数
graycomatrix 以及 graycoprops 来进行相关纹理特征的运算,并且使用了 MATLAB 自带
的 BP 工具箱完成 BP 网络的训练以实现分类。
同时,在程序界面的设计中采用了 MATLAB 中 GUI 用户界面设计。图形用户界面
(Graphical User Interfaces,GUI)则是由窗口、光标、按键、菜单、文字说明等对象
(Objects)构成的一个用户界面。用户通过一定的方法(如鼠标或键盘)选择、激活这
些图形对象,使计算机产生某种动作或变化,比如实现计算、绘图等。
北京邮电大学本科毕业设计(论文)
12
第三章 图像纹理特征提取及 BP 分类算法
3.1 纹理特征提取
3.1.1 灰度共生矩阵(GLCM)
灰度共生矩阵(Gray-level Co-occurrence Matrix)能反映出图象灰度关于方向、相邻间
隔、变化幅度的综合信息,它是分析图象的局部模式和它们排列规则的基础。它反映了
图像中任意两点灰度的相关性,根据它可进行纹理特征的抽取及分析。GLCM 是图像中
相距为 =( ) 的两个灰度像素同时出现的联合概率分布,定义如下[6]:
(3-1)
其中, 代表灰度在 i 和 j 之间的出现频率。
设图像的灰度级为 N,则共生矩阵是 N×N 矩阵,可表示为 ,其中位于 的
元素 P 的值表示一个灰度为 i 而另一个灰度为 j 的两个相距为 =( )的像素对出
现的概率。在实际处理中,为了减少计算量,( )一般只取以下四种情况[7]:
( 1 ) ( = 1 , = 0 ) 即水平方向相邻 0°
( 2 ) ( = 0, = 1 ) 即竖直方向相邻 90°
( 3 ) ( = 1 , = 1 ) 即西北 一东南方向相邻 45°
( 4 ) ( = -1 , = 1 ) 即东北一西南方向相邻 135°
不同的图像由于纹理尺度的不同其灰度共生矩阵会有很大差别。对于粗纹理图像,
纹理尺度大,灰度较平滑,其像素趋于具有相同的亮度,所以共生矩阵的 P 值较集
中于对角线附近。而对于细纹理图像,纹理尺度较小,灰度值分布不集中,其共生矩阵
中的 P 值分散在各处。由此可见,共生矩阵可以反映不同灰度像素相对位置的空间
信息。
为了能更直观地以共生矩阵描述纹理状况,从共生矩阵导出一些反映矩阵状况的参
数,典型的有以下几种[8]:
(1)能量(Energy):
n
i
n
j
jipASM
0 0
2,
(3-2)
能量是灰度共生矩阵元素值的平方和,所以也称角二阶矩,反映了图像灰度分布均
匀程度和纹理粗细度。如果共生矩阵的所有值均相等,则 ASM 值小;相反,如果其中
一些值大而其它值小,则 ASM 值大。当共生矩阵中元素集中分布时,此时 ASM 值大。
ASM 值大表明一种较均一和规则变化的纹理模式。
北京邮电大学本科毕业设计(论文)
13
(2)对比度(Contrast):
n
i
n
j
jipjiCON
0 0
2 , (3-3)
对比度反映了图像的清晰度和纹理沟纹深浅的程度。纹理沟纹越深,其对比度越大,
视觉效果越清晰;反之,对比度小,则沟纹浅,效果模糊。灰度差即对比度大的象素对
越多,这个值越大。灰度公生矩阵中远离对角线的元素值越大,CON 越大。
(1) 黑石子 Contrast: 0.3189 (2) 白石子 Contrast: 0.1580
图 3-1 黑白石子图片的对比度比较
如图 3-1 中有两张黑白石子路照片,前者黑石子白地面对比度较大,而后者较小,
计算其灰度共生矩阵对比度值,可得前者为 0.3189,后者为 0.1580。
(3)相关(Correlation):
n
i
n
j
yx
yx
jipjiCOR
0 0
,1 (3-4)
其中:
n
i
n
j
x jip
0 0
, (3-5)
n
j
n
i
y jip
0 0
, (3-6)
n
j
n
i
xx jipin 00
2 ,1 (3-7)
n
i
n
j
yy jipjn 00
2 ,1 (3-8)
相关度量空间灰度共生矩阵元素在行或列方向上的相似程度,因此,相关值大小反
映了图像中局部灰度相关性。当矩阵元素值均匀相等时,相关值就大;相反,如果矩阵像
北京邮电大学本科毕业设计(论文)
14
元值相差很大则相关值小。如果图像中有水平方向纹理,则水平方向矩阵的 COR 大于
其余矩阵的 COR 值。
(4)逆差距(Homogeneity):
逆差距反映图像纹理的同质性,度量图像纹理局部变化的多少。其值大则说明图像
纹理的不同区域间缺少变化,局部非常均匀。
在本系统中,实际上调用 MATLAB 灰度共生矩阵函数,基于图像灰度共生矩阵的
特征提取算法如下:
( 1 ) 将彩色图像转化为灰度图像;
( 2 ) 灰度级粗量化;
由于求共生矩阵的计算量较大,为节省计算时间,一般将灰度级粗量化,如 256 级
量化成 l6 级。经过量化后的图像虽有失真,但对纹理特征影响不大。在本系统中,灰度
级被内部定义为 8 位。
( 3 ) 求出水平方向上的共生矩阵;
( 4 ) 求出共生矩阵的上述四个特征向量;
3.1.2 Gabor 滤波方法
Gabor函数由Gabor首先定义,然后Daugman将其扩展成二维结构。它是目前唯一能
够达到时频测不准关系下界的函数,能最好地兼顾信号在时域和频域中的分辨能力。应
用2D Gabor函数形成的Gabor滤波器有着优良的滤波器性能,并且具有与生物视觉系统
相近的特点,所以近年来广泛应用于纹理分割、人脸检测、指纹鉴别等领域[9]。
Gabor变换属于加窗傅立叶变换,Gabor函数可以在频域不同尺度、不同方向上提取
相关的特征。Gabor函数通过模拟人类视觉系统,可以将视网膜图像分解成一组滤波图
像,每个分解的图像能够反映频率和方向在局部范围内的强度变化,所以经常用作纹理
识别上,并取得了较好的效果。
Gabor滤波方法利用了Gabor滤波器的良好性质,即具有时域和频域的联合最佳分辨
率[10],并且较好地模拟了人类视觉系统的视觉感受特性,在图像纹理特征提取中备受青
睐。该方法以“纹理是窄带信号”为基础的,其主要思想是:不同纹理一般具有不同的中
心频率及带宽,根据这些 频率和带宽可以设计一组Gabor滤波器对纹理图像进行滤波,
每个Gabor滤波器只允许与其频率相对应的纹理顺利通过,而使其他纹理的能量受到抑
制,从各滤波器的输出结果中分析和提取纹理特征,用于而后的分类或分割任务。
Gabor滤波在图象处理中的特征提取、纹理分析和立体视差估计等方面有许多应用。
下图给出原始图片Lenna 和Gabor 滤波后的结果。图3-2 (1)是原图和所有方向滤波的重
叠结果,(2)是每个方向重采样的结果。
北京邮电大学本科毕业设计(论文)
15
(1) 原图和所有方向滤波的重叠结果 (2) 各个方向重采样的结果
图3-2 Lenna原始图片和Gabor 滤波后的效果
通过Gabor滤波后,接下来是如何从Gabor滤波器的输出结果中提取纹理特征。实际
纹理图像并非严格意义上周期信号,因此,需要对Gabor滤波后的图像进行非线性操作
和能量计算来得到特征图像,并用建立的特征矢量做分类。可以直接利用Gabor滤波结
果作为纹理特征,但是纹理特征向量的维数高数据量庞大,因此研究者们集中在如何减
少所用的滤波器的个数和对Gabor滤波的结果进行后处理等方面。典型的后处理方法有:
基于Gabor滤波器的输出的幅度响应、高斯平滑处理、Gabor能量特征、复矩特征、栅格
元特征、独立成分分析法等等。
在系统测试中,先后采用了滤波输出结果的能量以及均值方差作为纹理特征进行BP
网络训练,在反复比较中,发现能量并不能很好的表征各种地表纹理图像的特征,常常
无法完成网络训练;而采用均值和方差作为网络输入向量则能较好的完成训练得出识别
结果。
3.2 BP 神经网络算法
BP神经网络具有较强的容错性和自适应学习能力,因而在数字图像识别领域有着广
泛的应用。BP神经网络是人工神经网络(ANN)众多模型中的一种。ANN是参照生物神经
元模型发展起来,其基本单元为人工神经元。人工神经元相当于多输入单输出的非线性
阈值器件。可用公式2-4表述:
ii xwfO (2-4)
其中Xi表示这个神经元的输入,wi是输入值的连接强度(即权重),∑wi辑称为该神经
元的激活值,O表示这个人工神经元的输出, 表示人工神经元的阈值。如果输入的加
权和超过该阈值,则该神经元被激活。一般ANN有多层网络,其中每层网络都是由多个
人工神经元构成。ANN就是通过对样本数据的训练,寻找合适的权重和阈值,达到对每
个输人的样本都有一个正确的输出值,本文中就是对样本正确的分类。
BP(Back propagation)具有三层或三层以上的多层神经网络,即具有一个输入层,一
北京邮电大学本科毕业设计(论文)
16
个输出层和至少一个隐藏层,是采用BP算法进行训练的多层感知器网络。典型的BP网
络是三层,即:输入层、隐含层和输出层。各层之间实行全连接。
网络学习过程包括两个阶段:
(1)输入模式顺传播。把训练样本提供给网络,并确定其输出值;计算中间层各神经
元的激活值,并将激活值从输入层经各中间层向输出层传播;在输出层的各神经元输出
对应于输入模式的网络响应。
(2)输出误差的逆传播。比较第一阶段的实际输出值和期望输出值,如果大子给定的
误差范围,将根据减少期望输出值和实际输出值误差的原则,从输出层的值经各中间层、
最后回到输入层逐层修正各连接权。
除了以上输入模式由输入层经中间层向输出层的“模式顺序传播”以及误差信号由
输出层经中间层向输入层逐层修正连接权的“误差逆传播”过程,网络学习全过程还包
括由“模式顺序传播”与“误差逆传播”的反复交替进行的网络“记忆训练”过程,网
络趋向收敛即网络的全局误差趋向极小值的“学习收敛”过程。归结起来为,网络学习
全过程为“模式顺序传播”->“误差逆传播”->“记忆训练”->“学习收敛”。
图 3-3 用神经网络识别流程图
BP网络能够对输入进行并行处理,有效地解决了非正态分布、非线性的评价问题等,
但它对初始权重非常敏感,极易收敛于局部极小,且存在过拟合的问题,许多参数的选
求输入层的输出
求隐层输入
求隐层输出
求输出层输入
求输出层输出
输入测试样本,
提取特征
通过取得最大值的输
出节点位置判断分类
计算识别正确率
北京邮电大学本科毕业设计(论文)
17
择须根据人工经验手工调整,尤其是网络隐含结点数的选择对分类结果有直接的影响。
在测试软件过程中,经不断调试发现,合理设置各训练参数有助于更好的完成训练
过程。例如,在训练函数选择方面,trainlm较其他函数能较快的完成网络训练。如图3-4
所示,其他网络训练参数不变时训练函数trainlm只需Epochs在17次时即可完成训练,而
traingdx需要Epochs接近7000才能达到训练目标。
0 2 4 6 8 10 12
10
-4
10-3
10-2
10-1
100
101
12 Epochs
Tr
ai
ni
ng
-B
lu
e
G
oa
l-B
la
ck
Performance is 0.000869885, Goal is 0.001
0 1000 2000 3000 4000 5000 6000
10-4
10-3
10-2
10-1
100
101
6791 Epochs
Tr
ai
ni
ng
-B
lu
e
G
oa
l-B
la
ck
Performance is 0.000999806, Goal is 0.001
(1) 训练函数为 trainlm (2) 训练函数为 traingdx
图 3-4 不同训练函数的训练过程
如图3-5,保持其他训练参数不变:隐含层节点数为10,转移函数是tan-sigmoid,输
出层的转移函数是linear,以trainlm为训练函数,收敛误差为0.001,设定学习率分别为
0.005和0.5,可得以下训练结果。前者Epochs为45时结束训练,而后者Epochs为18时即
可达到训练目标。可见,较大的学习率可以达到较快收敛速度。
0 5 10