模糊模式识别的应用(作者：蒋培杰)

模糊模式识别的应用(作者：蒋培杰) 模糊模式识别的应用蒋培杰摘要本文介绍模糊模式识别的方法和各个步骤，然后具体对每个步骤及其方法详细介绍，进行了实例应用实验，并且指出了模糊识别与其他识别方法的比较及优缺点。关键字：模糊模式识别最大隶属原则贴近度择近原则内积外积一、引言在日常生活中，人们常常通过感官来对图形、文字、语言等作出识别，在气象科学领域、工程勘察领域、环境工程领域、医学领域、刑侦领域、军事领域等等方面的工作都有一个共同特点，就是都涉及利用...

模糊模式识别的应用蒋培杰摘要本文介绍模糊模式识别的方法和各个步骤，然后具体对每个步骤及其方法详细介绍，进行了实例应用实验，并且指出了模糊识别与其他识别方法的比较及优缺点。关键字：模糊模式识别最大隶属原则贴近度择近原则内积外积一、引言在日常生活中，人们常常通过感官来对图形、文字、语言等作出识别，在气象科学领域、工程勘察领域、环境工程领域、医学领域、刑侦领域、军事领域等等方面的工作都有一个共同特点，就是都涉及利用已知的各类型来识别给定对象属于哪一个类型的问题，这就是模式识别问题。模式识别不仅指感官对物体的感觉，它也是人们的一种基本的思维活动。根据被识别模式的性质，可以把识别行为分为两大类：具体事物的识别，如对文字、照片、音乐、语言等周围事物的识别；抽象事物的识别，如对已知的一个论点或一个问题的理解等。人类对模式识别过程的机理目前仍然不是很清楚。对具体事物的识别主要是心理现象，对抽象事物的识别主要是思维现象。当一个人对于具体事物的认识，涉及人与客观事物在人类感官中所引起的刺激之间的关系。当一个人感受到一个模式时，他把此感觉与他从自己过去的经验中得来的一般概念或线索结合起来，并作出归纳性的推理判断。由于客观事物的特征存在不同程度的模糊性，使得经典的识别方法越来越不适应客观实际的要求，模糊识别正是为了满足这一要求而产生起来的。本文不仅介绍进行模糊识别的方法，更指出了模糊识别与其他方法相比的优缺点。二、模糊识别隶属原则的应用方法模糊模式识别方法一般按照以下步骤处理： 1、数据的预处理预处理包括消除干扰（这包括对数据的判断及对明显错误数据的剔除）和统一量纲，为确定隶属函数和建立识别系统等作准备。 2、选取特征指标选定能刻划模式特性的特征量的个数及其量值，要确保选取方法的有效性。 3、确定隶属函数确定特征量的模糊子集的隶属函数。如按模糊统计方法确定隶属函数（方法很多，主要以实践效果作为检验和调整隶属函数的依据）。 4、建立模型建立论域 X上的 l 个已知模糊子集 A1，A2，…，Al。若对每一 Ak(k=1，2, …,l，存在 n个描述入的特征变量，则建立相应的模型特征子集 Akj(j=1，2，…，n). 5、确定待判样本确定研究区的待判样本及其特征量的值，特征量的类型要与控制区的已知模型的特征量的类型相同，确定方法并不唯一。 6、模糊识别采用最大隶属原则、加权加势隶属原则及加权积势隶属原则等对待判样本进行综合识别及评判，并确定样本的归属，完成模糊识别。三、模糊识别的直接方法模糊识别的最大隶属原则：设 A1，A2，……，Al 为论域 U上表示已知模型的 l 个模糊子集，u。∈U 为论域 U 上的待识别模型。判断 u。属于哪种模型，是根据隶属函数值来确定的，并且按最大隶属原则进行模型识别。最大隶属原则：设 A1，…,Al 为论域 U 上的 l 个模糊子集，u。∈U如果存在一个 i ∈{1，2，……， l}，使 uAi(u。)=∨{uA1 (u。)，uA2(u。)，……，uAl(u。)}，则有 u。∈Ai 即 u。相对隶属于 Ai。uAi (u。)为 u。隶属 Ai 的隶属函数值。为读者更加熟悉该原则，我们举一个模糊识别最大隶属原则的例子：例1．三角形论域 X={(A,B,C)∣A≧B≧C,A+B+C=180}，定义等腰三角形 I I（A,B,C）：= 1- 60 1 ((A-B)∧(B-C))，直角三角形 R R（A,B,C）：= 1- 90 1 ∣A-90∣, 正三角形 E E（A,B,C）：= 1- 180 C-A 等腰直角三角形 I ∩ R，非典型三角形 T=C(I ∪ R ∪ E) 给出某三角形（A,B,C）=(89,46,45),试判断相对属于哪种三角形。解答：本例为大隶属原则应用。本例均保留四位有效数字： I（A,B,C）= I（89，46，45）=0.9833 R（A,B,C）= R（89，46，45）=0.9889 E（A,B,C）= E（89，46，45）=0.7556 I ∩ R =0.9833 T（A，B,C）=1-0.9889=0.0111 （注：本例计算结果通过 MATLAB验算）故按照最大隶属原则，所给出的三角形相对属于直角三角形。模糊识别的阈值原则：设 A1，A2，……，Al∈F(X)为 l 个标准模型，x0 ∈X, 取定水平 ∈[0,1]。若∨Al(x0)<  ,则判决为不能识别，应查找原因另作分析。若存在 i1,i2,i3,…,ik使得 Aij(x0)≧ ，（j=1, …,k），则判决为：x0 相对地隶属于 Ai1∩Ai2∩Ai3∩…∩ Aik。特别地，当判断 x0 与某一个标准型 Aik 进行识别时，如果 Aik(x0)≧ ，则认为 x0 相对地隶属于 Aik，相反，则认为 x0 相对地不隶属于 Aik。如例 1中取 =0.9，则按照阈值原则，x0 =（A,B,C）=(89,46,45)相对隶属于 I ∩ R ，即相对隶属于等腰直角三角形。四、确定隶属函数的若干方法隶属函数(membership function)，是用于表征模糊集合的数学工具。对于普通集合 A，为了描述论域 U 中任一元素 u 是否属于集合 A，通常可以用 0 或 1 标志。用 0 表示 u 不属于 A，而用 1 表示属于 A ，从而得到了 U 上的一个二值函数 χA（u），它表征了 U 的元素 u 对普通集合的从属关系，通常称为 A 的特征函数，为了描述元素 u 对 U 上的一个模糊集合的隶属关系，由于这种关系的不分明性，它将用从区间[0，1］中所取的数值代替 0，1 这两值来描述，记为（u），数值（u）表示元素隶属于模糊集的程度，论域 U 上的函数 μ 即为模糊集的隶属函数，而（u）即为 u 对的隶属度。下面介绍几种确定隶属函数的方法（模糊统计方法和三分法模糊分布等）： 1、模糊统计方法：模糊统计法是实验方法，有四个要素： A、论域 X B、X 中一个固定的元素 x0 C、X 中一个随机运动的集合 A* D、X 中一个模糊子集 A，它以 A* 作为其弹性疆域，制约着 A* 的运动。A* 的每一次确定，可以看作 A 的一次随机显影模糊性的焦点：A 的每次显影有随机性，A* 可以覆盖 x0 ，也可以不覆盖 x0 ，致使 x0 对 A 的隶属关系是不确定的。模糊统计实验的目的是用确定的手段去研究不确定性。简单模糊实验的基本要求是：在每次实验中，对 x0 是否属于 A* 作出确切判断。这就要求在每次实验中，A* 必须确定。模糊统计实验的特点是在歌词实验中，x0 是固定的，而 A* 在随机变动。作 n 次实验，计算 x0对于 A 的隶属频率= n 1 （x0属于 A 的次数）实践指出，随着 n 的增大，隶属函数的也呈现稳定性，频率稳定值叫做 x0 对 A 的隶属度。 2、三分法三分法也是用随机区间的思想来处理模糊性的实验模型。由于本文主要探讨理论方面的方法，在这里不做深入介绍。 3、模糊分布类似概率统计，根据实际情况，选定某些带参数的函数表示某种类型的模糊概念的隶属函数，然后再通过实验确定参数。常用的分布类型有： A、矩形分布或半矩形分布 B、半梯形分布与梯形分布 C、K 次抛物线分布 D、 型分布 E、正态分布五、贴近度以及择近原则设 A，B 为论域 U 上的两个模糊子集，则定义: (A，B)= 2 1 [A·B+(1 一 A⊙B)]. 则称(A，B)为 A 与 B 的贴近度。其中，A·B=V{uA (u)∧uB(u)∣u∈ U}为两模糊子集的内积。 A⊙B= ∧{uA (u)∨uB(u)∣u∈U} 为两模糊子集的外积。符号“V”=“max”(取极大值)， “∧”=“min” (取极小值)。当然，贴近度还有其他表达方式，本文采用介绍的这种。择近原则：A1，A2，……，Al∈F(X)，A∈F(X)为待识别模型，若 (Ai,A)=∨(Ak,A), k=1,…,l, 则称 A与 Ai最贴近。六、隶属原则设有 l 个模式，每个模式具有 m 个特征，则有 l×m 个表示模式不同特性的模糊集合 Aij(1≦i≦l,1≦j≦m)；待识的样本 B 的 m 个特性模糊集为 Bj(1≦j≦m). 最大隶属原则对于 Ri=∧{(Aij, Bj)∣1≦j≦m }，1≦i≦l 若存在 Ri0=∨Ri, 1≦i≦l, 则称样本 B 最贴近第 io 模式，即 B 属于第 io 类。七、实例应用为研究模糊隶属识别的效果，我们举一个水资源利用效率识别的例子。以下是数据： 2004年自然、社会用水指标省份水资源总量（亿 m3/ 年）年降水量（mm）总人口(万人) 农业万元 GDP用水量（m3/万元）工业万元 GDP 用水量（m3/万元）人均 COD 排放量(kg/ 年) 人均水资源量(m3/ 年) 人均生活用水量 (m3/年) 河北 238.70 521.90 6232.04 1266.85 22.39 10.56 383.02 105.58 湖北 928.06 1134.80 5171.97 996.33 122.16 11.87 1794.40 118.72 湖南 1641.30 1493.60 6398.94 1612.33 436.64 13.28 2564.96 132.83 广东 1188.00 1315.00 7814.29 950.29 321.65 11.86 1520.29 118.63 广西 1604.52 1366.90 4883.00 2348.79 398.44 20.36 3285.93 203.56 云南 2106.30 1239.00 3225.10 1903.67 210.51 6.91 6530.96 69.15 新疆 855.40 166.40 1963.11 1547.12 160.71 13.35 4357.37 133.46 北京 21.35 585.00 1162.90 941.55 58.92 1.15 183.59 111.79 山西 92.47 749.54 3335.10 1185.24 100.54 4.10 277.26 25.50 山东 349.46 769.70 9163.38 860.19 36.40 10.56 381.37 225.90 河南 406.66 797.70 9717.00 479.10 31.58 6.70 418.50 33.70 安徽 500.65 998.00 6460.77 1235.27 364.57 4.69 774.91 35.97 浙江 675.67 1005.00 6460.89 822.53 24.39 8.60 1045.78 49.25 步骤 1、数据的预处理以及选取特征指标首先利用 EXCEL将上表进行处理，处理结果见下表： 2004年自然、社会用水指标省份水资源总量（亿m3/年）年降水量（mm）总人口(万人) 农业万元GDP 用水量（m3/ 万元）工业万元 GDP用水量（m3/万元）人均COD排放量(kg/年) 人均水资源量(m3/年) 人均生活用水量(m3/年) 由于我们考虑的是水资源利用效率，简化数据，得到： 2004年用水指标省份农业万元GDP 用水量（m3/ 万元）工业万元 GDP用水量（m3/万元）人均生活用水量(m3/年) 河北 1266.85 22.39 105.58 湖北 996.33 122.16 118.72 湖南 1612.33 436.64 132.83 广东 950.29 321.65 118.63 河北 238.70 521.90 6232.04 1266.85 22.39 10.56 383.02 105.58 湖北 928.06 1134.80 5171.97 996.33 122.16 11.87 1794.40 118.72 湖南 1641.30 1493.60 6398.94 1612.33 436.64 13.28 2564.96 132.83 广东 1188.00 1315.00 7814.29 950.29 321.65 11.86 1520.29 118.63 广西 1604.52 1366.90 4883.00 2348.79 398.44 20.36 3285.93 203.56 云南 2106.30 1239.00 3225.10 1903.67 210.51 6.91 6530.96 69.15 新疆 855.40 166.40 1963.11 1547.12 160.71 13.35 4357.37 133.46 北京 21.35 585.00 1162.90 941.55 58.92 1.15 183.59 111.79 山西 92.47 749.54 3335.10 1185.24 100.54 4.10 277.26 25.50 山东 349.46 769.70 9163.38 860.19 36.40 10.56 381.37 225.90 河南 406.66 797.70 9717.00 479.10 31.58 6.70 418.50 33.70 安徽 500.65 998.00 6460.77 1235.27 364.57 4.69 774.91 35.97 浙江 675.67 1005.00 6460.89 822.53 24.39 8.60 1045.78 49.25 方差 393296.27 134510.23 6261666.34 233568.83 21910.83 22.90 3405578.93 3607.68 平均值 816.04 934.04 5537.58 1242.25 176.07 9.54 1809.10 104.93 广西 2348.79 398.44 203.56 云南 1903.67 210.51 69.15 新疆 1547.12 160.71 133.46 北京 941.55 58.92 111.79 山西 1185.24 100.54 25.50 山东 860.19 36.40 225.90 河南 479.10 31.58 33.70 安徽 1235.27 364.57 35.97 浙江 822.53 24.39 49.25 方差 233568.83 21910.83 3607.68 平均值 1242.25 176.07 104.93 对简化后的数据进行再处理，得到： 2004 年用水指标省份农业万元 GDP用水量（m3/ 万元）工业万元 GDP用水量（m3/ 万元）人均生活用水量(m3/ 年) 平均值方差河北 1266.85 22.39 105.58 464.94 322683.3 湖北 996.33 122.16 118.72 412.4033 170487.1 湖南 1612.33 436.64 132.83 727.2667 407052 广东 950.29 321.65 118.63 463.5233 125340.4 广西 2348.79 398.44 203.56 983.5967 938206.1 云南 1903.67 210.51 69.15 727.7767 694693 新疆 1547.12 160.71 133.46 613.7633 435701.1 北京 941.55 58.92 111.79 370.7533 163370.3 山西 1185.24 100.54 25.5 437.0933 280800.2 山东 860.19 36.4 225.9 374.1633 124096 河南 479.1 31.58 33.7 181.46 44295.53 安徽 1235.27 364.57 35.97 545.27 256046.3 浙江 822.53 24.39 49.25 298.7233 137289.7 方差 233568.8 21910.83 3607.68 86362.45 1.09E+10 平均值 1242.25 176.07 104.93 507.75 270588.6 步骤 2、确定隶属函数步骤 3、建立模型步骤 4、确定待判样本本文这三步放在一起完成。判决各地水资源利用效率是，要考虑农业万元 GDP 用水量 x1，工业万元 GDP 用水量 x2，人均生活用水量 x3三个因素。将水资源利用效率分为三个类型：利用率高 A1，利用率一般 A2，利用率低 A3 . 据经验，每一类利用率 Ai 对每一单一元素 xi 均服从正态分布 Aij(xj)={ xj ijxijxjijxij ij xijxj 其他0 2)(1      其中 xij 为统计平均值， iij 为方差，它们的值已由上表给出。每给地方的利用效率 x=(x1,x2,x3)对各类型 Ai的隶属度可用公式 Ai（x）=∧ Aij（xj）, j=1,…,3. xij 为统计平均值， iij 为方差，其数据由下表给出： jx1 j1 jx2 j2 jx3 j3 农业万元 GDP用水量 1200 40 800 40 1000 180 工业万元 GDP用水 180 6 120 12 58.92 12 量人均生活用水量 108 54 72 72 111 162 由于数据量太大，本文只介绍方法，故只取一个地方北京为例来进行计算，并识别。步骤 5、模糊识别由 Aij(xj)={ xj ijxijxjijxij ij xijxj 其他0 2)(1      ，得 A11(x1)=0 A12(x2)= A12(x3)= A21(x1)= 0 A22(x2)= A23(x3)= A31(x1)=0.8946 A32(x2) =1 A33(x3) ≈1 隶属度公式 Ai（x）=∧ Aij（xj）, j=1,…,3，因此 A1（x）=0， A2（x）=0 ，A3(x)=0.8946 根据最大隶属原则，判定北京水资源利用率属于第三类，即水资源利用效率低。按照同样的方法就可以得出其他省的水资源利用效率。模糊识别实例应用完毕。八、模糊模式识别的优缺点模式识别有很多种方法，比如统计判别、句法结构等。统计判别的主要方法有几何分类（线性、非线性）和统计分类（Bayes 决策）等；而句法结构是一种语言，用一个文法表示一个类，判定模式遵循的文法。下面列出各种识别方式的优缺点：模糊模式识别优点是由于隶属函数作为样本与模板间相似程度的度量，能够反映整体与主体的特征，即使样本有相当程度的干扰和畸变也不会有太大影响。缺点是很难建立准确合理的隶属函数，应用上有限制。统计判别优点是比较成熟，能考虑干扰等影响并且识别模式基元能力强。缺点是复杂的模式抽取特征困难，难以从整体的角度考虑识别问题。句法结构优点是识别方便，可以有简单的基元开始，有简到繁；能反映模式的结构特征，能描述模式的性质。缺点是当存在干扰或噪声时，抽取特征基元困难，且易失误。结语本文就模糊识别隶属原则进行了介绍，为模式识别提供了一种识别方式。由于笔者接触模糊数学不久，文中仍有许多不妥之处，恳请读者批评指正。参考文献罗晓峰，糊识别的隶属原则及其应用，新疆地质报，1993（1）。罗承忠，模糊集引论，北师大出版社，第 2 版

                    本文档为【模糊模式识别的应用(作者：蒋培杰)】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

模糊模式识别的应用(作者：蒋培杰)

你可能还喜欢