《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 1 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
第六讲 模糊模式识别
一、 模糊
数学
数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划
的基础知识
模糊数学又称为“模糊集理论”,是在康托尔(Georg Cantor)的经典集合理论
基础上发展起来的。
1、 集合及其特征函数
(1)集合
在经典集合理论中,集合可以用来说明概念,它是具有某种共同属性
的事物的全体,即论域 E 中具有性质 P 的元素组成的总体称为集合。例如:
成绩及格={分数|分数≥60}
(2)集合的运算
集合的常用运算包括:交(∩)、并(∪)、补
(3)特征函数
对于论域 E 上的集合 A 和元素 x,如有以下函数:
的特征函数为集合则称
当
当
Ax
Ax
Ax
x
A
A
,0
,1
特征函数表达了元素x对集合A的隶属程度
可以用集合来表达各种概念的精确数学定义和各种事物的性质
2、 模糊集合
(1)概念的模糊性
许多概念具有模糊性,难以用康托尔集合来直接表示,例如:
成绩:好、差
身高:高、矮
年龄:年轻、年老
头发:秃、不秃
(2)隶属度函数
如果一个集合的特征函数μA(x)不是{0,1}二值取值,而是在闭区间[0,1]中
取值,则μA(x)是表示一个对象 x 隶属于集合 A 的程度的函数,称为隶属度函数。
Ax
Axx
Ax
x AA
当
在一定程度上属于当
当
,0
,10
,1
隶属度函数用精确的数学方法描述了概念的模糊性。当采用隶属度函数后,
模糊的概念也可以用集合来表示。例如:
成绩好={分数|μA(分数)=分数/100}
隶属度函数一般来源于统计调查和专家经验总结,常见的形式有:
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 2 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
a) 三角形:
b) 梯形:
c) 高斯形:
d) 柯西形:
μA (x)
0.8
1
0.6
0.4
0.2
c
x
μA (x)
0.8
1
0.6
0.4
0.2
a c d
x
b
μA (x)
0.8
1
0.6
0.4
0.2
a b c
x
xc
cxb
bc
xc
bxa
ab
ax
ax
xA
0
0
)(
xd
dxc
cd
xd
cxb
bxa
ab
ax
ax
xA
0
1
0
)(
))(
2
1
exp()( 2
cx
xA
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 3 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
注意
尽管隶属度和概率都是用一个 0~1 之间的实数来表达,但是二者有本质区
别的。
隶属度表达的是某个命题具有某个概念的程度,这种程度是确定的,不包含
任何的随机性,例如“今天天气热的程度是 0.8”,表达的是一个确切的气温值,
而这个温度值在 0.8 的程度上可以算作“热”。
概率表达的是某个命题具有某个概念的可能性,命题对这个概念的取值仍旧
是二值的,“属于”或者“不属于”,只是是否“属于”具有随机性,例如“今天
天气热的概率是 0.8”,表达的是“热”或者“不热”这两个明确的概念,而“热”
的情形发生的概率为 0.8。
(3)模糊子集
在隶属度函数的基础上,扎德于 1965 年提出了模糊子集的概念,创立了模
糊数学。
扎德 L. A. Zadeh(1921~)
美国控制论专家,美国工程科学院院士。现
任伯克利加利福尼亚大学电机工程与计算机科
学系教授。因发展模糊集理论的先驱性工作而获
电气与电子工程师学会(IEEE)的教育勋章。
1965 年,扎德在《信息与控制》杂志第 8 期
上发表《模糊集》的论文, 开创了以精确数学方
法研究模糊概念的模糊数学领域。
定义:
设集合 A 是集合 U 的一个子集,如对于任意 U 中的元素 x,用隶属度函数
μA(x)来表示 x 对 A 的隶属程度,则称 A 是 U 的一个模糊子集,记为:
μA (x)
0.8
1
0.6
0.4
0.2
c
x
b
A
a
cx
x
)(1
1
)(
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 4 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
A={μA(xi), xi}
模糊子集也可以看作是论域 U 到区间[0,1]上的一个映射,映射
规则
编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf
为μA(x)。
当 U 为离散集时,模糊子集可以用下式表示:
xx
iiA
nnAAA
i
xxA
xxxxxxA
~
~
或
2211
x1,x2,…,xn 称为模糊子集 A 的支持点。
当 U 为连续域时,模糊子集可以表示为: x A xxA ~
模糊数学不是把精确的概念模糊化,而是把模糊的概念精确化、定量化,从
而可以用严格的运算方式和严密的逻辑体系来进行处理。
(4)模糊集合的基本运算
交集: )(),()( xxminxBAC BAC
并集: )(),()( xxmaxxBAC BAC
补集: )(1)( xxA AA
3、模糊集合的α水平截集
定义:
水平截集的称为模糊子集
,的模糊子集,则对任意为设
AxxA
xUA
A })({
]1,0[}{
模糊子集本身没有确定边界,其水平截集有确定边界,并且不再是模糊集合,
而是一个确定集合。因此,水平截集在模糊集合和确定集合之间建立了桥梁,对
于模糊概念的去模糊化有重要的意义。
例:
年龄的取值域为:
U={50 岁,45 岁, 40 岁 ,35 岁,30 岁, 25 岁}
模糊集“年青”可表示为:
A=0/ 50 岁+0.1 / 45 岁 + 0.3/40 岁 + 0.5/ 35 岁 + 0.9/ 30 岁 +1/ 25 岁
A 的不同的水平截集为:
α =0 , A0 ={50 岁,45 岁, 40 岁 ,35 岁,30 岁, 25 岁}
α =0.1, A0.1 ={45 岁, 40 岁 ,35 岁,30 岁, 25 岁}
α =0.2, A0.2 ={40 岁 ,35 岁,30 岁, 25 岁}
α =0.3, A0.3 ={40 岁 ,35 岁,30 岁, 25 岁}
α =0.5, A0.5 ={35 岁,30 岁, 25 岁}
α =0.7, A0.7 ={30 岁, 25 岁}
α =0.9, A0.9 ={30 岁, 25 岁}
α =1 , A1 ={25 岁}
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 5 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
4、模糊关系及模糊矩阵
(1)集合的笛卡儿乘积
设 U={x},V={y}为两个集合,则它们的笛卡儿乘积集为:
U×V={(x,y)|x∈U,y∈V},
(x,y)是 U,V 元素间的有序对。
因此笛卡尔乘积中的元素(x,y)是一种无约束有顺序的组合,包含所有可能的
组合形式。笛卡尔乘积的运算不满足交换律,除 U、V 相等的情况以外。
U={x},U×U={(xi,xj)| xi,xj∈U}
(2)关系及其表示
设 U={x},V={y}为两个集合, R 为笛卡尔乘积 U×V 的一个子集,则称其
为 U×V 中的一个关系。
关系 R 代表了对笛卡尔乘积集合中元素的一种选择约束,只有满足一定条
件的元素对(x,y)才是关系 R 的元素,这个条件就是 x 和 y 之间的某种“关系”。
关系可以有多种表示方法:
集合表示法:R={(x1,y2),(x2,y1),(x3,y3)}
描述表示法:R={(x,y)| x>y}
图形表示法:
矩阵表示法:
对有限集合上的关系,可以用矩阵表示:
1010
0101
1010
0101
1001
1011
1010
0101
4
3
2
1
4
3
2
1
43214321
x
x
x
x
y
y
y
y
xxxxxxxx
RXXRYX 上的关系上的关系
例:
U={张三,李四,王五},V={数学,英语,政治}
则关系 R(选课)可表示为:
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 6 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
110
011
101
政治
英语
数学
王五李四张三
(3)模糊关系
如关系 R 是 U×V 的一个模糊子集,则称 R 为 U×V 的一个模糊关系,其
隶属度函数为μR(x,y) ,表示 x,y 具有关系 R 的程度。
),),),),
),),),),
),),),),
),),),),
44434241
34333231
24232221
14131211
4
3
2
1
4321
yxyxyxyx
yxyxyxyx
yxyxyxyx
yxyxyxyx
y
y
y
y
xxxx
RYX
((((
((((
((((
((((
上的模糊关系
RRRR
RRRR
RRRR
RRRR
模糊关系的矩阵称为模糊矩阵。
例:
如 x 为身高, y 为体重,各自取值域为:
x=(1.4,1.5,1.6,1.7,1.8)(单位 m)
y = (40,50,60,70,80) (单位 kg)
模糊关系“合乎
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
”表示为:
40 50 60 70 80
1.4 1 0.8 0.2 0 0
1.5 0.8 1 0.8 0.2 0
1.6 0.2 0.8 1 0.8 0.2
1.7 0 0.2 0.8 1 0.8
1.8 0 0 0.2 0.8 1
记为模糊矩阵为:
18.02.000
8.018.02.00
2.08.018.02.0
02.08.018.0
002.08.01
R
例:
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
集 X 中各样本之间的相似关系可表示为:
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 7 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
11.09.08.0
1.013.02.0
9.03.016.0
8.02.06.01
4
3
2
1
4321
x
x
x
x
xxxx
此时,模糊矩阵中的元素表达了两个样本之间的相似程度。
两个模糊关系可以进行合成运算,算法定义为:
))()((),(, xxyxBAC
kjikij bac
;
符号“”表示在两个隶属度值中取最小值,符号“”表示在所有隶属度
值中取最大值。
例:
模糊矩阵 A、B 为:
18.011.0
1.012.03.0
3.01.07.04.0
2.02.010
,
9.0103.0
1.003.01.0
9.07.05.06.0
8.02.001
4
3
2
1
4
3
2
1
43214321
y
y
y
y
B
y
y
y
y
A
xxxxxxxx
则 BAC 中,
2.0]1.0,2.0,0,0[)]1.08.0(),3.02.0(),4.00(),01[(),(
11
yxc
1]8.0,2.0,0,1[)]18.0(),2.02.0(),7.00(),11[(),(
12
yxc
8.0]8.0,2.0,0,2.0[)]8.08.0(),12.0(),1.00(),2.01[(),(
13
yxc
8.0]8.0,1.0,0,2.0[)]18.0(),1.02.0(),3.00(),2.01[(),(
14
yxc
4.0]1.0,3.0,4.0,0[)]1.09.0(),3.07.0(),4.05.0(),06.0[(),(
21
yxc
9.0]9.0,2.0,5.0,6.0[)]19.0(),2.07.0(),7.05.0(),16.0[(),(
22
yxc
8.0]8.0,7.0,1.0,2.0[)]8.09.0(),17.0(),1.05.0(),2.06.0[(),(
23
yxc
9.0]9.0,1.0,3.0,2.0[)]19.0(),1.07.0(),3.05.0(),2.06.0[(),(
24
yxc
3.0]1.0,0,3.0,0[)]1.01.0(),3.00(),4.03.0(),01.0[(),(
31
yxc
3.0]1.0,0,3.0,1.0[)]11.0(),2.00(),7.03.0(),11.0[(),(
32
yxc
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 8 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
1.0]1.0,0,1.0,1.0[)]8.01.0(),10(),1.03.0(),2.01.0[(),(
33
yxc
3.0]1.0,0,3.0,1.0[)]11.0(),1.00(),3.03.0(),2.01.0[(),(
34
yxc
3.0]1.0,3.0,0,0[)]1.09.0(),3.01(),4.00(),03.0[(),(
41
yxc
9.0]9.0,2.0,0,3.0[)]19.0(),2.01(),7.00(),13.0[(),(
42
yxc
1]8.0,1,0,2.0[)]8.09.0(),11(),1.00(),2.03.0[(),(
43
yxc
9.0]9.0,1.0,0,2.0[)]19.0(),1.01(),3.00(),2.03.0[(),(
44
yxc
9.019.03.0
3.01.03.03.0
9.08.09.04.0
8.08.012.0
4
3
2
1
4321
y
y
y
y
BAC
xxxx
二、 模糊模式识别方法
1、最大隶属度识别法
直接使用隶属度函数来进行模式识别称为最大隶属度识别法,它有两种形
式。
(1)形式一
设 A1, A2,…. ,An 是 U 中的 n 个模糊子集, 且对每一 Ai均有隶属度函数μ
i(x) ,x0 为 U 中的任一元素,若有隶属度函数
μi(xo) =max[μ1(xo), μ2(xo),….. μn(xo)]
则 xo∈Ai
该方法直接把隶属度函数μ (x)作为判别函数使用,U 中的每一个元素,代
表了样本的一种取值情况,而 Ai 代表了不同的类别。能否获得准确的隶属度函
数,是此方法的关键。
例:
在利用 BMI 指数进行体型判断的问题中,
BMI=体重(kg)/身高 2(m)
可以对三种体型用模糊子集进行定义:
“偏瘦”=0.9/ 15+0.5 / 18 + 0.3/21 + 0.1/24 + 0/27+ 0/30
“标准”=0.4/ 15+0.7 / 18 + 1/21 +0.8/24 + 0.2/27+ 0.1/30
“偏胖”=0/ 15+0.1 / 18 + 0.4/21 + 0.6/24 + 0.8/27+ 1/30
如果某人的 BMI 指标为 24,则根据最大隶属度原则,可分到“标准”这一
类。
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 9 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
(2)形式二
设 A 是 U 中的 1 个模糊子集, x1~xn 为 U 中的 n 个元素,若 A 的隶属度
函数中,
μ(xk) =max[μ(x1), μ(x2),….. μ(xn)]
则 A 属于 xk 对应的类别
在该方法中,U 中的每一个元素对应了一个类别,A 代表一个待识别的样本,
其隶属度函数代表了这个样本属于不同类别的程度。此法不仅能得到样本的分类
结果,还可以得到样本与各个类间的相似程度排序。
例:
设 U 为 5 种空中飞行目标的集合
U={直升飞机,大型飞机,战斗机,飞鸟,气球} ,
根据对一个飞行物体的运动特征检测,得到其模糊子集表达为:
A=0.7/直升飞机+0.3 / 大型飞机 + 0.1/ 战斗机 + 0.4/ 飞鸟 + 0.8/ 气球
根据最大隶属度原则,可判断该飞行物体为“气球”。
2、择近原则识别法
(1)贴近度
贴近度是两个模糊子集间互相靠近的程度,理想的贴近度应当具有以下这些
性质:
;1),( AA
;0),(),( ABBA
),(),(
)()()()()()(
CBCA
xxxxxxUx CBACBA
则有
或有若对任意
满足以上性质的贴近度定义很多,例如可定义贴近度:
Ux
BA
Ux
BA
xx
xx
BA
)()(
)()(
),(
(2)择近原则识别法
设 U 上有 n 个模糊子集 A1, A2,…. ,An 及另一模糊子集 B。若贴近度
.
),(max),(
1
类此时可判决
最贴近。与则称,=
i
ij
nj
i
AB
ABABAB
该方法称为择近原则识别法。
在这一方法中,样本和类都用模糊子集来表示,取值范围 U 中的每个元素
代表了一个特征维度,而隶属度函数值表达了样本或类在某一个特征维度上具有
某种特定取值的程度,可以用特征值对“标准值”的偏差来计算得到。
例:
某气象台对于当日气象条件的晨练指数预报分为三级,是用模糊集的方式,
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 10 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
依据气温、风力、污染程度三个指标来表达的,具体隶属度关系见下表:
晨练指数级别
对“标准气温”的
隶属度
对“标准风力”的
隶属度
对“有污染”的
隶属度
适宜晨练 0.7 0.9 0.2
可以晨练 0.5 0.6 0.6
不适宜晨练 0.4 0.5 0.8
某天的气象条件用模糊集合来表达为:
B=0.8/标准气温+0.7/标准风力+0.5/有污染
请问:该天的晨练指数应该预报为哪一级?
解:
用 a 来代表“标准气温”,b 代表“标准风力”,c 代表“有污染”
则该天的气象条件可表示为:B=0.8/a+0.7/b+0.5/c
用 A1 表示“适宜晨练”,A2 表示“可以晨练”,A3 表示“不适宜晨练”
则各晨练指数级别可表示为:
A1=0.7/a+0.9/b+0.2/c
A2=0.5/a+0.6/b+0.6/c
A3=0.4/a+0.5/b+0.8/c
分别求 B 和 A1、A2、A3 的贴近度
73.0
5.09.08.0
2.07.07.0
)5.02.0()7.09.0()8.07.0(
)5.02.0()7.09.0()8.07.0(
),( 1
BA
76.0
6.07.08.0
5.06.05.0
)5.06.0()7.06.0()8.05.0(
)5.06.0()7.06.0()8.05.0(
),( 2
BA
61.0
8.07.08.0
5.05.04.0
)5.08.0()7.05.0()8.04.0(
)5.08.0()7.05.0()8.04.0(
),( 3
BA
∵B 和 A2 的贴近度最大,根据择近识别原则,B∈A2
∴该天的晨练指数应该预报为“可以晨练”。
3、基于模糊等价关系的聚类方法
(1)等价关系
等价关系是一个集合内元素之间的特殊关系,它定义了“等价”的概念。
设 R 是 U={x}上一个关系,若满足:
(a)自反性: (x,x) ∈R
(b)对称性: 若(xi,xj) ∈R,则有(xj,xi) ∈R
(c)传递性:若(xi,xj) ∈R 和(xj,xk) ∈R ,则有(xi,xk) ∈R
则称 R 是 U 上一个等价关系。
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 11 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
当 U 上存在一个等价关系 R 时,并不是 U 中所有元素都是等价的,而是 U
中的元素可以按等价关系分成若干类。因此,等价关系事实上是对一个样本集的
类别划分。
(2)模糊等价关系
若 R 是 U={x}上一个模糊关系,若满足:
(a)自反性: μR(x,x) =1
(b)对称性: μR (xi,xj)=μR (xj,xi)
(c)传递性:
对于任意 xj ∈U,有μR (xi,xk) ≥∨ (μR (xi,xj) ∧ μR (xj,xk))
则称 R 是 U 上一个模糊等价关系。
在进行传递性计算时,采用的是模糊矩阵的合成运算算法。由此可得出一个
重要结论:模糊等价关系具有传递闭包性,即 RRR 。
不具有传递性的模糊关系称为模糊相似关系,反复进行合成运算,求 R2,
R4,R8……,可将一个模糊相似关系逼近为一个模糊等价关系。
模糊等价关系表达了一个集合中各个元素之间等价的程度,因此可以用它来
作为样本集相似度的度量指标,实现对样本集的类别划分。
(3)基于模糊等价关系的聚类
对于模糊等价关系,有如下等价关系定理:
若 R 是 U 上的一个模糊等价关系,则对任意阈值α(0≤ α ≤1)的水平截集
Rα是 U 上的一个等价关系。
利用等价关系定理,已知样本集 X 上的模糊等价关系 R,则可通过 R 的不同
α水平截集得到多种等价类划分,也就实现了样本集在不同隶属度要求下的层次
聚类。
例:
设待聚类的样本集为 X= {x1,x2,x3,x4,x5 },有一个模糊等价关系 R 为:
5
4
3
2
1
54321
16.05.04.05.0
6.015.04.05.0
5.05.014.08.0
4.04.04.014.0
5.05.08.04.01
x
x
x
x
x
R
xxxxx
取α=0.4,得到水平截集为:
11111
11111
11111
11111
11111
4.0R ,此时所有样本等价,属于一类;
取α=0.5,得到水平截集为:
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 12 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
11101
11101
11101
00010
11101
5.0R ,此时样本聚成两类,{x1,x3,x4, x5 }和{x2}
取α=0.6,得到水平截集为:
11000
11000
00101
00010
00101
6.0R ,此时样本聚成三类,{x1,x3}、{x4, x5 }和{x2}
取α=0.8,得到水平截集为:
10000
01000
00101
00010
00101
8.0R ,此时样本聚成四类,{x1,x3}、{x4}、{x5 }和{x2}
取α=1,得到水平截集为:
10000
01000
00100
00010
00001
1R ,此时样本聚成五类,每个样本自成一类
α x1 x2 x3 x4 x5
1
8.0
6.0
5.0
4.0
0
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 13 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
4、模糊 k-均值聚类
在 k-均值聚类算法中,每一次迭代的聚类结果可以用 k 行 n 列的矩阵 U 来
表示:
n
kU
0010
1100
0001
其中 n 表示整个样本集中的样本个数,k 表示类别数,uij的值表示第 j 个样
本是否属于第 i 类,属于则 uij=1,否则 uij=0。
k-均值聚类算法的准则函数是误差平方和,即
k
i
n
j
ijijk mxuJ
1 1
2
k-均值聚类算法的聚类目标是使得准则函数能取得最小值。
模糊 k-均值聚类(FCM,Fussy C-Means)最早由 Dunn 提出,后由 Bezkek
于 1981 年进行了扩展和总结,它推广了精确 k-均值聚类(硬聚类,HCM)算法,
引入模糊集作为分类结果,得到了非常广泛的应用。
如果采用模糊集合的概念,在每次迭代中某个样本不是确定地属于某一个
类,而是在不同程度上属于不同的类。此时每个类别均是一个模糊子集,而分类
矩阵 U 可以表示为:
n
knkkk
n
n
uuuu
uuuu
uuuu
kU
321
2232221
1131211
其中:
uij∈[0,1],是第 j 个样本对第 i 类的隶属度;
k
i
iju
1
1,表示每个样本属于各类的隶属度之和为 1;
n
j
iju
1
1,表示每个类别都不为空集。
模糊 k-均值聚类算法采用类似的误差平方和准则函数,但加入了模糊度的控
制权重 m∈[1,∞):
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 14 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
k
i
n
j
ij
m
ijm mxuJ
1 1
2
算法的迭代过程,就是使准则函数 Jm能逐步逼近其极值。
Jm是一个有约束的准则函数,其约束条件为
k
i
iju
1
1和
n
j
iju
1
1。运用拉格
朗日乘数法,可化为无约束的准则函数:
n
j
k
i
ijj
k
i
n
j
ij
m
ij umxuF
1 11 1
2
)1(
上式取极值的必要条件是:
0)1(
0
1
21
k
i
ijj
jij
m
ijij
uF
mxmuuF
可解得:
1
1
1
2
k
l
m
lj
ij
ij
mx
mx
u
对于新的聚类中心,也应当使准则函数取得极值,即:
0 im mJ
可解得:
n
j
m
ij
n
j
j
m
ij
i
u
xu
tm
1
1)(
模糊 k-均值聚类的算法
流程
快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计
为:
(1) 设定类别数 k、模糊度控制权重 m 和误差限值ε,随机产生初始分类
矩阵 U(0),迭代次数 t=0;计算各类的初始聚类中心 mi(0):
n
j
m
ij
n
j
j
m
ij
i
u
xu
m
1
1)0(
(2) 按照以下规则计算新的分类矩阵 U(t+1) ,获得新的模糊聚类结果:
《模式识别》讲义 2011 版:第六讲 模糊模式识别
第 15 页
自动化学院 模式识别与智能系统研究所
高琪 gaoqi@bit.edu.cn
1
1
1
2
)(
)(
)1(
k
l
m
lj
ij
ij
tmx
tmx
tu
(3) 计算新的聚类中心 mi(t+1):
n
j
m
ij
n
j
j
m
ij
i
tu
xtu
tm
1
1
)1(
)1(
)1(
(4) 计算分类误差
k
i
ii tmtmE
1
)()1( ,若 E<ε,则结束迭代;否则
t=t+1,返回步骤(2)进行下一次聚类迭代。
模糊 k-均值聚类最终得到的是一个模糊分类矩阵,如需要得到确定的聚类结
果,就要进行去模糊化。可以采用最大隶属度原则将一个样本分配到隶属度最大
的类别中去。
在模糊 k-均值聚类算法中,模糊度控制权重 m 表达了对于每次聚类结果的
模糊程度的要求, miju 的物理意义是隶属度的语义增强(“非常”的概念)。m 的
取值对聚类结果的影响有许多研究,目前尚无定论。通常取 1.5~2.5 之间比较有
效,常取 m=2;当 m=1 时 FCM 也就退化成了 HCM。