第十二章 模糊模式识别方法(简介)
§12.1 引言
L.A. Zadeh, Fuzzy sets, Intormation & Control, v.8, pp.338-353 1965
确定集合(脆集合):元素或者属于或者不属于集合
模糊集合: 元素以一定的程序属于某集合,
适于表在自然语言变量和常识性知识
几种叫法:模糊集、模糊逻辑、模糊
数学
数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划
、模糊系统、模糊技术、模糊方法
与其它技术相结合:模糊神经网络、模糊控制、模糊模式识别
§12.2 模糊集的基本知识
隶属度函数 )(xAµ : x属于集合 A的程度
自变量:所有可能属于 A的对象,空间 { }xX = 。
值域:[0,1], 1)(0 ≤≤ xAµ
1)( =xAµ ⇔ Ax∈
0)( =xAµ ⇔ Ax∉
模糊集合:一个定义在 { }xX = 上的隶属度函数就定义了一个模糊集合 A,
或称定义在空间 { }xX = 上的模糊子集,表示为:
( ){ }iiA xxA ),(µ=
或 ii
i
xA /µU=
模糊集 A的支持集 { }0)(,,)( >∈= xXxxAS Aµ
例:“开水”概念的表达
常见单变量隶属度函数形式:
模糊集的运算:
并: BAC U=
{ })(),(max)( xxx BAc µµµ =
交: BAC I=
{ })(),(max)( xxx BAc µµµ =
补: AC ′=
)(1)( xx Ac µµ −=
xzhang
xzhang
多变量隶属度函数:可定义为多个单变量隶属度函数的张量积。
[ ]TdxxxX ,,, 21 L= , iA 为对应 ix 的模糊集
)()()()( 21 21 dAAAA xxxx dµµµµ L⋅=
模糊推理:基于模糊集运算和模糊规则的推理。
§12.3 模糊特征和模糊分类
12.3.1 模糊化特征
基本思想:根据一定的模糊化规则
把原来的一个(或几个)特征变量分成多个模糊变量,
使每个模糊特征表达某一局部特性,
利用这些新特征来进行模式识别。
例:
原特征:体重
新特征:“偏轻”、
“中等”、
“偏重”
“1-of-N”编码,常用于 FNN 中
目的:
更好地反映问题的本质。
原来的非线性问题可能变成线性问题。
有效利用了人的知识。
12.3.2 结果的模糊化
使分类器输出不是硬分类,而是给出属于各类的程度。
优点:1. 更好表达分类结果中的不确定性因素,利于根据结果进行决策。
2. 利于后期进一步处理和
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
。
结果模糊化的方法:结合知识和所用分类器确定。
如:依据样本离类别中心的距离,离分类面的距离,
与已知样本或类别中心之间相似性度量,
神经网络输出值的大小
等等。
§12.4 特征的模糊评价
12.4.1 模糊程度的度量
模糊度、熵、π 度,用于考查一个模糊集的模糊程度
12.4.2 特征的模糊评价
基本思想:
根据各类已知样本对各个特征定义某种隶属度函数,构造相应的模糊
集,用它们的模糊程度定义某种评价指标,用来考查特征的分类性能。
§12.5 模糊聚类方法
12.5.1 模糊 C 均值方法(FCM)
C 均值方法:
把 n个样本划分到C个类中,使各样本与其所在类的均值的误差平方和
2
1
i
y
c
i
e myJ
i
−= ∑∑
∈= Γ
最小。
把硬分类变成模糊分类,即得模糊C均值方法。
符号约定: 样本集 { }nii ,,2,1, L=x
聚类中心 jm , cj ,,2,1 L=
)( ij xµ :第 i个样本对于第 j类的隶各度函数。
聚类损失函数
[ ] 2
11
)( ji
b
ij
n
i
c
j
fJ mxx −= ∑∑
==
µ
其中, 1>b 可控制聚类结果的模糊程度。
模糊聚类: fJmin
对不同的隶属度定义,就得到不同的模糊聚类方法。
模糊C均值,要求 1)(
1
=∑
=
ij
c
j
xµ , ni ,,1L=
求解:令 0=∂∂ jfJ m 和 0)( =∂∂ ijfJ xµ ,可得
[ ]
[ ]bijn
i
i
b
ij
n
i
j
)(
)(
1
1
x
xx
m
µ
µ
∑
∑
=
== , cj ,,1L=
( )
( ) )1/(12
1
)1/(12
1
1
)( −
=
−
−
−=
∑ bkic
k
b
ji
ij
mx
mx
xµ , cj ,,1L= , ni ,,1L=
模糊C均值算法:
(0)设定聚类数目 c和常数b
(1)初始化各聚类中心 jm , cj ,,1L= (可参考第十章方法)
(2)重复下面的运算,直到各 )( ij xµ 稳定:
2.1 用当前的 jm 计算 )( ij xµ
2.2 用当前的 )( ij xµ 计算 jm
(3)如需要,可对所有模糊聚类去模糊化
12.5.2 改进的模糊 C 均值算法(AFC)
模糊C均值算法的一个缺点:
由于 1)(
1
=∑
=
ij
c
j
xµ ,故对某些野值(本应属于各类的程度都很小),
隶属度可能较大,如:
改进:放松归一化条件为:
nij
n
i
c
j
=∑∑
==
)(
11
xµ
于是
[ ]
[ ]bijn
i
i
b
ij
n
i
j
)(
)(
1
1
x
xx
m
µ
µ
∑
∑
=
== , cj ,,1L= (不变)
( )
( ) )1/(12
11
)1/(12
1
1
)( −
==
−
−
−=
∑∑ bkln
l
c
k
b
ji
ij
n
mx
mx
xµ , cj ,,1L= , ni ,,1L=
算法步骤与模糊C均值相同。
注意:
AFC 所得的 )( ij xµ 可能大于 1,不是严格意义下的隶属度函数。
必要时可做归一化。
特点:
AFC 有更好的鲁棒,且对给定的聚类数目不十分敏感。
但有时可能会出现一个类中只包含一个样本的情况,可通过在距离
计算中引入非线性,使之不会小于革值来改进。
AFC、FCM 与 C 均值一样,依赖于初值。
实验效果举例
例一:类别重迭及类别不明显情况
+:C 圴值
×:FCM
O:AFC
例二:给定类别数与实际类别数不一致的情况
§12.6 模糊 k近邻分类器
k近邻的一个问题:
当样本较稀疏时,只考虑样本近邻顺序而不考虑距离远近是不适当的。
模糊 k近邻:
在得到 x的 k个近邻{ }kii ,,1, L=x 后,用隶属度函数计算 x属于各类
的程度:
[ ]
[ ])1/(2
1
)1/(2
1
1
1)(
)(
−
=
−
=
−
−
=
∑
∑
b
i
n
l
b
iij
k
i
ij
xx
xxx
x
µ
µ , cj ,,1L=
其中, )( ij xµ 是 ix 属于第 j类的隶属度值。如已知样本确定性分类的,则
取 0 或 1。b的作用于模糊 C 均值中类似。