基于模糊积分的Fisher判别分析
高校应用数学学报
2009,24(3):348—352
基于模糊积分的Fisher判别分析
纪爱兵,一,邱红洁.,哈明虎.
(1.南京航空航天大学信息科学与技术学院,江苏南京210016
2.河北大学医学部,河北保定071000;
3.河北大学数学与计算机学院,河北保定071000)
摘要:文中引进一种新的非线性判别分析一基于Choquet模糊积分~Fishers1别分
析,该基于Choquet模糊积分的Fishersl别分析
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
可充分考虑到输入的各指标之间
的交互作用,当模糊测度具有可加性时,基于Choquet模糊积分的Fishers0别分析方
法就是经典的Fisher判别分析.最后将此方法应用于心肌梗死的鉴别诊断.
关键词:A-模糊测度;Choquet模糊积分;FisherS’]~4分析;非线性判别分析
中图分类号:TP18
文献标识码:A文章编号:1000—4424(2009)03—0348—05
?1引言
判别分析是根据某些准则建立判别式,再根据某一未知类型对象的各种指标的测定结果进
行判别分类,判别分析是一种重要的分类方法.判别分析内容丰富,方法很多,判别分析按判
别的类数来区分,有两类判别分析和多类判别分析;按各个指标之间是否相互独立来分,有线
性判别分析[】和非线性判别分析;判别分析按不同度量的角度划分,有距离判别法,Fisher判
别法,Bayes判别法和逐步判别法.其中用的最广,效果最好的判别方法为Fisher判别分析,但
经典Fisher~0别分析更多地用于各指标之间是相互独立的情况,其判别函数是线性判别函数.
分类问题的各个指标之间往往具有交互作用,而不是相互独立的,则其判别 但在实际应用中,
函数是非线性判别函数,对这种情况f21给出了一种非线性判别分析方法一核Fisher判别分析方
法,但核Fisher判别分析计算复杂且核函数选择理论仍欠完善.经典Fisher~分析的判别式是
线性的,它适用于各个指标之间相互独立,没有任何交互作用,从而可简单地加权求和,它对
应Lebesgue积分;而在实际分类问题中,各个指标之问往往具有交互作用,为此,我们研究一种
新的基于Choquet模糊积分的Fisher判别分析方法,该基于Choquet模糊积分的Fisher判别分析
方法可以充分考虑各指标之问的交互作用.用Choquet模糊积分作为算子的Fisher]1]~1]分析方
法,当模糊测度具有可加性时,就是经典的Fisher判别分析.
收稿日期:2008—09—29
基金项目:国家自然科学基金(60773O62);河北大学医学部科研基金(2007jy01)
纪爱兵等:基于模糊积分的Fisher判别分析349
本文首先给出预备知识,然后给出基于Choquet模糊积分算子的Fisher判别分析方法,最后
将此方法应用于心肌梗死的鉴别诊断.
?2预备知识
模糊测度是对经典测度的推广,用单调性替换了经典测度的可加性,因此模糊测度又称为
非可加测度.
定义1131设为非空集合,F为由的子集构成的一代数,集函数:F—f一..,+..)如果
满足it(o)=0,则称为定义在F上的广义模糊测度.
定义2设为非空集合,F为由的子集构成的一代数,集函数:F一(0,+?)如果满足
1)it(o)=0,2)若E?F’A?F’EcA,~,Jit(E)it(A),
则称为定义在F上的模糊测度.
由模糊测度的定义可以看出,模糊测度只要求单调性,不要求可加性,模糊测度非可加性体
现为次可加~it(AuB)<it(A)+it(B)和超可加~it(AuB)>it(A)+it(B),AnB=.
当模糊测度满足it(x)=1时,称为正则模糊测度.当为有限集合时,我们通常取的幂集
作为模糊测度定义中的一代数F,在基于Choquet模糊积分的Fisher判别分析的研究中,通常把
判别分析的输入空间作为模糊测度定义中的集合,是有限集合上的模糊测度.因此,下面主
要介绍一些有限集合上的模糊测度和模糊积分的概念和性质,
模糊测度有多种具有特殊构造的模糊测度类型,比如可能性测度,必要性测度,信任测
度,一模糊测度等等,我们主要介绍一下一模糊测度.
定义3模糊测度如果满足:存在常数,>-1,使得it(AuB)=it(A)+it(B)+
Ait(A)it(B),其中A?F,B?F,AnB=,则称为一模糊测度.
模糊测度有下面两个重要的性质:
性质1【]为定义在上的A一模糊测度,1,,…,E为F中互不相交的m个集合,则
f,I二I,1\:1/
(-1
?m(
L{=
?0
=0
A一模糊测度在单点集上的值称为模糊密度.由性质1司知,要确定一模糊测厦,只需知道
模糊密度就可以了,此时,对于的任意子集E,
f去{n【1+Ait({)]一1),>,1,?0,E’1?xiE(E)
,:0.
zEE
下面介绍用于Fisher判别分析的算子--Choquet模糊积分.
定义4[.】设.厂为定义在上的实值函数,F为由的子集构成的一代数(有限时,F为的
幂集),为定义在F上的广义模糊测度,则函数’厂在集合上关于模糊测度it~JChoquet模糊积分
定义为:
(c)/=F0(酬肌,(1)
350高校应用数学学报第24卷第3期
其中F0={xlf(x)a,?),a?[0,?】,/#(Fa)da表示黎曼积分.
t,0
,,rr..
当,为上的非负函数时,(c)/fd#=/#(Fa)da.
Choquet模糊积分一般是非线性的,它是勒贝格积分的推广,当模糊测度满足一可加性,即
模糊测度是经典测度时,Choquet模糊积分和勒贝格积分是一致的.
当为有限集合时,把X=x1,X2,…,)中的元素进行重排,记为{:,X2,…,),使
得0?’厂(),()…,(),~lJChoquet模糊积分有下面的简化计算公式
c)/fd#=?[,()一,(1)】(,Xiq---,)),(2)i=1
其中,()=0.
53基于Choquet模糊积分的两类Fisher判别分析
设有?个样本,每个样本包含p项观测指标(变量),而?个样本又分别属于两个总体G1,G2
从第一个总体中抽取n1个样本,从第二个总体中抽取n2个样本,n1+礼2=N,其数据列表如下
G1总体G2总体
这里=xl,X2,…,p),为建立在幂集上的模糊测度,(i)表示在判别分析中
的”重要性”程度.对任何ECX,(E)表示指标组合E在判别分析中的”重要性”程度.假设
新建立的判别式为:=(c)/,()d,其中’厂()是定义在上的函数,,((t)=,(=
1,2,…,p;J=1,2,…,nk;k=1,2),将属于不同总体的样本观测值代入判别式,则得:
)=(c)/,(()d,(=1,2,…,仃1),=(c)/.厂(.(z)d,(=1,2,…,礼2),
1n2
=
1?=1?
为了使判别函数能够很好地区别来自不同总体的样品,自然希望:
i)来自不同总体的两个平均值y0),(2)相差愈大愈好;
ii)对于来自同一个总体的’(:1,…,礼1)要求它们的离差平方和(?一).愈小愈
=1
好,同样也要求?(一()).愈小愈好.
=
1
综合以上两点,就是要求
I=(一)/[?(?一)+?(一).]
:1t=1
愈大愈好.
纪爱兵等:基于模糊积分的FisherZY,]别分析351
则以上基于Choquet模糊积分的Fisher两类判别分析问题就是求解以下非线性规划问题:
?蕊,
su
<
bjectt
<1j(
o:
0i:12一,p),(3)
<(i)1,(=,,…,p),,
入>一1.
1+=兀(1+?(t)).
通过求解以上非线性规划可以求得:(t)和,从而可以计算出(E),EcX.则可以得到基
于Choquet模糊积分的两类Fisher判别分析的判别函数式:
Y=(c)/.厂()d.(4)
有了判别函数之后,建立判别准则还要确定判别临界值(分界点)0,一般取Yo为(1)与(2)
的加权平均值,即
nly()+n2y(21
.一——一’L.
如果由原始数据求得yO),(,满足(1)>(,建立判别准则为:对一个新样品=
(1,X2,…,),代入判别函数所得值记为,若Y>Yo,则判定X?G1;若<yo,则判定X?G2.
如果()<(,则建立判别准则为:若Y>Yo,则判定X?G2;若Y<0,则判定X?G1.
以上基于Choquet模糊积分的两类Fisher判别分析可广泛应用于临床决策,管理决策等领
域.
应用举例:有健康人10名,心肌梗死患者6名,这16人的心电图用三项指标1,,描述,
数据如表1.
表116名健康人或心肌梗死患者心电图数据
类别例号XzX2X3
1436,749.59232
2290.6730.022.46
3352.5336.232.36
健康人4340.9138.282.46
5332.8341.922.24
6319.9231.422.48
7361.3137.992.09
8366.539.872.42
9292.5626.O72.12
lO276.8416.62.96
11510.4767.641.73
心肌12510.4162.712.58
梗死13470.354.41.68
患者14364.1246.26209
15416.0745.871.9
16515784.591.75
利用以上基:J=Choquet模糊积分的两类Fisher~0别分析的方法,求解非线性规划(3)可
得(1)=0.2519654,(2)=0.2114523,(3)=0,=2.25522,则可得基~:Choquet模糊积
分的两类Fisher判别分析的判别函数式:
=
(c)-/t厂()d,上.
352高校应用数学学报第24卷第3期
利用式(5),求得判别临界值Y0=116.745.利用以上的判别式和临界值对表1中的数据进行
回顾性检验,检验结果如表2.
表2回顾性检验结果
由以上结果显示,对心肌梗死患者无一例错判;对健康人,只有一例错判.可能原因是:任何
疾病的发展都是渐进的,对于处于中界状态的患者,很难做出判别,也说明该患者有发生心肌梗
死的倾向.
进一步,我们可以给出基于Choquet模糊积分的多类Fisher~q分析方法.
参考文献:
I1]张小舟.基于sVM的非相关线性判别分析算法研究[J].计算机工程与应用,2008,44(4):
227.229.
f21MikaS,RatschG,WestonJ,eta1.Fisherdiscriminantanalysiswithkernels『A1.IEEE
InternationalWorkshoponNeuralNetworksforSignalProcessingIX[C].Madison,USA,
August,1999.
[3】WangZhenyuan,YangRong,HengPheng-Ann,eta1.Real—valuedChoquetintegralswith
fuzzy—valuedintegrand[J】.FuzzySetsandSystems,2006,157(2):256—269.
[4]WangZhenyuan,KlirGJ.FuzzyMeasureTheory[M].NewYork:PlenumPress,1992.
[5JWangZhenyuan,LeungKwong-sak,WangJia.Applyingfuzzymeasuresandnonlinear
integralsindatamining[J】.FuzzySetsandSystems,2005,156(3):371—380.
[6】BaudatG,AnouarF.Generalizeddiscriminantanalysisusingakernelapproach[J].Neural
Comput,2000,12(10):2385—2404.
FisherdiscriminantanalysisbasedonChoquetintegral
JIAi—bing,QIUHong~ie,HAMing-hu.
(1.CollegeofInformationScienceandTechnology,NanjingUniversityofAeronauticsand
Astronautics,Nanjing21001,China;
2.CollegeofMedicine,HebeiUniversity,Baoding071000,China;
3.CollegeofMathematicsandComputer,HebeiUniversity,Baoding071000,China)
Abstract:Inthispaper,anewFisherdiscriminantanalysisbasedonChoquetfuzzyintegralis
introduced.Inthisdiscriminantanalysis.theinteractionsofthefactorsaretakenintoaccount.When
thefuzzymeasureisadditive,theFisherdiscriminantanalysisbasedonChoquetfuzzyintegralisjust
theclassicalFisherdiscriminantanalysis.Inaddition,thisdiscriminantanalysisisappliedtointhe
diagnosisofmyocardialinfarction.
Keywords:入一fuzzymeasure;Choquetfuzzyintegral;Fisherdiscriminantanalysis;nonlinear
discriminantanalysis
MRSubjectClassification:94A