Fisher线性判别
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
实验报告 - Read
Fisher线性判别分析实验报告
一、摘要
Fisher线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将高维问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
降低到一维问题来解决,并且要求变换后的一维数据具有性质:同类样本尽可能聚
集在一起,不同类样本尽可能地远。
Fisher线性判别分析,就是通过给定的训练数据,确定投影方向w和阈值y0,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。 二、算法的基本原理及
流程
快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计
图
1 基本原理
(1) W的确定 1,,imx, 1,2,iNx,Xii 各类样本均值向量 mi
SS样本类内离散度矩阵和总类内离散度矩阵 wi
T S(xm)(xm), 1,2,,,,i,iii,Xxi
SSS,, w12
S 样本类间离散度矩阵 b
T S(mm)(mm),,,b1212
在投影后的一维空间中,
T 各类样本均值 m'= Wmii
TTS' = WS W S' = WSW样本类内离散度和总类内离散度 iiww
T样本类间离散度 S' = WSW bb
Fisher准则函数满足两个性质:
投影后,各类样本内部尽可能密集,即总类内离散度越小越好。
投影后,各类样本尽可能离得远,即样本类间离散度越大越好。
根据这个性质确定准则函数,根据使准则函数取得最大值,可求出w
-1 W = S(m - m) w12
(2) 阈值的确定
实验中采取的方法: y = (m' + m') / 2012
(3) Fisher线性判别的决策规则
T 对于某一个未知类别的样本向量 x,如果y = Wx >y0, 则x?w1
否则x?w2
2 流程图
载入训练数据
载入测试数据
归一化处理
归一化处理 得到每个类的均
值向量
判断测试数据类计算类内的离散别 度,总的离散度
计算总离散度的
逆矩阵
计算投影向量和
阈值
l1xx,,ijil,1方差
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
化 (归一化处理) j
l122一个样本集中,某一个特征的均值与方差为: sxx,,()i,jiil,1j
xx,ii归一化: x,isi
三、实验结果分析
1 男女同学身高体重,训练数据和测试数据都是50
当采用StudentData1作为训练数据,StudnetData2作为测试数据时 男孩类的错误率 女孩类的错误率 总的错误率 0.04 0.14 0.09
当采用StudnetData2作为训练数据,StudentData2作为测试数据时 男孩类的错误率 女孩类的错误率 总的错误率 0.02 0.06 0.04
2 IonoSphere数据
G类错误率 B类错误率 总的类错误率 第一组数据0.31 0.29 0.30 第二组数据 0.32 0.27 0.30 第三组数据0.31 0.28 0.29 第四组数据 0.30 0.37 0.32 第五组数据 0.30 0.31 0.31 第六组数据 0.78 0.27 0.60 第七组数据 0.42 0.25 0.36 第八组数据 0.30 0.31 0.30 第九组数据 0.29 0.40 0.33 第十组数据 0.34 0.25 0.31
考虑到第一组数据训练数据多,下面的实验以第一组数据的训练数据作为训练数据,分别用其他组的测试数据进行测试
G类错误率 B类错误率 总的类错误率 第一组数据0.31 0.29 0.30 第二组数据 0.31 0.26 0.29 第三组数据 0.32 0.26 0.30 第四组数据 0.31 0.26 0.29 第五组数据0.31 0.26 0.29
第六组数据 0.28 0.26 0.27 第七组数据 0.32 0.25 0.30 第八组数据 0.31 0.27 0.29 第九组数据 0.30 0.26 0.28 第十组数据 0.31 0.26 0.29 从实验结果看,Fisher线性判别用于两类的判别决策时,拥有不错的效果,并且当有足量的训练数据时,效果更好。
四、体会
通过Fisher线性判别分析程序,对模式识别领域处理问题的一般步骤有了更好的理解,首先是通过训练数据,得到线性判别函数,即决策规则,构造出分类器,然后根据构造出来的分类器,对测试数据进行判别,得到测试数据的类别,最后对分类器的分类效果进行评估。