首页 用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的实验报告

举报
开通vip

用身高和体重数据进行性别分类的实验报告用身商和体重数据进行性别分类的实验报告用身高和体重数据进行性别分类的实验报告(二)—、基本要求1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。2、试验直接设计线性分类器的方法,与展于概率密度估计的贝叶斯分类器进行比较。3、体会留一法估计错误率的方法和结果。二、具体做法1、在第一次实验中,挑选一次用身高作为特征,并且先验槪率分别为男生0.5,女生0.5的情况。改用Parzen窗法或者k.近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。2...

用身高和体重数据进行性别分类的实验报告
用身商和体重数据进行性别分类的 实验报告 化学实验报告单总流体力学实验报告观察种子结构实验报告观察种子结构实验报告单观察种子的结构实验报告单 用身高和体重数据进行性别分类的实验 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 (二)—、基本要求1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。2、试验直接 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 线性分类器的方法,与展于概率密度估计的贝叶斯分类器进行比较。3、体会留一法估计错误率的方法和结果。二、具体做法1、在第一次实验中,挑选一次用身高作为特征,并且先验槪率分别为男生0.5,女生0.5的情况。改用Parzen窗法或者k.近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。2、同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。三、原理简述及程序框图1、挑选身高(身高与体重)为特征,选择先验概率为男生0.5女生0.5的一组用Parzen窗法来求槪率密度函数,再用贝叶斯分类器进行分类。以身高为例本次实验我们组选用的是正态函数窗,即飒“)=11.—==exp^——ir厉12J窗宽为心=力/佰山是调节的参量,N是样本个数)Vv=/^,(d表示维度)。因为区域故女生的条件概率密度为卄丽5丽0由1N21v-r男生的条件概率密度为/.2=—Y——N2幺VN2*九2丿根据贝叶斯决策规则g(x)=p(x/wjp(wj-p(x/w?)p(w?)知如果pl*/?>/?2*(l-/?),xe,否则,xea)2O 流程 快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计 图如下:确定特征及先验概率选择窗函数及窗宽求出样本类别为男或女的炎条件概率密度得出决策规则并对测试样本进行判别2、要求是同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。说明,取男生和女生的先验槪率分别为0.5,0.5。在设计贝叶斯分类器时,首先求各类样本均值向量,及%=补工>」=1,2,然后求各个样本的来内离散度矩阵,及-,n>-fJ'=12,再求出样本的总类内离散度,及A€K;S3=)儿+)$2,根据公式少=肩(mi-m2)求出把二维X空间投影到一维Y空间的最好的投影方向。再求出一维Y空间中各类样本均值=,其中y=^*兀,本次实验的分界阈值我们用如下方法得到:>0=N\+N?,最后,将测试样本中的值代入,求出y,并将其与yO来进行比较来分类。根据课本对Fisher线性判别法的介绍,得到的算法流程图如下:求各类样本均值向量求类内离散度矩阵用公式求最好的变换向呈VT二维空间向一维丫空间投影一维空间样本均值求取阈值丫0决策判断◊计算各类样本的错误率3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。这里我们选择Fisher线性判别法,用留一法来估计它在训练集上的错误率,用身高和体重数据进行性别分类的实验报告并将结果与Fisher线性判别法对测试集进行判别时得到的错误率进行比较。具体流程图如下:导入两个训练样本集依次将女生样本集中的每•个样本当做测试集,余卜的所有样本做训练集JtlFisher法判断被选出來的样本.若判断错误,计数•次将男生按照以上方法再判断,计数,得到错误率以上方法用以测试集,得到错误率四、实验结果及 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 总结1>得到结果如下表以身高作为特征h二4女生先验概率男生先验概率男生错误个数女生错误个数总错*a7天男生错误率女生错误总错误率Parzen窗法0.250.752283016%8.8%10%0.50.53443813.6%8%12.67%0.750.258028232%4%27.33%最大似然Bayes0.250.75206.667%0.50.5279%0.750.256020%以身高与体重作为特征h=7女生先验概率男生先验概率男生错误个数女生错误个数总错P伏男生错误率女生错误率总错误率Parzen窗法0.250.757222914%8.8%9.67%0.50.53824015.2%4%13.33%0.750.252464818.4%4%16%最大似然Bayes0.250.7586143.2%12%4.67%0.50.52933211.6%6%10.67%0.750.25916023.6%2%20%分析:通过比较可知,在用最大似然估计这种参数估计方法和Pa「zen这种非参数估计方法来进行分类时,最大似然估计判别的错误率低。2、得到结果如下⑴.用Fisher线性判别方法求分类器,将分类器应用到训练和测试样本上,比较其错误率判对象\男生错误个数女生错误个数总错误男生错误率女生错误率总错误率测试样本2722910.8%4%9.67%训练样本841216%8%12%分析:用训练样本得到的分类器测试测试样本时错误率低,测试结果较好,但测试训练样本时,其错误率较高,测试结果不好。(2).将训练样本和求得的决策边界画到图上先验概略为0・5,0・5从图中我们可以直观的比较出对训练样本Fisher判别比最大似然Bayes判别效果更好。3、留一法测试结果如下:判认对象\男生错误个数女生错误个数错误率测试样本81328%训练样本8412%分析:用留一法在训练样本机上估计错误率时,错误率小于它在测试样本集上得到的错误率,且留一法在测试样本集上女生错误个数远低于男生错误个数。五、体会这次实验,我们组用了接近三天的时间,首先,我们对题目要求进行认真分析,在确保对题目完全理解的基础上,开始一步一步分析,求解。对每个小题,及其每一问,我们都经过查书,查资料,编代码这几个步骤,仔细分析每一步算法,得出流程图。经过第一次作业的编程,本次编程我们都觉得轻松了很多,但还会出现一些细节上的错误,不过,这些在我们经过不斷的调试之E都会被发现并解决。总体而言,本次试验,让我们对Parzen窗法求类条件概率密度,以及Fisher线性判别法都有了更大的了解。代码:%特征是身高,先验概率为0.5、0.5时用Parzen窗法,贝叶斯分类器。clc;cIearall;[FHFW]=textread(*C:\Users\xuyd\Desktop\homework\FEMALE.txt"%f%f');[MHMW]=textread('C:\Users\xuyd\Desktop\homework\MALE.txt1,1%f%f*);FA=[FHFW];MA=[MHMW];N1=max(size(FA));h1=4;hn1=h1/(sqrt(N1)):VN1=h1/(sqrt(N1));N2=max(size(MA));h2=4;hn2=h2/(sqrt(N2));VN2=h2/(sqrt(N2));[tHtW]=textread(1C:\Users\xuyd\Desktop\homework\test2.txf,1s');X=[tHtW];[MN]=size(X);s=zeros(M,1);A=[X(:,1)X(:,2)s];error=O;errorgirl=0;errorboy=0;errorrate=0;errorgirIrate=O;errorboyrate=0;girl=0;boy=0;bad=0:fork=1:M%测试集用身高和体重数据进行性别分类的实验报告p=0.5;%p为厲于女生的先验概率,S'11-p为男生的先验概率fori=1:N1pp(i)=1/sqrt(2*pi)*exp(-0.5*(abs(x—FA(i)))"2/(hn1"2));%pp(i)是窗函数endp1=sum(1/VN1*pp1);y1=1/N1*p1:%是女生的条件槪率密度函数forj=1:N2qq(j)=1/sqrt(2*pi)*exp(-0.5*(abs(x—MA(j))厂2/(hn2"2));endq1=sum(1/VN2*qq1);y2=1/N2*q1;%男生的概率密度函数,即其条件概率g=p*y1-(1—p)*y2;%g为判别函数ifg>0ifk<=50s(k,1)=0;%判为女生girl=girI+1;elseerrorboy=errorboy+1;endeIseifg<0ifk<=50errorgirl=errorgir1+1;elses(k,1)=1;%判为男生boy=boy+1;endeIses(k,1)=-2;%不能判别是指等于0时的情况bad=bad+1;endenderrorgirIerrorboybadgirI=errorboy+girIboy=boy+errorgirIerror=errorgirl+errorboyerrorgirIrate=errorgirI/50errorboyrate=errorboy/250errorrate=error/M%特征是身高与体重,先验概率为0.5、0.5时用Parzen窗法,贝叶斯分类器。CIC;clearall;[FHFW]=textread('C:\Users\xuyd\Desktop\homework\FEMALE.txt',"%f%fO;[MHMW]=textread(*C:\Users\xuyd\Desktop\hornework\MALE.txtFA=[FHFW];MA=[MHMW];N1=max(size(FA));h1=7;hn1=h1/(sqrt(ND);VN1=hn1八2;N2=max(size(MA));h2=7;hn2=h2/(sqrt(N2));VN2=hn2"2;[tHtW]=textread(1C:\Users\xuyd\Desktop\homework\test2.txt\X=[tHtW];[MN]=size(X);s=zeros(M,1);error=0;errorgirl=0;errorboy=0;errorrate=O;errorgirIrate=0;errorboyrate=O;girl=0;boy=O:bad=0;fork=1:MA=[X(k,1)X(k,2)];x=A;p=0.5;%p为属于女生的先验概率,则1-p为男生的先验概率pp=o;fori=1:N1fa=[FA(i,1)FA(i,2)];n=1/sqrt(2*pi)*exp(■0・5*abs((x-fa)*(x-fa)')/(hn1^2)):pp=pp+n;endp1=1/VN1*pp‘;y1=1/N1*p1:%是女生的条件概率密度函数qq=0;forj=1:N2ma=[MA(J,1)MA(j,2)];m=1/sqrt(2*pi)*exp(—0・5*abs((x-ma)*(x-ma)')/(hn22)):qq=m+qq;endq1=sum(1/VN2*qq');y2=1/N2*q1;%男生的概率密度函数,即其条件概率g=p*y1-(1-p)*y2;%g为判别函数ifg>0ifk<=50s(k,1)=0;%判为女生girl=girl+1;errorboy=errorboy+1;endeIseifg<0ifk<=50errorgirl=errorgirl+1:s(k,1)=1;%判为男生boy=boy+1;endelses(k,1)=-2;%不能判别是指等于0时的情况bad=bad+1;endenderrorgirIerrorboybadgirl=errorboy+girlboy=boy+errorgirIerror=errorgirl+errorboyerrorgirIrate=errorgirI/50errorboyrate=errorboy/250errorrate=error/M%用fisher线性判别法求阈值function[w,yO]=fisher(AA,BB)A=AA‘;B=BB*;[k1,11]=size(A);[k2,I2]=size(B);M1=sum(AA);M1=M1/I1;%男生均值向量M2=sum(BB);M2=M21;M2=M2/I2;%女生均值向量S1=zeros(k1,k1);%建立矩阵S2=zeros(k2,k2);fori=1:IlS1=S1+(A(:,i)-M1)*((A(:,i)-M1).'):%男生的类内离散度矩阵endfori=1:I2S2=S2+(B(:,i)-M2)*((B(:,i)-M2).;%女生的类内离散度矩阵endSw=0・5*S1+O・5*S2:%总类内离散度矩阵,先验槪率0.5w=inv(Sw)*(M1-M2);%两列wT=w,;%wT就是使Fisher准则函数JF(w)取极大值时的解,也就是d维X空间到1维Y空间的最好的投影方向fori=1:I1Y1(i)=wT(1,1)*A(1,i)+wT(1,2)*A(2,i);%求出二维男生样本集映射到一维时的量endfori=1:I2Y2(i)=wT(1,1)*B(1,i)+wT(1,2)*B(2,i);%求出二维女生样本集映射到一维时的量endm1=sum(Y1)/I1;m2=sum(Y2)/I2;yO=(H*m1+12*m2)/(11+12);%%用彳isher线性判别函数来判斷clcclearaII[]=uigetfile('*.txt','请读入男生训练集');=[pathname,];[A1A2]=textread(J%f%f‘);[]=uigetfiIe(**,txt','请读入女生训练集'):=[pathname,];[B1B2]=textread(,*%f%f');AA=[A1A2];BB=[B1B2];[w,y0]=fisher(AAtBB);wT=w,:girI=0:boy=O;bad=0;errorgirI=0;errorboy=0;error=0;errorgirIrate=0;errorboyrate=0;errorrate=0;[]=uigetfile('*.txt','请读入测试集’):=[pathname,];[T1T2]=textread(J%催TT=[T1T2];T=T「;[k3I3]=size(T);fork=1:50y(k)=wT*T(:,k);ify(k)>yOerrorgirI=errorgir1+1;elseify(k)y0boy=boy+1;eIseify(k)b2b=a2;eIseb=b2;%匕是所有人中身高最大值endifa3b4d=a4;eIsed=b4;%4为所有人中体重最大值endx=a:0.01:b;y=(y0-x*w(1,1))/w(2,1);plot(x,y,'B');hoidon;%身高体重相关,判别测试样本%手动先验概率P1=0.5;P2=0・5;FA=A;MA二B;a=cov(FA*)*(Iength(FA)-1)/length(FA);b=cov(MA,)*(length(MA)—1)/length(MA);W1=—1/2*inv(a);W2=-1/2*inv(b):Ave1=(sum(FA*)/Iength(FA))';Ave2=(sum(MA')/length(MA))';w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10/2*Ave1'*inv(a)*Ave1-1/2*Iog(det(a))+Iog(P1);w20=-1/2*Ave2**inv(b)*Ave2—1/2*log(det(b))+Iog(P2);symsx;symsy;h=[xy]';h1=h'1*h+wr*h+w10;h2=h,*W2*h+w2,*h+w20;h=h1-h2;ezplot(h,[130,200,30,100])%功能:应用Fisher准则判斷一个身高体重二维数据的性别vector=[x;y];yy=(w.')*vector;ifyy>y0vaIue=2;%表示样本是男生eIsevalue=1:%表示样本是女生end%功能:使用留一法求训练样本错谋率[A1A2]=textread(1C:\Users\Administrator\Desktop\模式识别\homework\MALE・txt1');[B1B2]=textread(*C:\Users\Administrator\Desktop\模式识别\homework\FEMALE・txt;1%f%f*);AA=[A1A2];BB=[B1B2];A=AA*;B=BB,;m1=2;m2=2;n1=50;n2=50;tempA=zeros(ml,n1—1);count=0;fori=1:n1forj=1:(i-1)tempA(:,j)=A(:,j);endforj=(i+1):n1ternpA(:,j-1)=A(:,j);end[w,y0]=fisher((tempA・'),BB);flag=classify_CH(A(1,i),A(2,i),w,y0);ifflag==1count=count+1;endendtempB=zeros(m2,n2-1);fori=1:n2forj=1:(i—1)tempB(:,j)=B(:,j);endforj=(i+1):n2tempB(:,j-1)=B(:,j);end[w,y0]=fisher(AA,(tempB.1));flag=classify_CH(B(1,i),B(2,i),w,yO);iffIag==2count=count+1;endenderror_ratio=count/(rd+n2)%使用留一法求测试样本错误率[T1T2]=textread(*C:\Users\Administrator\Desktop\模式识别\homework\test2・txt',1;TT=[T1T2];T=T「;[k3I3]=size(T);TG=zeros(2,50);TB=zeros(2f250);fori=1:50TG(:,i)=T(:,i);endforj=51:I3TB(:,j-50)=T(:,j);endm1=2;m2=2;n1=50;n2=250;ternpA=zeros(ml,n1-1);count=0;fori=1:n1forj=1:(i-1)tempA(:,j)=TG(:,j);endforj=(i+1):n1tempA(:,j-1)=TG(:,j);end[w,yO]=fisher((tempA.'),TB');flag=classify_CH(TG(1,i),TB(2,i),w,y0);ifflag==1count=count+1;endendtempB=zeros(m2,n2-1):fori=1:n2forj=1:(i-1)tempB(:,j)=TB(:,j);endforj=(i+1):n2tempB(:,j-1)=TB(:,j):end用身高和体重数据进行性别分类的实验报告[w,yO]=fisher(TG*,(tempB.'));flag=classify_CH(TB(1,i),TB(2,i),w,yO);ifflag==2count=count+1;endenderror_ratio=count/(n1+n2)
本文档为【用身高和体重数据进行性别分类的实验报告】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_072127
暂无简介~
格式:doc
大小:81KB
软件:Word
页数:21
分类:
上传时间:2018-11-18
浏览量:7