首页 2010级多元统计分析试卷

2010级多元统计分析试卷

举报
开通vip

2010级多元统计分析试卷2010级多元统计分析试卷 2010级统计学专业多元统计分析试卷 一、设,为对称矩阵,证明: AX~N(μ,Σ)p ,,1. ; E(XX)=Σ+μμ ,,2. E(XAX)=tr(ΣA)+μAμ ,,,,,,,证明:1. 由于 Σ=(X,X)=(X-CovEEEμ)(X-μ)=(XX-Xμ-μX+μμ)XX,,()μμ ,,所以 E(XX)=Σ+μμ ,,,,,2. E(XAX)=E[tr(XAX)]=E[tr(XXA)]=tr[E(XX)A]=tr[(Σ+μμ)A] ,,, =tr(ΣA)+tr(μμA)=...

2010级多元统计分析试卷
2010级多元统计分析 试卷 云南省高中会考试卷哪里下载南京英语小升初试卷下载电路下试卷下载上海试卷下载口算试卷下载 2010级统计学专业多元统计分析试卷 一、设,为对称矩阵, 证明 住所证明下载场所使用证明下载诊断证明下载住所证明下载爱问住所证明下载爱问 : AX~N(μ,Σ)p ,,1. ; E(XX)=Σ+μμ ,,2. E(XAX)=tr(ΣA)+μAμ ,,,,,,,证明:1. 由于 Σ=(X,X)=(X-CovEEEμ)(X-μ)=(XX-Xμ-μX+μμ)XX,,()μμ ,,所以 E(XX)=Σ+μμ ,,,,,2. E(XAX)=E[tr(XAX)]=E[tr(XXA)]=tr[E(XX)A]=tr[(Σ+μμ)A] ,,, =tr(ΣA)+tr(μμA)=tr(ΣA)+tr(μAμ)=tr(ΣA)+μAμ 二、试比较主成分分析和因子分析的区别和联系。 解:(1)联系:?因子分析是主成分分析的推广和延伸,二者都是利用降维的思想;?主成分(或因子)的个数远小于原始变量的个数;?主成分(或因子)保留了原始变量的绝大部分信息;?各主成分(或因子)之间互不相关。 (2)区别:?主成分分析不能作为一个模型来描述,它只能作通常的变量变换,而因子分析需要构造因子模型;?主成分分析的主分量数m和变量数p相等,它是将一组具有相关性的变量变换为一组独立的变量,而因子分析的目的是使m比p小,而且要选取尽可能小的m,以便构造一个结构尽可能简单的模型;?主成分分析将主分量 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示为原始变量的线性组合,而因子分析将原始变量表示为新因子的线性组合。 三、和是两个随机向量,记的方差阵为,证明: XYYΣ,OYY ()i当时,,其中为广义相关系数。 Y=AX,,,1(1,2,,5)i,XYXY ,,证明:因为时,,因此就有 Y=AXΣ=AΣA,Σ=AΣ,Σ=ΣAYYXXYXXXXYXX +++++,,,, M=ΣΣΣΣ=(AΣA)AΣΣΣA(A,ΣA)AΣAYXYYYXXXXYXXXXXXXXXXXX +,注意到对任一B,BB是投影阵,它的特征根非0即1,而,因此至少AΣAΣO,,XXYY ()i有一个非零特征根,从而有。 ,,,1(1,2,,5)iXY 四、证明马氏距离是有线性变换与正交变换的不变性。 证明:设是从均值向量为,协方差阵为Σ的总体G中抽取的两个样品,则两X,XμX,X1212 21,,点之间的马氏距离为:。作正交变换,d()()()X,XXXΣXXY=PX(1,2)i,,,,m121212ii ,其中P为正交矩阵,则,于是两点之间的马氏距离 EDi(),()(1,2)Y=PμYP,,ΣPY,Yii12 21,-1,,, d()()()()Y,YYYΣYY(PX-PX)PΣP(PX-PX),,,,mYY1212121212 ,,112-1-1,,,, (X-X)PP()()ΣPP(X-X)(X-X)Σ(X-X)X,Xd,,,m1212121212 即马氏距离保持正交变换不变性。同理,亦可证马氏距离保持线性变换不变性。 五、令为来自下列模型的样本: (1) (,)(1,2,,)yxin,yxu,,,,,iiiii12 2且,重新设定参数后的模型为:yxxu,,,,,,() (2) uuuiidN,,,...(0,)~,iii12n12 ˆˆˆˆ令为基于(1)式的极大似然估计,为基于(2)式的极大似然估计。 ,,,,(,)(,)1212 ˆˆˆˆ1. 证明:,且; ,,,,,,2211 ˆˆ2. 证明:,并求的分布; ,,,y11 ˆˆ3. 证明:与独立。 ,,12 2证明:1. 由题设知,(1)式中,于是似然函数 yNx,,(,),,,ii12n121n2nn,,,,,,yx[)]12ii,,,,,yx,,[)],212ii122,22,21,2i, Lfyee,,,,,(,,)()(2),,,,,ii1122,,,,ii11nn1222,分别对求偏导 ,,,,,,,,,,,,,,,,ln(,,)ln(2)[)]Lyx,1211212ii222,,1i n,lnL1,1ˆˆ,,,,,,,,[)]0yx,,,,yx,12ii212,,,,,,1i,1 解之,得 L,,xynˆ,,lnL1,2,1,,,,,,[)]0yxx,,L,12iii2xx,,,,,,1i2,nnn2其中,。 LxxyyxxyLxx,,,,,,,()()(),(),,,xyiiiixxi,,,111iii2同理,对于(2)式,有, yNxx,,,((),),,,ii12 nn1222,分别对求偏导 ,,,,,,,,,,,,,,,,,ln(,,)ln(2)[())]Lyxx,1221212ii222,,1i n,lnL1,2ˆ,,y,,,,,,,,[())]0yxx,,112ii2,,,,,1,i,1解之,得 L,,xynˆ,,,lnL122,,,,,,,,,[())]()0yxxxxL,,,12iiixx2,,,,,,1i2, ˆˆˆˆ所以 ,,,,,,,2211 22,,2ˆˆ2. 由1知,。由于,所以,即。 ,,yNxx,,,((),),,,yN,(,),yN(,),,,1ii11112nn ˆˆ3. 由于1知,是个独立正态随机变量的线性组合,因而也为正态分布。,yyy,,,,n212n2于是 n ()xxy,,iinnnL11xy,1iˆˆ ,,CovCovyCovyCovyxxy(,)(,)(,)(,()),,,,,,,12iiiiLnLnL,,,111iiixxxxxx2nnn11, ,,,,,,,CovyxxyxxCovyyxx(,())()(,)()0,,,iiiiiiinLnLnL,,,iii111xxxxxx ˆˆˆˆˆˆ即与不相关,又与为正态随机变量,所以与独立。 ,,,,,,121212 六、请举出几种估计误判概率的方法,并说明其优缺点。 解:进行判别分析难免会出现误判,误判概率一般需通过样本做出估计。在各组不能假定为正态的情况下,估计误判概率的方法通常有三种: (1)令n(2|1)为样本中来自,而误判为,的个数,n(1|2)为样本中来自,而误判为,1221的个数,,则P(2|1)和P(1|2)可估计为 n(2|1)ˆ P(2|1),n1 n(1|2)ˆ P(1|2),n2 该方法的优点是简单、直观,且易于计算。但不足的是,它给出的估计值通常偏低,除非和都非常大。 nn12 (2)将整个样本一分为二,一部分作为训练样本,用于构造判别函数,另一部分用作验证样本,用于对判别函数进行评估。误判概率用验证样本的被误判比例来估计,如此得到的估计是无偏的。但是,这种方法有两个主要缺陷:?需要用大样本;?在构造判别函数时,只用了部分样本数据,损失了过多有价值的信息。与使用所有的样本数据构造判别函数相比,该方法将使真实的误判概率上升。 (3)交叉验证法(或称为刀切法),该方法看来效果较好。从组中取出,用该组,x11j的其余个观测值和组的个观测值构造判别函数,然后对进行判别,n,1,nx1221j 。同样,从组中取出,用这一组的其余个观测值和组的个观测n,1jn,1,2,,,x,n122j211 *值构造判别函数,再对作出判别,。令为样本中来自而误判为xjn,1,2,,,,n(2|1)2j212 *的个数,为样本中来自而误判为的个数,则两个误判概率和的估,,P(2|1)P(1|2)n(1|2)21 计量为 *n(2|1)ˆ P(2|1),n1 *n(1|2)ˆ P(1|2),n2 它们都是接近无偏的估计量。
本文档为【2010级多元统计分析试卷】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_348501
暂无简介~
格式:doc
大小:27KB
软件:Word
页数:5
分类:理学
上传时间:2017-10-08
浏览量:175