协方差及相关系数
第三节 协方差及相关系数
对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没
能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个
数字特征.
内容分布图示
? 引言 ? 协方差的定义 ? 协方差的性质
? 例1 ? 例2
? 相关系数的定义 ? 相关系数的性质
? 例3 ? 例4 ? 例5 ? 例6
? 矩的概念 ? 协方差矩阵
? n维正态分布的概率密度
? n维正态分布的几个重要性质 ? 例7
? 内容小结 ? 课堂练习
? 习题4-3 ? 返回
内容要点:
一、 协方差的定义
定义 设为二维随机向量,若 (X,Y)
E{[X,E(X)][Y,E(Y)]}
存在, 则称其为随机变量和的协方差, 记为,即 Cov(X,Y)XY
cov(X,Y),E{[X,E(X)][Y,E(Y)]}.
按定义, 若为离散型随机向量,其概率分布为 (X,Y)
P{X,x,Y,y},p(i,j,1,2,?) ijij
cov(X,Y),E{[x,E(X)][y,E(Y)]}.则 ,iji,j
若为连续型随机向量, 其概率分布为 则 (X,Y)f(x,y),
,,,,. cov(X,Y),E{[x,E(X)][y,E(Y)]}f(x,y)dxdy,,,,,,
此外, 利用数学期望的性质, 易将协方差的计算化简.
cov(X,Y),E{[X,E(X)][Y,E(Y)]}
,E(XY),E(X)E(Y),E(Y)E(X),E(X)E(Y)
,E(XY),E(X)E(Y).
特别地, 当与独立时, 有 cov(X,Y),0. XY
二、协方差的性质
1. 协方差的基本性质
(1)cov(X,X),D(X);
(2)cov(X,Y),cov(Y,X);
(3)cov(aX,bY),abcov(X,Y),其中是常数; a,b
为任意常数; (4)cov(C,X),0,C
(5)cov(X,X,Y),cov(X,Y),cov(X,Y).1212
(6) 若与相互独立时,则 cov(X,Y),0.XY
2. 随机变量和的方差与协方差的关系
D(X,Y),D(X),D(Y),2cov(X,Y),特别地, 若与相互独立时, 则 XY
. D(X,Y),D(X),D(Y)
三、相关系数的定义与性质
定义 设为二维随机变量,称 (X,Y)D(X),0,D(Y),0,
Cov(X,Y) ,,XYD(X)D(Y)为随机变量和的相关系数.有时也记为. 特别地,当时,称与不相关. ,,,0XY,XYXYXY
相关系数的性质
1. |,|,1; XY
2. 若和相互独立, 则,,0. XYXY
3. 若|,|,1,则当且仅当存在常数a,b(a,0). 使P{Y,aX,b},1, 而DX,0,DY,0XY
且当,,1,,,1时, ;当时, . a,0a,0XYXY
注: 相关系数,刻画了随机变量Y与X之间的“线性相关”程度. XY
|,|的值越接近1, Y与X的线性相关程度越高; XY
|,|的值越近于0, Y与Y的线性相关程度越弱. XY
|,|,1当时, Y与X的变化可完全由X的线性函数给出. XY
,,0当时, Y与X之间不是线性关系. XY
2e,E[Y,(aX,b)],4. 设称为用来近似Y的均方误差,则有下列结论. aX,b
cov(X,Y)设D(X),0,D(Y),0, 则a,,b,E(Y),aE(X)使均方误差达到最小. 000D(X)
注: 我们可用均方误差e来衡量以近似
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示Y的好坏程度, e值越小表示与aX,baX,b
2e,D(Y)(1,,)aX,b.Y的近似程度越好.且知最佳的线性近似为而其余均方误差. 从这XY0
|,||,|个侧面也能说明. 越接近1, e越小.反之, 越近于0, e就越大.Y与X的线性相关XYXY
性越小.
四、矩的概念
定义 设和为随机变量, 为正整数, 称 k,lY
kE(X) 为阶原点矩(简称阶矩阵); kk
kE([X,E(X)]) 为阶中心矩; k
kE(|X|) 为阶绝对原点矩; k
kE(|X,E(X)|) 为阶绝对中心矩; k
klE(XY) 为和的阶混合矩; Yk,l
klE{[X,E(X)][Y,E(Y)]} 为和的阶混合中心矩; Yk,l注: 由定义可见:
(1) 的数学期望是的一阶原点矩; E(X)
(2) 的方差是的二阶中心矩;
(3)协方差是和的二阶混合中心矩. Cov(X,Y)Y
五、协方差矩阵
将二维随机变量(X,X)的四个二阶中心矩 12
22c,E{[X,E(X)]},c,E{[X,E(X)]},11112222
c,E{[X,E(X)][X,E(X)]}, 121122
c,E{[X,E(X)][X,E(X)]}.212211
cc,,1112,,排成矩阵的形式: (对称矩阵),称此矩阵为(X,X)的协方差矩阵. 12,,cc2122,,
n类似定义(X,X,?,X)维随机变量的协方差矩阵. 12n
c,Cov(X,X),E{[X,E(X)][X,E(X)]}i,j,1,2,?,n若都存在, 则称 ijijiijj
cc?c,,11121n,,cc?c,,21222nC, ,,????,,,,cc?cn1n2nn,,(X,X,?,X)为的协方差矩阵. 12n
六、n维正态分布的概率密度
七、n维正态分布的几个重要性质
例题选讲:
协方差的性质
(X,Y)例1 (讲义例1) 已知离散型随机向量的概率分布为
Y 0 2 ,1X
0 0.1 0.2 0
1 0.3 0.05 0.1
2 0.15 0 0.1 求. cov(X,Y)
例2 (讲义例2) 设连续型随机变量的密度函数为 (X,Y)
8xy,0,x,y,1,f(x,y), ,0,其它,
求和. cov(X,Y)D(X,Y)
相关系数的性质
例3 (讲义例3) 设(X,Y)的分布律为
P{Y,y} X 1 2 j,2,1
Y
1 0 1/4 1/4 0 1/2
4 1/4 0 0 1/4 1/2
P{X,x} 1/4 1/4 1/4 1/4 1 i
易知,,0,X,YE(X),0,E(Y),5/2,E(XY),0,于是不相关. 这表示X,Y不存在XY
X,Y线性关系. 但P{X,,2,Y,1},0,P{X,,2}P{Y,1},知不是相互独立的.
2Y,X,事实上, 和具有关系: 的值完全可由的值所确定. YYXX
例4 (讲义例4) 设服从上的均匀分布, X,sin,, 判断与是[,,,,]Y,cos,XY,
否不相关, 是否独立.
22X~N(1,3)Y~N(0,4), 例5 (讲义例5) 已知, 且与的相关系数 YX
1 ,,,.XY2
XY,.设Z,,, 求及 D(Z)XZ32
例6 (讲义例6) 设服从二维正态分布, 它的概率密度为 (X,Y)
22,,,,,,,,,,,,(x)(x)(y)(y),11,,1122,,,,(,)exp2,fxy,,,,2222,,,,,,2(1),,,,12,,,2,1,12,,,,12
,求和的相关系数. XYXY
注:在上一章中我们已经得到:若(X,Y)服从二维正态分布, 那么和相互独立的充要Y
条件为. 现在知道即为与的相关系数, 故有下列结论: ,,0,XY
“若(X,Y)服从二维正态分布,则与相互独, 立当且仅当与不相关”. XYXY
n维正态分布的几个重要性质
X~N(1,2),.Y~N(0,1)例7 (讲义例7) 设随机变量和相互独立且 ,试求XY
的概率密度. Z,2X,Y,3
课堂练习
1. 对不同品牌的某种机械的两项重要指标评分, 设为其所得分数(百分制). 已知 X,X12
E(X),68.9,E(X),72.8; D(X),81,D(X),49;cov(X,X),36.121212
97现以服从正态分布的综合分来决定各参评品牌的名次 Y,X,X121616
.(1) 试求Y的分布; (2) 如果对综合分的品牌颁奖, 试计算获奖者的百分比. Y,85