2009-9-8
1
School of Psychology, Beijing Normal University
方差分析的原理
北京师范大学心理学院
骆 方
2009.9.8
School of Psychology, Beijing Normal University
方差分析 (Analysis of Variance, ANOVA)
1928年由英国统计学家R.A. Fisher 首先提出
,方差分析又称为F检验。
比较各省在收入及教育年数上的差异。
大学中各年级的同学智商是否有别?
三种不同的教学方法对学生的成绩是否有影响?
School of Psychology, Beijing Normal University
纲要
1 基本概念
2 研究假设
3 分析逻辑
4 T检验与F检验
School of Psychology, Beijing Normal University
1 基本概念
实验
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
中所衡量的基本对象称为“实验单位”
(experimental unit)。
在不同条件下衡量实验单位的观察值,这些不同条
件称为“因素” (factor)。
各因子的不同表现程度称为“水平” (level)。
不同因子的某种特定水平组合称为“处理”
(treatment)。
School of Psychology, Beijing Normal University
1 基本概念
离差(deviation):代表任一观察值 Xi 与其平均
数的差,即 。
变异(variation):离差的平方,即 ;
若将所有变异加总,即构成离差的平方和(sum of
square for deviation)。
方差(variance):离差的平方和除以自由度,例如
︰样本变异数,
X i
X X
2
( )iX X
2 2
( ) / 1iS X X n
School of Psychology, Beijing Normal University
H0: 1=2=3=...=p
所有的总体均值相同
没有处理效应
H1: 不是所有 j 都相同
至少有1个总体均值不同
存在处理效应
并非 12... p
X
f(X)
1 = 2 = 3
X
f(X)
1 = 2 3
2 研究假设
2009-9-8
2
School of Psychology, Beijing Normal University
3 分析逻辑
如果p组样本来自同一总体,那么从理论上说组间变
异应该等于组内变异(期望相等),因为两者均只
反映随机抽样误差
方差分析是透过各组样本内的变异与组间变异的比
较来检验各组平均值是否相等的一种方法。
3.1 变异的计算
3.2 变异的比较
School of Psychology, Beijing Normal University
X
Group 1 Group 2 Group 3
Response, X
...2221
2
11 XXXXXXSST ij
3.1 变异的计算
School of Psychology, Beijing Normal University
X
X3
X2X1
Group 1 Group 2 Group 3
Response, X
...2222
2
11 XXnXXnXXnSSB jj
3.1 变异的计算
School of Psychology, Beijing Normal University
X2X1
X3
Group 1 Group 2 Group 3
Response, X
...22121
2
111 jij XXXXXXSSW
3.1 变异的计算
School of Psychology, Beijing Normal University
SSB SSW
SST
Sum of Squares Within
Sum of Squares Error
Within Groups Variation
Sum of Squares Between
Sum of Squares Treatment
Among Groups Variation
3.1 变异的计算
Thinking Challenge 1
证明 SS=SSE+SST.
School of Psychology, Beijing Normal University
3.2 变异的比较
总体方差2的估计量
组间变异:
E(MSB) = 2 + >= 2
组内变异:
E(MSE) = 2。
1
)(
1
2
k
n
k
j
jj
Thinking Challenge 2
推导两种变异的期望
1
)(
1
1
2
k
XXn
k
SSB
MSB
k
j
jj
kN
SSW
MSW
2009-9-8
3
School of Psychology, Beijing Normal University
3.2 变异的比较 ANOVA test statistic F
• In One-way ANOVA, the test statistics is
MSW
MSB
F
如果H0为真,分子分母皆为总体方差的不偏估计式,
因此两者的比率会十分接近1。
如果H0为不真,则MSB会高估总体方差,F值会大于1。
F愈大,H0愈不可能为真。
如果假设为真,则F统计量依循自由度为(k-1)及(n-k)的
F 分布。
Thinking Challenge 3
F分布的性质
School of Psychology, Beijing Normal University
3.2 变异的比较 ANOVA test statistic F
If means are equal,
F = MSB / MSW 1.
Only reject large F!
Always One-Tail!
Fa p n p( , ) 1
0
Reject H0
Do Not
Reject H0
F
School of Psychology, Beijing Normal University
F table
dfbetween (分子)
dfwithin
(分母)
School of Psychology, Beijing Normal University
4 T检验与F检验
在比较多组总体的平均值时,我们通常不采用两两
比较的方式,主要的原因有二:
一、这种做法太浪费时间,因为比较几个总体可能产生很
多的比较组,例如比较五个总体的平均值差异,如果以两
两比较的方式,我们必须进行C52=10次的t-test。
二、如果每组的显著水准皆为α ,则全体比较的显著水准
会高于α 。
School of Psychology, Beijing Normal University
4 T检验与F检验
假设我们在.05的显著水准下要检定虚拟假设:
H0: u1=u2=u3
如果拆成下列三组虚拟假设:
H0: u1=u2 , H0: u1=u3 , H0: u2=u3
每个假设被“接受”的机率为.95,三个假设全部
被接受的机率为.953 =.857,也就是说当假设为真
但被推翻的机率为(1 - 0.857) = 0.143 > 0.05
远高于显著水平。
’=1-(1-)m
School of Psychology, Beijing Normal University
4 T检验与F检验
如果只比较两组总体的平均值时,该采用T检验还是
F检验?检验H0: u1= u2 vs. H1: u1 u2
T检验:
K=2时one-way ANOVA检验等于t检验,且F=t2。
)-(n)-(n
nn
s
xx
t
p
11d.f.
11
)(
21
21
21
Thinking Challenge 4
证明 F=t2