方差分析
方差分析(analysis of variance ), 简称ANOVA, 由英国统计学家R.A.Fisher首先提出,后人为纪念Fisher ,以F命名方差分析的统计量,故方差分析又称F检验。
样本均数的差异,可能有两种原因所致。首先可能由随机误差所致随机误差包括两种成分:个体间的变异和测量误差两部分;其次可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。一般来说,个体之间各不相同,是繁杂的生物界的特点;测量误差也是不可避免的,因此第一种原因肯定存在。而第二种原因是否存在,这正是假设检验要回答的问题。
方差分析的基本思想是将所有观察值之间的变异(称总变异)按
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
和需要分解成几部分。如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,后者常称为误差。将各部分变异除以误差部分,得到统计量F值,并根据F值确定P值作推断。
由于方差分析是根据实验设计将总变异分成若干部分,因此设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。
方差分析可用于:
(1)两个或多个样本均数间的比较
(2)分析两个或多个因素的交互作用
(3)回归方程的假设检验
(4)方差齐性检验
多个样本均数间比较的方差分析应用条件为:
(1)各样本必须是相互独立的随机样本(独立性)
(2)各样本均来自正态总体(正态性)
(3)相互比较的各样本的总体方差相等(方差齐性)
一、完全随机设计的方差分析
医学实验中,根据某一实验因素,用随机的方法,将受试对象分配到各组,各组分别接受不同的处理后,观察各种处理的效果,比较各组均数之间有无差别。临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;或比较某种疾病不同类型之间某一指标有无差别等。这些都是一个因素不同水平(或状态)间几个样本均数的比较,可用单因素的方差分析(one-way ANOVA)来处理此类资料。
例题:某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果见下
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
:问三组石棉矿工的肺活量有无差别?
表 三组石棉矿工的用力肺活量(L)
石棉肺患者
可疑患者
非患者
1.8
2.3
2.9
1.4
2.1
3.2
1.5
2.1
2.7
2.1
2.1
2.8
XI j
1.9
2.6
2.7
1.7
2.5
3.0
1.8
2.3
3.4
1.9
2.4
3.0
1.8
2.4
3.4
1.8
3.3
2.0
3.5
合计((Xij)
19.1
20.8
33.9
74.4((X)
nj
11
9
11
31(N)
均数 Xj
1.79
2.31
3.08
2.4(X)
( (X2ij)
35.69
48.34
105.33
189.36((X2)
从表中的测量结果可以看出,三个组31名矿工的用力肺活量测定值大小不等,这是总变异。将其分为两个比分:一是组内变异,它反映矿工用力肺活量测定值的随机误差;另一个是组间变异,它反映随机误差和石棉肺对用力肺活量的影响。
计算步骤:
(1) 建立假设和和确定检验水准
H0 :三组矿工用力肺活量的总体均数相等,(1 = (2 = (3
H1 :三组总体均数不等或不全相等 (=0.05
(2) 计算检验统计量F值
本例: C=(74.4)2 / 31=178.560
SS 总= (X2 —C = 189.36 – 178.56= 10.800
df总 = N-1 = 31-1 =30
SS 组间
df组间 = k-1 =3-1 =2
SS 组内= SS 总- SS 组间 = 10.8-9.266=1.534
df组内= N-k = 31 – 3=28
MS 组间 = SS 组间 / df组间 = 9.266 / 2 = 4.633
MS 组内 = SS 组内 / df组间 = 1.534 / 28 =0.0548
F= MS 组间 / MS 组内 = 4.633 /0.054 = 84.544
方差分析结果表
变异来源
SS
Df
MS
F
P
总
10.800
30
组间
9.266
2
4.6330
84.544
<0.01
组内
1.534
28
0.0548
(3) 、确定P值和作出推断结论 查表得P<0.01, 按(=0.05水准拒绝H0 ,接受H1,故可以认为三组矿工用力肺活量不同。
(4)、结论表明,总的说来三组矿工用力肺活量有差别,但并不表明任何两组矿工的用力肺活量均有差别,只能说至少有两组矿工的用力肺活量有差别,需进一步作两两比较。
多个样本均数的两两比较
方差分析能够推断多个样本所来自的正态总体其总体均数是否相等,但不能推断哪些总体均数之间有差别,若用两样本均数比较t检验(或u检验)对多个样本均数进行两两检验,则会增大第一类错误,特别是两两比较的次数较多时。例如六个样本均数做两两比较时,若用t检验两两比较按排列组合原理:
则需比较
次,若检验水准(每次均取0.05,则每次比较不犯第一类错误的概率为(1-0.05),15次比较都不犯第一类错误的概率为(1-0.05)15=0.4633,而此时犯第一类错误的概率不再是0.05, 而是1-(1-0.05)15=0.5367 了。因此多个样本均数的比较不宜用t检验。
以下介绍q检验
1、 多个样本均数间每两个均数之间的比较常用q检验,也称SNK (Student-New-man-Keuls)法。统计量q值的计算公式为:
( nA(nB 时)
例:试对四组人群的血清唾液酸含量作两两比较, 计算统计量q值
(1) 首先将各样本均数按由大到小顺序排列,并编上组次:
组次 1 2 3 4
组别 胃癌组 慢性胃炎组 溃疡病组 正常人组
均数 65.28 46.62 46.18 41.91
由于需反复做两两比较,为避免叙述的重复,列q检验表
四个样本均数两两比较的q检验
A与B
(1)
(2)
(3)
a
(4)
q值
(5)
q界值
(6)
P
(8)
1-4
23.37
0.574
4
40.71
3.85
<0.05
1-3
19.10
0.588
3
32.48
3.49
<0.05
1-2
18.66
0.588
2
31.73
2.89
<0.05
2-4
4.71
0.556
3
8.47
3.49
<0.05
2-3
0.44
0.571
2
0.77
2.89
>0.05
3-4
4.27
0.556
2
7.68
2.89
0.05
(3) 为两对比组样本均数差值的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
误,如第1与第4组样本均数差值的标准误为
余类推:
2、 多个实验组与一个对照组均数间的比较
医学科研中,有时设若干个实验组和一个对照组,在进行多个样本均数比较时,主要关心各实验组与对照组间有无差别,至于各实验组均数两两之间有无差别并不关心,或留以后研究,可用q’ 检验(亦称Dunnett t 检验)。 q’ 检验与q 检验类似,计算统计量q’ 值的公式为:
_1051276624.unknown
_1051278172.unknown
_1051278839.unknown
_1051279682.unknown
_1051282550.unknown
_1051278285.unknown
_1051277384.unknown
_1051270479.unknown
_1051270557.unknown
_1021729025.unknown