null
第八章
秩转换的非参数检验
第八章
秩转换的非参数检验
第二军医大学卫生统计学教研室
孟 虹
第八章
内容
财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容
第八章内容从数据的设计分类:
*第一节、配对样本资料的Wilcoxon符号秩检验
*第二节、两个独立样本比较的Wilcoxon秩和检验
*为重点
第三节、完全随机设计多个样本比较的Kruskal-Wallis H检验
第四节、随机区组设计多个样本的Friedman M检验
非参数检验的概念
非参数检验的概念
参数检验: 假定比较组数据服从某分布,通过参数的估计量( )对比较总体的参数(μ)作检验,统计上称为参数法检验(Parametric test)。如t、u检验、方差分析。
非参数检验:指在统计检验中不需要假定总体分布形式和用参数估计量( ),直接对比较组数据的分布进行统计检验的方法。称为非参数检验(Nonparametric test).
秩和检验 (Rank sum test)
非参数统计检验
秩和检验 (Rank sum test)
非参数统计检验
适用范围广,特别适用于组间比较:
1.数据分布为偏态分布或不满足参数检验方法(组间方差不齐)的计量资料.
2.有的数据为无确切值,只是>某值或<值的计量资料。
3.当比较的数据只能用严重程度、优劣等级的半定量(等级)资料组间的比较。
例:两种食物对大鼠心肌坏死面积(格子数)例:两种食物对大鼠心肌坏死面积(格子数)M1=0.6M2=0S1=7.09S2=2.72医学研究中的等级资料(效应指标)医学研究中的等级资料(效应指标)疗 效(x):痊愈、显效、有效、无效、恶化
化验结果(x):- ++ +++
体格发育 (x) :下等、中下、中等、中上、上等
心功能分级(x):I、II、III…
营养水平(x) :差、一般、好例:两组独立计量数据小样本的比较例:两组独立计量数据小样本的比较 观察值(x)
A组 7 14 22 36 40 63 98 108 n=8
B组 5 6 10 17 18 23 29 49 n=8
A组 48.50±37.88
B组 19.65±14.46
问两组均数差别有无统计意义?常用t检验用t检验,要求数据满足正态和方差齐性条件。null方差齐性检验:α=0.10
F=37.882/14.462=6.86, P=0.015,组间方差不齐。
在不满足t检验前提,如用两均数比较t检验
α=0.05, 结果:
t=2.014<t0.05,14=2.1 , P=0.065
p>0.05
容易增大Ⅱ误差概率!
秩和检验的方法----秩转换 秩和检验的方法----秩转换秩和检验的基本计算步骤:
①秩转换:将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。
②对各组”秩次”求和,称为秩和(T =∑i)。
③对各组秩和(T)做检验的方法称为秩和检验。 例: 秩转换的基本方法
例: 秩转换的基本方法
将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩,分别对各组的秩求和(T)
甲组(x) 3 5 10 20 22 秩和
秩号 (i) 1 3 5 7 8 T1=24
乙组(x) 4 9 15 25 35
秩号(i) 2 4 6 9 10 T2=31
总秩和公式:T=10(10+1)/2=55 例: 两组比较的等级数据编秩 例: 两组比较的等级数据编秩 A组 : - 、、 +、 +、 +、 ++
秩(i) : 1 2 4.5 4.5 4.5 8.5
秩和 : TA=25
B组 : +、++、++、++、+++、+++
秩(i) :4.5 8.5 8.5 8.5 11 12
秩和 : TB=53 总秩和 : TA+TB=12(12+1)/2=78null秩次:在一定程度上反映了原始数据(x)大小的信息。
秩和:反映了比较组数据的大小。
平均秩次:反映一组数据秩的平均水平,便于比较。
A组平均秩次=23.5/6=3.92
B组平均秩次=54.5/6=9.08A组(x) 3, 5, 7, 9 11 14
(i) 1 2 3 4 5 8.5 T=23.5
B组(x) 12 13 14 16 20 22
(i) 6 7 8.5 10 11 12 T=54.5第一节 配对样本比较的符号秩检验
( Wilcoxon signed rank test)第一节 配对样本比较的符号秩检验
( Wilcoxon signed rank test)何时选用配对资料的秩和检验
配对设计等级资料的比较
两组配对计量数据, 变量差值(d)不为正态分布,秩和检验效率高于参数的配对t检验。null讲义例8-1配对设计计量数据
表8-1 12份血清用两法测转氨酶结果比较讲义例8-1配对设计计量数据
表8-1 12份血清用两法测转氨酶结果比较用配对t检验?
配对符号秩检验?null对表8-1数据进行正态性检验:
概率图(probality-probality plot,P-P plot)SPSS统计软件数据点不为直线,分布不接近直线,提示本资料(d=差值)不为正态. 配对设计资料的秩和检验步骤 配对设计资料的秩和检验步骤步骤:
1.将差值(d)按绝对值大小转换为秩,给秩正负符号,如差值为0舍去。
2.求差值的正、负秩和,记为(T+) 、 (T-) 。
3.用任意一个正或负秩和(T)做检验。
4.检验方法有:
1)查表法: (对子数n≤50)*
2)正态近似法,n>50时用公式(8-1)例:表8-1 12份血清用两法测转氨酶结果比较例:表8-1 12份血清用两法测转氨酶结果比较(T+)(T-)总秩和=11(11+1)/2=66例表8-1 配对资料秩和检验步骤例表8-1 配对资料秩和检验步骤1.建立检验假设:
H0: (T +) =(T-),即两种方法测定结果值相同
H1: (T +) ≠ (T-)
α=0.05
2.编秩,求正、负秩次的秩和(T)。
3.任取正或负秩和(T) 查表确定秩和(T)的概率(p)。
做法:用(T+) 或T- 与 T0.05,n界值范围做比较。
假设两方法相等 假设两方法相等甲法 乙法 差值 正秩 负秩
2 1 1 2.5
2 1 1 2.5
1 2 -1 2.5
1 2 -1 2.5
秩和 T+ =5 5=T-null确定p值方法:查表 824页
① 如 T 在T0.05,n界值范围内,则 P>0.05 。
② 如T 等于或在 T0.05界值范围外,则 P≤0.05。
本例查表:
n=11, T界值= T0.05=10~56(双侧)
样本 T-=11.5 或 T+=54.5
均在T0.05范围内, P>0.05。
结论:按α=0.05水准, P>0.05,不拒绝H0,尚还不能认为两法测定值差别有统计意义。
附表9 ,n=11的T界值与概率(p)双侧附表9 ,n=11的T界值与概率(p)双侧T界值 5 10 13 33 53 56 61
P值 0.01 0.05 0.10 0.10 0.05 0.01
例8-1 T-=11.5 , T+=54.5
0.05<P<0.10
理论总秩和=[11(11+1)/2]=66
如H0假设成立,理论秩和T+=T-=33 配对符号秩和检验的基本思想 配对符号秩和检验的基本思想 如H0成立,则理论上差值(d)的T+或 T-秩和应相等,或样本秩和接近理论上秩和(T)。理论T=[ N(N+1)/2]/2。
如果样本秩和(T+)与理论秩和(T)相差太大,超出了事先规定的检验水准界值, 则认为H0成立可能性小,拒绝H0 。
抽样n=4,差值(d)秩可能为0,1 ,2 ,3, 4
抽样n=4,差值(d)秩可能为0,1 ,2 ,3, 4
秩和(T) 秩的组成 f 概率(p=f/16)
0 0 1 0.0625
1 1 1 0.0625
2 2 1 0.0625
3 3 1+2 2 0.125
4 4 1+3 2 0.125
5 1+4 2+3 2 0.125
6 1+2+3 2+4 2 0.125
7 1+2+4 3+4 2 0.125
8 1+3+4 1 0.0625
9 2+3+4 1 0.0625
10 1+2+3+4 1 0.062516 附表9的制作原理表8-1 12份血清用两法测转氨酶结果比较表8-1 12份血清用两法测转氨酶结果比较配对资料SPSS软件操作NNonparametric testRelated Samples表8-1 Wilcoxon Signed Ranks Test表8-1 Wilcoxon Signed Ranks Test采用参数法配对t=1.602,
P=0.137第二节 两组独立样本比较的—秩和检验第二节 两组独立样本比较的—秩和检验常用方法:
W检验(Wilcoxon rank sum test)
常见的数据形式:
计量数据的两独立样本比较
例数较少(原始数据形式)
等级数据的两独立样本组比较
例数较多(频数表形式)表8-5肺癌病人与矽肺0期工人RD值比较表8-5肺癌病人与矽肺0期工人RD值比较总T=253表8-5资料两独立样本t检验计算结果表8-5资料两独立样本t检验计算结果两独立样本秩和检验计算步骤:两独立样本秩和检验计算步骤:1. 两组变量值混合编秩求出各组秩和。
有相同x值在不同组,求平均秩。
2.对n较小组求秩和(T)做统计检验。
3.检验方法:
1)查表法:两组中较小组例数n≤10,查附表10,确定统计量(T)的概率。
2)正态近似法:
在较小组例数n>10,计算u值,见公式8-2。
例:表8-3资料秩和检验 例:表8-3资料秩和检验1.建立检验假设:
H0:两组RD值的总体分布位置相同
H1:肺癌病人RD值高于矽肺0期工人
α=0.05(单侧)
2.确定检验的统计量(T)
当n1≠n2时,取例数较小组的秩和为T。
当n1=n2,任取一个组的秩和为T。
本例:较小组 n1=10, 用查表确定T的概率。null3.本例n1=10,查附表10确定T概率(825页)
方法: 用T与T0.05,n比较,
如T在T0.05界值范围内, p>0.05,不拒绝H0
如T在T0.05界值范围外, p<0.05 , 拒绝H0
本例: n1=10,n2-n1=2的界值
查表 单侧界值 T0.05,10=89~141
本例 T=141.5 p<0.05
双侧界值T0.05,10=84~146
p>0.05
,null结论:在α=0.05水准, p<0.05,拒绝H0,两组变量值分布差别有统计意义。肺癌组平均秩次(141.5/10=14.15)高于矽肺0期组RD值次(111.5/12=9.29)。即指标(RD值)在肺癌组高于矽肺0期组。
两组秩和检验界值范围和概率(单侧)两组秩和检验界值范围和概率(单侧)例数 n1=10,n2-n1=2的界值
H0假设成立:T1理论秩和=115
秩和界值范围:
76 79 84 89 115 141 146 151 154
0.05
0.025
0.01
0.005 本例 T=141.5 p<0.05P值两组秩和检验的基本思想两组秩和检验的基本思想 如H0:“两总体观察值(x)的分布相同”假定成立, 则n1组样本的秩和(T1)应接近n1组理论秩和T= n1(N+1)/2。
同理,n2组样本秩和(T2)与应与n2理论秩和T=n2(N+1)/2相差不大。
如任意组样本秩和与理论秩和相差悬殊,超出相应界值范围,即P<0.05 ,表示H0假定成立的概率较小,拒绝H0假定。
例:两组变量值分布相等,n1=n2例:两组变量值分布相等,n1=n2甲组(x1) 2 4 5 8 样本秩和
秩次 1.5 3.5 5.5 7.5 18
乙组(x2) 2 4 5 8
秩次 1.5 3.5 5.5 7.5 18
总秩和=N(N+1)/2=8(8+1)/2=36
各组理论秩和=
各组平均秩次=(N+1)/2=4.5例:两组变量值例数不相等例:两组变量值例数不相等甲组(x) 2 4 5 5 样本秩和
秩次 1.5 3.5 6 6 17
乙组(x) 2 4 5
秩次 1.5 3.5 6 11
假设两组分布相等
甲组理论秩和=4(7+1)/2=16
乙组理论秩和=3(7+1)/2=12
样本与理论差越小,H0成立可能性越大.(二)u检验法( 例数超出附表10范围)(二)u检验法( 例数超出附表10范围)
采用公式8-2计算u值,确定p值。
公式8-2U≥1.96,p≤0.05T为n小的组秩和 表8-6 两组HbCO%含量的比较 表8-6 两组HbCO%含量的比较 HbCO%含量
比较组 很低 低 中 偏高 高 合计
吸烟 1 8 16 10 4 39
不吸烟 2 23 11 4 0 40
问两组HbCO%含量差别有无统计意义?问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
:
这是什么资料?
可以用t检验、χ2检验比较组间差别吗?讲义表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较H0:两组HbCO%含量分类构成分布相等本例χ2检验=15.079 p=0.001null两组等级数据的秩和比较表8-6计算步骤计算步骤1.建立检验假设:
H0:两组观察值的总体分布位置相同
H1:两组观察值的总体分布位置不同
α=0.05
2.两组变量混合编秩,求各组秩和
3.确定检验的统计量(T)
方法同前:本例T=1917(例数较小组)
例: 表8-6频数表资料nullu=3.7023>2.58,p<0.01校正系数null 吸烟组 不吸烟组 总秩和
例数 39 40
样本秩和 1917 1243 3160
理论秩和 1560 1600 3160
平均秩次 49.15 31.07
结论:在α=0.05水准, p<0.01,拒绝H0,两组变量值分布差别有统计意义,吸烟组工人的HbCO (平均秩次为1917 /39=49.15)高于不吸烟组(平均秩次31.07). 例: 表8-6频数表资料
例表8-6 两组HbCO%含量的比较
SPSS统计软件数据录入与操作例表8-6 两组HbCO%含量的比较
SPSS统计软件数据录入与操作1.数据录入(频数表数据)
2.数据加权:
data weight cases
3.Aanlyze
Nonparametric test
Independent Samples
表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较表8-6 两组HbCO%含量的比较第三节 多组资料的秩和检验
(Kruskal-Wallis H检验)第三节 多组资料的秩和检验
(Kruskal-Wallis H检验)1.多个独立样本资料的比较
编秩方法同两组资料(不配对)相同。
计算检验公式为H(公式8-4)
null①查表法(总例数N≤15时),用的较少。
②N>15时, 用H值与卡方界值做比较。
3.如p 值有统计意义,做组间的两两比较
方法① 两两比较公式 讲义(8-6)
方法② α分解 α‘=0.05/组数2.确定H统计量的p 值 null表8-9 三个独立样本的比较变量值为百分率,不符合正态要求。null表8-11 多个样本的等级资料比较nullN=60>15,查χ2 表确定H值的概率结论:四组疾病患者的嗜酸性细胞不全相同。二、多个独立样本两两比较二、多个独立样本两两比较表8-10资料三组间平均秩和的两两比较
比较组 χ2 df p 值
1与2组比较 6.72 >3.84 1 p<0.05
1与3组比较 8.15 1 p<0.05
2与3组比较 0.016 1 p>0.05 一、 秩和检验的优缺点
优点: 不考虑变量的分布,计算简单。常用于不满足参数检验的计量数据和等级数据的比较。
缺点: 对于满足参数检验的资料,秩和检验的效率低于参数检验(t,F检验)。
二、秩和检验和χ2检验的区别
秩和检验给予等级变量“秩”的大小, χ2检验不考虑等级信息,仅考虑实际频数与理论频数的差别。故等级资料用秩和检验效率更高。
小 结讲义表8-11四种疾病患者痰液内嗜酸性细胞讲义表8-11四种疾病患者痰液内嗜酸性细胞null秩和检验检验单向有序数据,反应变量数据为等级时单向有序数据,反应变量数据为等级时 表a 某病两组疗效的比较
组别 无效 有效 显效 痊愈 合计
试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57
对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45
Total 39 33 23 7 102
试验组有效率=68%,对照组=53%
计算χ2=4.81, p=0.186, p>0.05
两组秩和检验,u=2.64,p<0.01
本次内容结束
谢 谢 大 家