nullnull均值差异性假设检验(一)T检验
假设检验是统计推断的一种重要手段,主要用于比较群体间的某种属性的差异性。使用一定的统计检验,以确定差异程度:是显著的差异还是不显著的差异。
均值差异性假设检验的概念
一、基本概念
⒈对样本的总体分布或分布参数进行假设H0
例:样本为正态分布
总体样本与原设样本的方差差异不显著。
零假设:总体样本与原设样本的均值差异不显著。
⒉对两组样本,或按分组变量分开的两组样本,求检验统计量。
例如:求Z检验量 ,由Z查
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
可得相伴概率P
⒊把P与显著度标准α比较(可以根据实际情况定为0.01,0.05,或0.1)
P> α大概率事件表示假设正确,或称可以接受。
P<= α 小概率事件假设不成立,或称不能接受。null⒋避免两类错误
α类错误:拒绝了正确的H0假设,如显著度标准定高了,该接受的没被接受,即被认为是小概率事件而被拒绝。
β类错误:接受了错误的H0假设,如显著度标准定低了,不该接受的被接受了,即被认为是大概率事件而接受了。
有效解决办法:
⑴适当增加原设样本的数量。
⑵恰当地选择显著度标准,结合所研究的问题可以制定本专业认可的显著度标准。
二、假设检验的分类
⒈参数检验(Parameteric Test)
已知样本满足某种分布,不知分布参数,对参数进行假设检验。
⒉非参数检验(None -Parameteric Test)
不知样本满足何种分布,先检验样本分布。假设满足某种标准的分布如:正态分布、泊松分布,检验这种假设可否接受。null⒊零假设H0和备择假设H1
H0:总体样本分布与原设样本分布无显著差异
H1:总体样本分布与原设样本分布有显著差异
H0为大概率事件;H1为小概率事件
例如:全区学生 μ=65分, =8.8 (标准差)
某校学生平均67分,n= 83人
计算: Z=
由Z 查表得 P=0.0384<0.05
H0不能接受,H1出现了。
⒋统计推断的判据
样本统计量的值,在以期望值μ为中心的分布中出现的概率。
判据 P〈= α拒绝H0 P 〉 α接受H0
上例题结果表明,用该学校的学生成绩情况不能正确反映全区学生的总体情况。解决方法是重新抽样,或者是增大原设样本的数量。null单样本的T检验
单样本的T检验(One-sample T Test)用于将某一个变量的均值与特定的值进行比较,检验其差异的显著程度。
H0假设样本均值与设定的检验值差异不显著。
一、检验条件
变量的取值应当满足正态分布。
二、操作步骤
执行
[Analyze][Compare Means][One-Sample T Test]
检验变量移动到:Test Variables窗口
在Test value中输入检验值。
“Options”中可以设置:
置信区Confidence:例如95%(缺省值)
缺失值Missing Value:
Exclude cases analysis by analysis variable表示排除在做统计分析的变量中含有缺失值的个案。
Exclude cases listwise表示排除在检验变量列表中开列的变量中含有缺失值的个案。null三、检验结论(例题ZKD004.SAV)
在输出报告中可以显示两部分内容:
表一:
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
22 161.0909 1.7971 .3831
表一计算了变量的有效个案数,平均值,标准差和标准误。
表二:
Test Value = 162 t df Sig. (2-tailed) Mean 95% Confidence
Difference Interval of the
Difference Lower Upper-2.373 21 .027 -.9091 -1.7059 -.1123
表二计算了变量的T值,自由度,双侧显著度水平,均值与检验值的差,置信区的范围。
置信区的上边界: Test Value + Upper= 162 -.1123
置信区的下边界: Test Value + Lower = 162 -1.7059null四、命令语句
T-TEST
/TESTVAL=检验值
/MISSING=ANALYSIS
/VARIABLES=检验变量
/CRITERIA=CIN(.95)
两独立样本均值差异性检验
一、检验条件
1.两组不相关样本,均呈正态分布。
2.一个或多个因变量,一个自变量(两水平)
个案数超过50,自动转换为Z检验
例如:在研究体重与性别的关系时,体重作为因变量,则性别就是自变量。自变量的取值为两种水平:M和F。T-检验是检验不同水平下的均值差异是否显著。
H0假设:两组样本均值的差异不显著。null二、 T检验概念
方差差异不显著的T-检验为齐次性T检验:
t=
其中:σ2=
自由度D.F.=n1+n2-2
若两样本来自同一总体:
t=null方差差异显著的T-Test为非齐性T检验:
t’=
自由度
null三、操作步骤
执行:
[Analyze][Compare Means][Independent Sample T Test]
选择检验变量到Test Variables变量窗口中
分组变量到Grouping Variable变量窗口中
定义分组值在Define Groups中
如果分组变量是数值型变量,则分组值可以是两个不同的变量值,例如:1,2。也可以是一个分界值,例如:1.5,该分界值表示大于等于该值的分成一组,而小于该值的分为另一组。
“Options”中可以设置:
置信区Confidence:例如95%(缺省值)
缺失值Missing Value:
Exclude cases analysis by analysis variable表示排除在做统计分析的变量中含有缺失值的个案。
Exclude cases listwise表示排除在检验变量列表中开列的变量中含有缺失值的个案。null四、检验结论
在输出报告中可以显示两部分内容:
表一: Group Statistics
组别 N Mean Std. Deviation Std. Error Mean
>= 2.00 12 162.0000 1.7581 .5075
< 2.00 10 160.0000 1.1547 .3651
表一计算了变量的有效个案数,平均值,标准差和标准误。
表二:Independent Samples Test
Levene's t-test for Equality of Means
Test for Equality of F Sig. t df Sig. (2-tailed)
Variances 1.699 .207 -3.080 20 .006 -3.199 19.085 .005
Mean Differenc Std. Error Difference 95%Confidence
Interval of the Difference Lower Upper
-2.0000 .6494 -3.3545 -.6455
-2.0000 .6252 -3.3082 -.6918null 分析报告中首先应当观察方差齐性检验的结果。Levene ‘s Test for Equality of Variances的结果Sig为.207,表明方差差异是不显著的,即方差是齐性的。从而在T检验中应当查看Equal variances assumed 项,表中该项Sig (2-tailed) 为.006,表明差异是显著的,则拒绝H0表示差异显著。
五、命令语句
T-TEST
GROUPS=分组变量名(值1,值2) 或分界值(1 2)
/MISSING=ANALYSIS
/VARIABLES=检验变量
/CRITERIA=CIN(.95) .
其中值1、值2为指定两组的取值。如果用分界值将以此值为界分为两组:大于等于为一组,小于为另一组。null配对样本的均值差异性检验
一、配对T检验原理
配对T检验原理仍然研究两组不同变量的观测值的均值差异的。所不同的是:配对T检验研究的不是两组观测值总体均值的差异,而是同一个案的不同变量观测值之间的差异。
例如:某车间的n台机器用两种不同的工艺生产产品,工艺1的产量为x ,工艺2的产量为y。
机器号 工艺1的产量 工艺2的产量
1 x1 y1
2 x2 y2
...
n xn yn
对不同机号的机器产量加以比较没有意义,只能对同一机器的不同工艺进行比较。null考虑两个极端情况:
①如果有Σ(xi-yi)=0,则没充分的理由说哪种工艺的产量比另一种高还是低。
②但是只要Σ(xi-yi)≠0 ,无论是xi
yi, (i=1,2...n) 则至少可以说两种工艺的产量是不同的。
Σ(xi-yi)与0的差异是否显著就反映出两种工艺的差异是否显著。
特点:同一个案中两个变量值有对应关系,即配对样本的检验。
H0假设两组配对样本均值的差异不显著。
二、操作步骤
执行
[Analyze][Compare Means][Paired-Sample T Test]
选择两个检验变量到Paired Variables变量窗口中null“Options”中可以设置选项:
置信区Confidence: (缺省值95%)
缺失值Missing Value:
Exclude cases analysis by analysis variable表示排除在做统计分析的变量中含有缺失值的个案。
Exclude cases listwise表示排除在检验变量列表中开列的变量中含有缺失值的个案。
三、检验结论
在输出报告中显示内容:
Paired Samples Test
Paired Differences
Mean Std. Deviation Std. Error Mean t df Sig. (2-tailed)
-2.1818 2.2279 .6717 -3.248 10 .009
95% Confidence
Interval of the Difference
Lower Upper
-3.6786 -.6851null四、命令语句Syntax
T-TEST
PAIRS= 变量名... WITH 变量名...(PAIRED)
/CRITERIA=CIN(.95)