实验二 SPSS的参数检验和非参数检验
(验证性实验 4学时)
1、 目的要求:熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。
2、 实验内容:使用指定的数据按实验教材完成相关的操作。
3、 主要仪器设备:计算机。
练习:
1、 给幼鼠喂以不同的饲料,用以下两种方法
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
实验:
方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下:
鼠号
1
2
3
4
5
6
7
8
9
饲料1
33.1
33.1
26.8
36.3
39.5
30.9
33.4
31.5
28.6
饲料2
36.7
28.8
35.1
35.2
43.8
25.7
36.5
37.9
28.7
方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:
甲组饲料 1:
29.7
26.7
28.9
31.1
31.1
26.8
26.3
39.5
30.9
33.4
33.1
28.6
乙组饲料2:
28.7
28.3
29.3
32.2
31.1
30.0
36.2
36.8
30.0
请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显著不同。
2、 为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天三种品牌牛奶的日销售额数据,如下
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
所示:
星期
包装1
包装2
包装3
1
11.40
5.80
3.50
2
6.40
8.60
7.50
3
13.80
7.00
9.80
4
11.20
10.80
10.4
5
8.30
8.80
9.3
6
7.30
6.20
2.5
请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。
1 参数检验概述
假设检验的基本思想
.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立;
.采用逻辑上的反证法,依据统计上的小概率原理。
2 单样本的T检验
2.1检验目的:
l 检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。
l 要求样本来自的总体服从或近似服从正态分布。
2.2 单样本T检验的实现思路
l 提出原假设:
l 计算检验统计量和概率P值
● 给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。
2.3 单样本t检验的基本操作步骤
1、选择选项Analyze-Compare means-One-Samples T test,出现窗口:
2、在Test Value框中输入检验值。
3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Exclude cases listwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。
至此,SPSS将自动计算t统计量和对应的概率p值。
3 两独立样本的T检验
3.1 两独立样本T检验的目的
l 利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异;
l 两独立样本的样本容量可以相等,也可以不相等;
l 样本来自的总体服从或近似服从正态分布。
方差齐性检验(Levene F方法):
l 计算两组样本的均值
● 计算各个样本与本组均值的平均离差绝对值;
● 利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。
● 在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。
3.2 两独立样本T检验的实现思路
l 提出原假设: 两总体均值不存在显著差异:
● 计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后再选择合适的T统计量计算观测值和概率P值;
● 根据显著性水平和概率P值进行统计决策。
3.3 两独立样本t检验的基本操作步骤
进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个总体,还应定义一个分类变量。
SPSS两独立样本t检验的基本操作步骤是:
1、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口
2、选择检验变量到Test Variable(s)框中。
3、选择总体标志变量到Grouping Variables框中。
4、单击Define Groups按钮定义两总体的标志值。其中:Use specified values表示分别输入两个不同总体的变量值;Cut point框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总体。
5、两独立样本t检验的Option选项含义与单样本t检验的相同。
至此,SPSS会首先自动计算F统计量,并计算在两总体相等会不相等下的均值差的方差和t统计量的观测值以及各自对应的双尾概率p值。
4 两配对样本的T检验
4.1 两配对样本T检验的目的
l 利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异;
l 两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;
l 样本来自的总体服从或近似服从正态分布。
4.2 两配对样本T检验的实现思路
l 提出原假设:两总体均值不存在显著差异;
l 选择检验统计量。两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差值,对差值变量求平均。检验配对变量均值之间差异是否显著,实质是检验差值变量的均值与0之间差异的显著性;
l 计算样本统计量观测值和概率P值;
l 根据显著性水平和概率P值进行统计推断。
4.3 两配对样本t检验的基本操作步骤
1、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口
2、把一对或若干对检验变量选择到Paired Variables框。
3、两配对样本t检验的Option选项含义与单样本t检验相同。
至此,SPSS将自动计算t统计量和对应的概率p值。
非参数检验
非参数检验的概念
是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。
这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。
1 单样本非参数检验
l 总体分布的chi-square检验
(1)目的:
根据样本数据推断总体的分布与某个已知分布是否有显著差异---吻合性检验。适用于分类资料的统计推断
(2)基本操作步骤:
l 菜单:analyze->nonparametric test->chi square
l 选定待检验变量入test variable list 框
l 确定待检验个案的取值范围(expected range)
l get from data:全部样本
l use specified range:用户自定义个案范围
l 指定期望频数(expected values)
l all categories equal:所有类别有相同的构成比
l value:用户自定义构成比
l 二项分布检验
l 在现实生活中有很多的取值是两类的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是P,则另一类出现的概率就是1-P。这种分布称为二项分布。
l 原假设:样本来自的总体与指定的二项分布无显著差异
l K-S检验
(1)目的:
利用样本数据推断总体是否服从某个理论分布(正态分布、均匀分布、指数分布和泊松分布)。
l 适用于探索连续随机变量的分布情况
(2)基本步骤:
l 菜单选项:analyze->nonparametric tests->1-sample k-s
l 选择待检验的变量入test variable list 框
l 指定检验的分布名称(test distribution)
l normal:正态分布 uniform:均匀分布
l possion:泊松分布 exponential:指数分布
变量值的随机性检验
(1)目的:利用样本数据对总体可能出现的变量值是否随机进行检验.
(2)基本假设: H0:总体可能出现的变量值是随机的.
(3)基本方法:
l 观察样本序列出现了多少游程(run).
l 游程是样本序列中连续出现的变量值的次数.
l 一般出现太多或太少的游程表示变量值序列有一定的非随机性.
(4)基本操作步骤:
l 菜单选项:analyze->nonparametric test->runs
l 选择待检验的 变量入test variable list框
l 指定如何计算游程(cut point)
l median:以中位数为界线 mode:以众数为界线
l mean:以均值为界线 custom:以用户指定值为界线
l 小于界线值的为一类;大于等于界线值的为另一类.
l 两独立样本非参数检验
(一)目的
l 由独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。
(二)基本假设
l H0:两总体分布无显著差异(两样本来自同一总体)
(三)数据要求
l 样本数据和分组标志
(四)基本方法
1.曼-惠特尼U检验(Mann-Whitney U):平均秩检验
l 将两样本数据混合并按升序排序
l 求出其秩
l 对两样本的秩分别求平均
l 如果两样本的平均秩大致相同,则认为两总体分布无显著差异
2.k-s检验
l 将两样本混合并按升序排序
l 分别计算两个样本在相同点上的累计频数和累计频率
l 两个累计频率相减.
l 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
3.游程检验(Wald-Wolfowitz runs)
l 将两样本混合并按升序排序
l 计算分组标志序列的游程数
l 如果游程数较大,则说明是由于两类样本数据充分混合的结果,即:认为两总体分布无显著差异.
l 如果两样本中有相同的样本值,则会使游程数发生变化.系统会作出提示.
4.极端反应检验(Moses Extreme Reacions)
l 将一组样本作为控制样本,另一组样本作为实验样本。
l 以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。
l 如果实验样本没有出现极端反应,即:认为两总体分布无显著差异.
l 相反,如果实验样本存在极端反应,则认为两总体的分布存在显著差异。
(五)基本操作步骤
l 菜单选项:analyze->nonparametric tests->2 independent sample
l 选择待检验的变量入test variable list框
l 选择一种或几种检验方法
l 多独立样本非参数检验
(一)目的:
l 由独立样本数据推断多个总体的分布是否存在显著差异.
(二)基本假设:
l H0:多个总体分布无显著差异.
(三)数据要求:
l 样本数据和分组标志
(四)基本方法:
1.相同中位数检验(median)
l 判断多个总体是否是具有相同的中位数
l 将多个样本数混合并按升序排序
l 求出混合样本序列的中位数
l 如果各独立样本中大于此中位数的个案数和小于此中位数的个案数大致相同,则认为总体有相同的中位数
2.k-w检验(推广的平均秩检验)
l 将多个样本数混合并按升序排序,求出其秩
l 对多个样本的秩分别求平均秩序
l 如果各样本的平均秩大致相等,则认为多个总体分布无显著差异
3.J-T检验
l 计算一组样本观察值小于其他组样本的观察值的个数。
l 计算所有情况下的J-T统计量,并计算这些J-T值的均值和标准差。
l 如果观测的J-T统计量远大于或远小于J-T均值,那么可以认为,按照样本标志值的升序,样本数据有明显上升或下降趋势,从而能够判定样本来自的多个总体分布存在显著差异。
(五)基本操作步骤:
l 菜单选项:analyze->nonparametric test->k independent samples
l 选择待检验的变量入test variable list框
l 选择一种或两种检验方法
l 两配对样本非参数检验
(一)含义:
l 由配对样本数据推断两总体分布是否存在显著差异.
(二)基本假设:
l H0:两总体分布无显著差异.
(三)数据要求:
l 配对样本的样本量是相同的;
l 各样本的先后次序是不能随意更改的。
(四)基本方法:
1.变化显著性检验(McNemar)
l 将研究对象作为自身的对照者检验其“前后”的变化是否显著
l 关心的是发生变化的两格中的频数变化.如果频数变化相当,则认为无显著变化.
数据要求只能是二分值数据
2.正负符号检验(sign)
l 将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号
l 如果正号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化
3.符号平均秩检验(wilcoxon)
正负符号检验只考虑了两总体数据变化的性质,而没有注意其变化的程度.符号平均秩检验注意到了这点
l 将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号.
l 将差值按升序排序,并求其秩.分别计算正号秩和负号秩总和
l 如果正秩和负秩相当,认为正负变化程度相当,两总体无显著差异.
l 例如:为检验某种新训练方法是否有助于提高跳远运动员的成绩,收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩来进行判断
(五)基本操作步骤:
l 菜单选项:analyze ->nonparametric->2 paired sample
l 选择待检验的两配对变量入test pair(s) list框
l 选择一种或几种检验的方法
l 多配对样本非参数检验
(一)目的:
由多配对样本数据推断多个总体分布是否存在显著差异.
(二)基本假设:
H0:各总体分布无显著差异.
(三)数据要求:
多配对的样本数据.
(四)基本方法:
1.推广的平均秩检验(双向Friedman检验)
l 将每个个案的变量值数据按升序排序,并求其秩
l 求各样本的平均秩
l 如果平均秩相当,则认为各总体分布无显著差异
l 例:比较三种促销形式对商品销售的影响。
2. Cochran Q检验
基本思想:认为每行中取1的个数是可确定的。
适合对二值品质型数据的分析。
3.谐同系数检验(Kendall W检验)
l 谐同系数检验方法与推广的平均秩检验方法相同
l 主要用在分析评判者的评判标准是否一致和公平
l 通过谐同系数W进行判定.W表示了横向各样本数据之间相关的强弱程度,取值在0和1之间.越接近1,则表示相关性越强,即:评判者的评判标准一致.
l 例:6名歌手参加比赛,4名评委进行评判打分,现判断这4个评委的评判标准是否一致。
(五)基本操作步骤:
l 菜单选项:analyze->nonparametric->k paired sample
l 选择待检验的若干变量入test variables框
l 选择一种或几种检验的方法