首页 spss教程03

spss教程03

举报
开通vip

spss教程03nullSPSS 16实用教程SPSS 16实用教程第3章 统计描述 nullnullnull SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。 本章主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。 null3.1 均值(Mean)和均值标准误差(S.E.mean)3.1.1 统计学上的定...

spss教程03
nullSPSS 16实用教程SPSS 16实用教程第3章 统计描述 nullnullnull SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。 本章主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。 null3.1 均值(Mean)和均值 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误差(S.E.mean)3.1.1 统计学上的定义和计算公式 定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 计算公式如下。null 总体平均数:若一组数据X1,X2,…,XN,代表一个大小为N的有限总体,则其总体平均数为 null 样本平均数:若一组数据x1,x2,…,xn,代表一个大小为n的有限样本,则其样本平均数为 null 样本数据来自总体。样本的统计描述量可以反映总体数据的特征,但由于抽样等原因,使得样本数据不一定能够完全准确地反映总体,它可能与总体的真实值之间存在一定的差异。进行不同次抽样,会得到若干个不同的样本均值,它们与总体均值存在着不同的差异。 均值标准误差(Standard Error of Mean,S.E. mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。 null3.1.2 SPSS中实现过程 研究问题 求某班级学生在一次数学测验中的平均成绩,数据如表3-1所示。 表3-1 某班级的数学成绩null 实现步骤图3-1 在菜单中选择“Frequencies”命令null 图3-2 “Frequencies”对话框(一) null图3-3 “Frequencies:Statistics”对话框(一) null3.1.3 结果和讨论null3.2 中位数(Median)3.2.1 统计学上的定义和计算公式 定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。null 计算公式:一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置 上的数;如果N为偶数,中位数则是该数列中第 与第 +1位置上两个数值的平均数。 null3.2.2 SPSS中实现过程 研究问题 求某班级学生身高的中位数,数据如表3-2所示。 表3-2 某班级学生的身高null 实现步骤图3-4 “Frequencies:Statistics”对话框(二)null3.2.3 结果和讨论null3.3 众数(Mode)3.3.1 统计学上的定义和计算公式 定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。 计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。null3.3.2 SPSS中实现过程 研究问题 求某医院当天出生新生儿的体重的众数,数据如表3-3所示。表3-3 新生儿的体重null 实现步骤图3-5 “Frequencies:Statistics”对话框(三)null3.3.3 结果和讨论null3.4.1 统计学上的定义和计算公式3.4 全距(Range) 定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值-最小值。 null3.4.2 SPSS中实现过程 研究问题 求某班级学生数学成绩的全距,数据如表3-4所示。 表3-4 某班级的数学成绩null 实现步骤图3-6 “Frequencies:Statistics”对话框(四)null3.4.3 结果和讨论null3.5.1 统计学上的定义和计算公式3.5 方差(Variance)和标准差(Standard Deviation) 定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。nullnull3.5.2 SPSS中实现过程 研究问题 求某班级学生数学成绩的方差和标准差,数据如表3-1所示。null 实现步骤图3-7 在菜单中选择“Descriptives”命令null 图3-8 “Descriptives”对话框(一) null图3-9 “Descriptives:Options”对话框(一)null3.5.3 结果和讨论null3.6 四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)3.6.1 统计学上的定义 定义:四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。null 十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,…,D9,表示10%的数据落在D1下,20%的数据落在D2下,…,90%落在D9下。null 百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,…,P99,表示1%的数据落在P1下,2%的数据落在P2下,…,99%落在P99下。null3.6.2 SPSS中实现过程 研究问题1 求某班级学生数学成绩的四分位数,数据如表3-1所示。 null 实现步骤图3-10 “Frequencies:Statistics”对话框(五)null 研究问题2 测量54个某种机械零件的重量(克),求零件重量的D6,数据如表3-5所示。表3-5 零件的重量null 实现步骤图3-11 “Frequencies:Statistics”对话框(六)null图3-12 “Frequencies:Statistics”对话框(七)null 研究问题3 测量出54个某种机械零件的重量(克),求零件重量的P37,数据如表3-5所示。null 实现步骤图3-12 “Frequencies:Statistics”对话框(七)null3.6.3 结果和讨论研究问题1的程序运行结果如下表所示。null研究问题2的程序运行结果如下表所示。null研究问题3的程序运行结果如下表所示。null3.7 频数(Frequency)3.7.1 统计学上的定义和计算公式 定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。null 变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。null3.7.2 SPSS中实现过程 研究问题 10个学生在某次数学、语文、化学考试中成绩如表3-6所示,试求学生在3门课程上的频数分布。null表3-6 学生成绩null 实现步骤图3-13 “Frequencies”对话框(二)null3.7.3 结果和讨论程序运行结果如下表所示。null3.8 峰度(Kurtosis)3.8.1 统计学上的定义和计算公式 定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为null3.8.2 SPSS中实现过程 研究问题 某班级40个学生的年龄分布如表3-7所示,试求学生年龄峰度。表3-7 学生年龄null 实现步骤图3-14 在Data菜单中选择“Weight Cases”命令null3.8.3 结果和讨论null3.9 偏度(Skewness)3.9.1 统计学上的定义和计算公式 定义:偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算公式为null 这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。null3.9.2 SPSS中实现过程 研究问题 某班级41个学生的身高分布如表3-8所示,试求学生身高分布偏度。 表3-8 学 生 身 高null 实现步骤图3-17 “Frequencies:Statistics”对话框(九)null3.9.3 结果和讨论null3.10 标准化Z分数及其线性转换3.10.1 统计学上的定义和计算公式nullnull3.10.2 SPSS中实现过程 研究问题1 求某班级学生数学成绩的Z分数,数据如表3-1所示。 null 实现步骤图3-18 “Descriptives”对话框(二)null图3-19 “Descriptives:Options”对话框(二) null 图3-20 数据编辑窗口 null 研究问题2 从图3-20中可以看到学生数学成绩的Z分数有正有负,而且小数点位数较多,因此可以把它线性转换为T分数。null 实现步骤图3-21 在菜单中选择“Compute Variable”命令null 图3-22 “Compute Variable”对话框 null 图3-23 “Compute Variable:Type”对话框null图3-24 数据编辑窗口null3.10.3 结果和讨论 从Z分数(图3-20)和T分数(图3-24)的结果中可以看出此班级学生数学成绩的T分数比之前的Z分数简洁多了,比较起来一目了然。null3.11 探 索 分 析3.11.1 统计学上的定义和计算公式 定义:调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。null1.探索分析的 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 包括下面几个方面  检查数据是否有错误:过大或过小的数据均有可能是奇异值、影响点或错误数据。要找出这样的数据,并分析原因,然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大,不能真实反映数据的总体特征。null  对数据规律的初步观察:通过初步观察获得数据的一些内部规律,例如,两个变量间是否线性相关。null2.探索分析的考察方法 探索分析一般通过数据文件在分组与不分组的情况下,获得常用统计量和图形。一般以图形方式输出,直观帮助用户确定奇异值、影响点、进行假设检验,以及确定用户要使用的某种统计方式是否合适。null3.正态分布检验 常用的正态分布检验是Q-Q图。本例中进行了正态分布检验。null4.方差齐次性检验 对数据分析不仅需要进行正态分布检验,有时候还需要比较各个分组的方差是否相同,这就要进行方差齐次性检验。例如,在进行独立右边的T检验之前,就需要事先确定两个数据的方差是否相同。null 如果通过分析发现各个方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。在探索分析中可以使用Levene检验。 null Levene检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。如果得到显著性水平小于0.05,那么就可以拒绝方差相同的假设。null3.11.2 SPSS中实现过程 研究问题 20名10岁少儿的身高(cm)资料,数据如表3-9所示,试作探索性分析。null表3-9 身高数据null 实现步骤图3-25 在菜单中选择“Explore”命令null图3-26 “Explore”对话框null图3-27 “Explore: Statistics”对话框null 图3-28 “Explore:Plots”对话框 null 图3-29 “Explore:Options”对话框 null3.11.3 结果和讨论 在结果输出窗口中将看到如下统计数据。 (1)首先输出如下个案观察量摘要表,如下表所示。 null(2)然后输出如下 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 。null (3)接着输出如下4个不同权重下作中心趋势的粗略最大似然确定数, null (4)再接着输出百分位数,也是分组后的百分位数,如下表所示。null (5)分别输出两个组中的最大5个数和最小5个数,并且包括这些值对应的ID,如下表所示。null(6)输出方差齐次性检验结果。 null(7)系统还进行数据的茎叶情形描述。图3-30 男孩身高的茎叶图 null 图3-31 女孩身高的茎叶图null(8)系统输出箱图,如图3-32所示。图3-32 箱图null (9)输出Spread vs. Level图,如图3-33所示。图3-33 Spread vs. Level图null (10)输出身高正态概率图(Normal Q-Q Plot of身高),如图3-34所示。图3-34 男孩身高变量的正态概率图null图3-35 女孩身高变量的正态概率图null (11)输出离散正态概率图(Detrended Normal Q-Q Plot of身高),男孩身高如图3-36所示,女孩身高如图3-37所示。横坐标是身高,纵坐标是和正态分布的偏离。null图3-36 男孩身高离散正态概率图null图3-37 女孩身高离散正态概率图null3.12 交叉列联表分析3.12.1 统计学上的定义和计算公式 定义:前面的分析都是对单个变量的数据分布情况进行分析。但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。null 交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。null常用的衡量变量间相关程度的统计量是简单相关系数(参见本书有关章节),但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此需要根据变量的性质,选择其他的相关系数,如Kendall等级相关系数、Eta值等。nullSPSS提供了多种适用于不同相关系数的相关关系,这些检验的零假设是:行和列变量之间彼此独立,不存在显著的相关关系。SPSS将自动给出检验的相伴概率,如果相伴概率小于显著性水平0.05,那么应拒绝零假设,认为行列变量之间彼此相关。null计算公式如下。 (1)卡方统计量检验是常用的检验行列变量之间是否相关的方法。交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式为null卡方统计量服从(行数−1)×(列数−1)个自由度的卡方统计,SPSS在自动计算卡方统计量后,还会给出相应的相关概率。null(2)Contingency coefficient:列联系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为 其中,N为样本系数null (3)Phi and Cramer‘s V:ψ系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为 数值界于0~1之间,其中K为行数和列数较小的实际数。null3.12.2 SPSS中实现过程 研究问题 用两个班级学生进行两个感冒疫苗的试验,两个班级学生患感冒结果如表3-10所示,问两个班级学生的患病比例有无差别。null表3-10 两班级学生的患病情况null 实现步骤图3-38 “Weight Cases”对话框null图3-39 在菜单中选择“Crosstabs”命令null图3-40 “Crosstabs”对话框null图3-41 “Crosstabs:Statistics”对话框null图3-42 “Crosstabs:Cell Display”对话框 null图3-43 “Crosstabs:Table Format”对话框null3.12.3 结果和讨论(1)先输出如下个案处理摘要表。 null (2)下面所示表格是“班级”变量和“患病”变量的交叉列联表结果表格。 null(3)交叉分组下频数分布图形,如图3-44所示。null(4)输出卡方统计结果表。null(5)输出相对危险度表格如下所示。 null3.13 多选项分析3.13.1 统计学上的定义和计算公式 定义:多选项分析是对多选项问题的分析方法。所谓多选项问题,就是一个问题的答案都是顺序变量或名义变量,并且允许选择的答案可以有多种组合。 对于多选项问题,分解(编码方案)的方法有两种。null1.多选项二分法(Multiple Dichotomies Method) 这种方法将每个可能的答案设置为一个SPSS变量,变量的取值有两个,分别表示选中或没选中。这种方法的缺点是需要的变量数比较多。比如一道题目有6个选项,则一道多选题目就需要用6个变量来表示。好处是比较简单。null2.多选项分类法(Multiple Category Method) 多选项分类法首先估计多选项问题可能出现的答案个数。比如一个多选题,如果最多有3个答案,那么就设置3个SPSS变量,分别用来存放3个可能的答案。如果某个案的答案只有两个,那么第3个SPSS变量取值为缺失值。null 采用多选项分类法,进行普通的频数分析或交叉列联表分析有时候不能达到我们的要求。比如,我们要了解某选项的选中次数,就需要将3个变量中该选项的次数都累加起来,而不仅仅是一个变量中该选项的累加。null 针对这种情况,SPSS提供了多选项分析方法,专门针对多选项问题。SPSS在处理的过程中会自动地将3个变量中相同答案的频率累加起来。null3.13.2 SPSS中实现过程 研究问题1 某商场对6种品牌的电视机进行消费者满意度调查,随机调查了20位消费者,让他们选出最满意的3个电视机品牌,收集到相应的数据,如表3-11所示。试用多选项二分法利用SPSS对该问题进行分析,包括频数分析和交叉列联表分析。 null表3-11 20名消费者调查情况null 实现步骤图3-45 在菜单中选择“Define Variable Sets”命令null图3-46 “Define Multiple Response Sets”对话框(一)null图3-47 在菜单中选择“Frequencies”命令null图3-48 “Multiple Response Frequencies”对话框(一)null图3-49 “Multiple Response Crosstabs”对话框(一)null图3-50 “Multiple Response Crosstabs:Define Variable”对话框 null图3-51 “Multiple Response Crosstabs:Options”对话框(一)null 研究问题2 上面实现过程是采用多选项二分法,本例采用多选项分类法对该问题进行分析。在本次调查中,每个被调查人最多选择3个品牌,因此有3个变量,用来保存每个被调查人的选择,数据表格如3-12所示。null表3-12 20名消费者调查情况null图3-52 “Define Multiple Response Sets”对话框(二) 实现步骤null 图3-53 “Multiple Response Frequencies”对话框(二) null图3-54 “Multiple Response Crosstabs”对话框(二)null图3-55 “Multiple Response Crosstabs: options”对话框(二)null3.13.3 结果和讨论 上面分别采用了多选项二分法(研究问题1)和多选项分类法(研究问题2)对问题进行分析。 null(1)多选项二分法频数分析结果如下表所示。null (2)下面所示结果表格是多选项二分法的交叉列联表结果表格。null下面说明研究问题2的结果。 (1)多选项分类法频数分析结果如下表所示。null (2)多选项分类法的交叉列联表结果表格如下表所示。null1.4.2 SPSS的数据编辑窗口 SPSS主界面主要有两个,一个是SPSS数据编辑窗口,另一个是SPSS输出窗口。 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名栏、内容区、窗口切换标签页和状态栏组成,如图1-2所示。null3.14 基本统计分析的报表制作3.14.1 报表分类 本章上面各节讨论了SPSS的一些基本统计功能。SPSS还提供了这些基本统计分析的报表制作功能,根据报表制作的侧重点不同,可以分为以下3种。null 1.个案简明统计报表(Cases Summary) 2.行形式报表(Report Summaries in Rows) 3.列形式报表(Report Summaries in Columns)null3.14.2 SPSS中实现过程 研究问题1—个案简明统计报表 某公司两个部门共有20名员工,收集到员工的基本工资、奖金和分红信息,生成个案简明统计报表。数据如表3-13所示。 null表3-13 20名员工的收入null图3-56 在菜单中选择“Case Summaries”命令 实现步骤null 图3-57 “Summarize Cases”对话框 null图3-58 “Summary Report:Statistics”对话框 null图3-59 “Options”对话框null 研究问题2—行形式报表 仍用研究问题1中的例子,数据见表3-13。null图3-60 “Report Summaries in Rows”对话框 实现步骤null图3-61 “Report:Data Columns for基本工资”对话框null图3-62 “Report:Summary Lines for 部门”对话框 null 图3-63 “Report:Break Options for 部门”对话框 null 图3-64 “Report:Final Summary Lines”对话框 null 图3-65 “Report:Options”对话框null图3-66 “Report:Layout”对话框null图3-67 “Report:Title(s)”对话框null 研究问题3—列形式报表 某公司两个部门共有20名员工,收集到员工的基本工资、奖金和分红信息,数据见表3-13,生成列形式报表。 null图3-68 “Report:Summaries in Columns”对话框 实现步骤null 图3-69 “Report:Summary Lines for 基本工资”对话框 null图3-70 “Report:Summary Columns”对话框 null3.14.3 结果和讨论 上面分别采用了个案简明统计报表、行形式报表、列形式报表3种 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 形式对两个部门的员工收入情况进行了分析。null(1)个案简明统计报表结果如下表所示。null(2)行形式报表结果如下表所示。null(3)列形式报表结果如下表所示。null小 结 描述性统计是进行其他统计分析的基础和前提。利用这些基本统计方法,可以对要分析数据的总体特征有比较准确的把握,同时也为更深入的分析提供了依据。null小 结 Frequencies命令可用于数字型或字符型变量的统计分析,如均值、标准差、最小值、最大值、众数、中位数、方差、全距等14种统计量。 探索分析可对变量进行更为深入详尽的描述性统计分析,有助于用户思考对数据进行进一步分析的方案。
本文档为【spss教程03】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_948212
暂无简介~
格式:ppt
大小:4MB
软件:PowerPoint
页数:0
分类:工学
上传时间:2012-05-05
浏览量:13