建立SPSS数据库[管理资料]
建立SPSS数据库
?2.1 问卷编号
?2.1.1 问卷编号的必要性
(1)便于统计
(2)便于查找、修正数据
(3)便于分析
?2.1.2 问卷编号的
规则
编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf
例:网络游戏调查问卷的编号规则
(1)问卷编号第1位数字为省份代号,“1-5”分别代表北京、广东、辽宁、上海、湖北;
(2)问卷编号第2位数字为城市级别代号,“1-4”分别为省会城市、中等城市、县城镇、乡镇;
(3)问卷编号第3位数字为问卷代号,“1-5”分别为社会青年卷、家长卷、经营者卷、管理者卷、大学生卷;
(4)问卷编号第4-8位数字为问卷数量号,如第0001号,接下来依次为0002、0003。
例如:广东省广州市大学生卷的起始号就应该是:2150001、2150002等 ?2.2 设计数据录入模板
?2.1.1 单选题的变量设计
例:A4. 您的专业:______
?文科 ?理科 ?工科 ?艺体
变量设置步骤如下:
(1)定义变量名。为使数据文件中的变量名能够与问卷中的问题很好地一一对应,通常用问题的编号作变量名。
(2)确定变量类型。只要取值是数字而不是字母,就选系统默认的Numeric,即数值型。
(3)定义变量宽度和小数点位数。根据需要来确定。 ?2.2.1 单选题的变量设计
(4)定义变量名标签。在单元格中输入“专业”,尽量简洁明了。
(5)定义变量值标签。Value 1; Lable 文科;依次设立。
(6)定义缺失值。可以采用系统默认的None,即不设立缺失值。
也可以考虑只有数字1-6是有效值,可以将其它全部设为缺失值。进入定义缺失值对话框,选择Range plus one optional discrete missing value,将7作为最小值输入后面的窗口中,将99作为最大值输入后面的窗口中,将0单独作为缺失值输入后面的窗口中,从而将从7到99范围内的全部值和0都定义为缺失值。
(7)变量宽度、对齐方式和测量层次可以不做调整。 ?2.2.1 单选题的变量设计
练习:
《大学生网络文化调查》问卷的A1-B6题。
?2.2.2 多选题的变量设计
(1)限选题的变量设计
•例:C23. 对您来说,上网具有哪些好处,(限选三项) 、 、 ____
•?增加知识 ?获得信息 ?休闲娱乐 ?与人沟通 ?自我实现 ?发泄情绪 ?满足生理需求
•?逃避现实 ?其他_________
•设计
将该问题设计成为三个属性相同的变量,变量名分别为C2301、C2302、C2303,然后变量值按照单选题设计方式设计,三个变量的变量值都一样。
?2.2.2 多选题的变量设计
?限选题变量设计练习
《大学生网络文化调查》问卷的C1题
?2.2.2 多选题的变量设计
(2)任意多选题的变量设计
•例:C2. 您在网上看到的多半是哪类文学作品:(可多选)
•?搞笑类 ?言情类 ?魔幻神话类 ?悬疑侦探类 ?恐怖类 ?武侠类 ?科幻类 ?人物传记类 ?色情类 ?其他
•变量设计:
将其变为10个单选题,变量名分别为C2O1、C2O2、C203,依次类推,标签为:网上看到的文学作品:搞笑类 变量值设为:1 选(是) 2不选 (否) ?2.2.2 多选题的变量设计
?任意多选题的变量设计练习
《大学生网络文化调查》问卷的B7题
?2.2.3 表格题的变量设计
•例:C22. 您认为在网络中以下哪类信息很难满足您的需求:(请在相应的选项处画“?”)
?2.2.3 表格题的变量设计
?表格题的变量设计练习
《大学生网络文化调查》问卷的C12题
?2.2 作业
四人一组,将《大学生网络文化调查》问卷的录入模板制作出来。 ?2.3 数据的录入、修订
?2.3.1 数据的录入
1(单选题。直接在相应的地方输入相应的代码即可,代码一般与选项前的数字相同,少量不同的,请参照??变量定义框??。
例:A1,如果被访者选择的??男??,就直接输入??1??,同理,如果被访者选择的??女??,就直接输入??2??。
?2.3.1 数据的录入
•2(多选题。实际上是将每个选择项变为一个单选题,??1??代表被访者选择了该项,??2??代表被访者未选择该项。
例:B7,如果被访者选择的是1、5、7项,则正确的录入为B701为??1??、B702为??2?? 、B703为??2??、 B704为??2?? B705为??1??、 B706为??2?? B707为??1??、 B708为??2?? 、B709为??2??、B710为??2??、B711为??2??,即所有的选项中,只有3个??1??,其余为??2??。
?2.3.1 数据的录入
3(限选题。第C1题,由于此题选择项比较多,为了减少录入工作量,在此只设置了5个题,即被访者选择了哪几项,就依次将该选择项的代码输入C101-C105五个地方。
例:被访者依次填写了??3、5、9、12、10??,我们就在C101-C105处分别填写??3????5????9????12????10??,但一定要按顺序填写,因为先选择的和后选择的项目具有不同的权重。
4(缺省处理。如果该题被访者没有填答或已经拒绝填答,则请直接按?????键跳过即可,不要输任何数字。
?2.3.2 数据的修订
第一步,运用频数分析法,Analyze Descriptive Statistics Frequencies 打开频数分析对话框,把所有变量全部纳入分析框类并输出频数分析表;
第二步,看每一题的频数分析表,找出无效值,如一道题只有三个选项,那么有效值应有只有1、2、3,如果出现了4,那么证明这个4就是输错的数值; 第三步,回到数据窗口,找出输错数字的这个变量,将其全部选中,然后用edit(编辑) find(查找),在对话框中输入4,点击查找;
第四步,当系统锁定错误数字4时,仔细查看这个4所在横行的问卷编号是多少,然后找出这份问卷并找到这个选项,然后将其更正即可。
当一个错误数字更改完后,要接着采用同样
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
继续查找更改,直到所有选项都在有效值范围内为止。
?2.3 数据的录入、修订
练习:
将自己手中所填写的问卷录入到数据模板中,并运用频数分析法修订数据。第一节 合并文件
一个大型的社会调查涉及的个案可能很多,需要多 个人分别录入,然后再将多人录入的结果汇总。或者是对同 一批个案进行多次不同内容的调查,将调查结果汇总以后进 行比较分析。这都涉及将多个数据文件合并的问题。
合并文件的功能是将一个外部文件与当前正使用的文件合并 成一个新的数据文件。合并时既可以增加个案,也可以增加 数据的整理
变量。
基本命令:
Data Merge File(合并文件) Add cases (增加个案)
Add variables(增加变量)
?3.1.1 增加个案
增加个案是指将一个外部数据库文件中的
个案追加到正在使用的文件中,但条件是
只将两个数据文件中具有相同变量名的个
案进行合并,也称纵向合并。
命令:
Data Merge Files Add Cases
?3.1.1 增加个案
实例:将“休闲调查1”与“休闲调查2”的个案合并
打开数据文件“休闲调查1”后,执行下列操作: (1)Data Merge Files Add Cases,打开选择文件对话框; (2)在对话框的文件列表中选择“休闲调查2”,单击“打开”按钮,会出现一个对话框;
(3)在这个窗口的左侧:Unpaired Variables 是不匹配变量窗口,即指合并的两个文件中变量名不相同或者是变量名虽相同但变得设置不同的变量,
执行合并的命令后,这些变量在新的单变量的描述统计分析 第一节 频数分析
频数分析是统计分析中最常用的功能之一,它适用于描述离散型数据,也就是名义变量、顺序变量的分布特征,频数分析的统计结果是以频数分布表和频数分布图的形式输出的。
基本命令:
Analyze Descriptive Statistics Frequencies
第一节 频数分析
一、频数分析的过程
例:以“大学生网络文化调查”中对“月平均生活费”进行频数分析并输出条形图。
打开“大学生网络文化调查”数据,执行下列操作: 1、Analyze Descriptive Statistics Frequencies 2、选择“月平均生活费”变量进入Variable 窗口 3、单击“Statistics”
A.Percentile Values:
Quartile:四分位数
B.Central Tendency :集中趋势
Mean:平均数
Median:中位数
Mode:众数
Sum:总和
第一节 频数分析
4、单击“Charts”:确定生成图形
第二节 频数分析表的制作及修改
一、频数表修改
1、双击表格,使表格处于编辑状态
(1)双击要修改的文框:Valid Percent 有效百分比 (2)删减表格:例如,删除Percent 这一列,先将其选中,然后点击右键,选择Clear
(3)调整表格样式:
点击右键,选择table looks 选择一项认为比较好的表格样式; (4)修改每一个表框内容、单元格
点击右键,选择table properties 单元格属性
可以调字体、线条粗细、对齐方式、阴影等 (5)插入脚注:右键选择 Insert Footnote 2、粘贴复制表格
选中,右键,Copy 过来的是数值,可以编辑
Copy Object 过来的是表格、图形,不可以编辑
第二节 频数分析表的制作及修改
二、用word制作频数分析表
虽然用SPSS软件制图比较漂亮,比较方便,但若用其作
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
,必须将其粘贴复制到
Word文档中。而复制到文档中的SPSS图不能修改,这会给文档编辑带来麻烦。因而,为解决
这个问题,我们一般选择用SPSS分析数据,用Word根据数据制图。原则上,如果Word 能够
将图制作出来,就尽量用Word;如果Word制作不出来,再选择用SPSS制图。
第二节 频数分析表的制作
(一)用Word制表
1、插入表格七行、八列
2、熟练操作表格
(1)插入列在左侧;
(2)插入列在右侧;
(3)插入行在上方;
(4)插入行在下方;
(5)删除行、列、单元格
(6)拆分单元格、合并单元格
(7)自动分布调整:平均分布各行、各列 3、边框和底纹
选中左上角的方框从而选中整个表格 点击右键进入边框和底纹里 把表格的中间线
全部去掉 点击一下就可以了
第二节 频数分析表的制作
(二)用Word制作编辑频数分析表
1、用copy方式将频数分析表从SPSS输出文件中复制到Word文档上来;
2、具体过程:
例:用Word制作每月生活费的频数分析表 (1)用copy方式将其复制到Word文档上; 将可能出现的乱码部分修改过来,包括表头、中间项; 将percent这一列删除,将 missing以下的横行删除,将 valid 一列删除,(点击右键,选择删
除);
将英文改成中文:总计、合计、人数、百分比、累计百分比
第二节 频数分析表的制作
二、用Word制作编辑频数分析表
2、具体过程:
(2)调整表格样式
字体调整:用Word编辑形式编辑;
字体对齐方式:全部选中,单击右键 单元格对齐方式 最中间一个
表格样式:选中表格 下拉表格菜单 绘制表格 表头、表尾选择粗线条的颜色之后,
用笔画出来;然后再选择虚线把表的标识行下面划虚线、把合计上方画虚线;
表格大小:用鼠标拖拉方式完成;
每个单元格的确大小调整方式:可采用拖拉,亦可采用属性 行中调整宽度
第三节 频数分析图的制作
一、用SPSS软件制作图
例:以“大学生网络文化调查”中对“月平均生活费”进行频数分析并输出条形图。
打开“大学生网络文化调查”数据,执行下列操作: 1、Analyze Descriptive Statistics Frequencies 2、选择“月平均生活费”变量进入Variable 窗口 3、单击“Statistics”
第三节 频数分析图的制作
3、单击“Charts”:确定生成图形
第三节 频数分析图的制作
二、频数图的修改
1、双击图,使图处于编辑状态
(1)修改图头:
双击图头,将其选择中间对齐:Center
修改字体:选中表头,单击左上角的“T”字,修改字体大小; 修改字体颜色:选中表头,单击左上角的铅笔字样
(2)修改纵坐标
修改频率间距:双击频率出现对话框,increment 中输入10;修改字体、颜色同上
修改纵坐标说明:对齐方式:双击选择Right top ,同时在Axis Title 中将其改为频率;
(3)修改横坐标标签:同上
(4)修改直方图柱子:调整颜色
调整完后将其关闭,即可
(5)调整图的大小:将其关闭呈未编辑状态,然后单击出现小方框,把鼠标移至右下角,进行拉伸来调整图的大小
第三节 频数分析图的制作
二、频数图修改
2、粘贴复制表格
选中,右键,Copy 过来的是数值,可以编辑
Copy Object 过来的是表格、图形,不可以编辑 3、图形转换
菜单中的Gallery:图库,选择所要换的图形即可
第三节 频数分析图的制作
三、用Word制图 例:用Word制作每月生活费的分布图。 (1)用copy方式将月生活费的频数分析表复制到Word文档中来;然后另起一行在Word文档中插入 图片 图表
(2)双击图表,使其进入编辑状态;
? 点击图的右键选择数据工作表,将月平均生活费的相关内容输进去。最上面一行(横行A、B、C、D、…)输入变量值,即答案,300元以下、300-500元,500-700元… ,竖行输入变量名,这里只有一个变量名标签,(月生活费);紧接着将有效百分比的值输入数据工作表:依次为20.4 27.4 29.9 20.4 1.9 ;然后关闭数据工作表; 第三节 频数分析图的制作
?调整图表
A(调整图表大小:将其单击选中,周围会出现四个小方框,然后采用伸缩拖拉的方式将其调到合适的大小。
B(修改背景、基底及单个部分的柱子
双击图表使其进入编辑状态, 点击背景墙后右键选择设置背景墙格式
对背景墙颜色进行调整(样式、颜色、粗细);填充效果:单色、双色、
点击基底后右键选择设置基底格式 ,然后和背景墙一样进行颜色调整;
点击选中所有柱子右键选择设置数据系列格式,然后对颜色、数据标签进行修改,如果选中数据标签中的值,那么就会显示值,如果只改变一根柱子的颜色,就选中一根柱子进行调整。
C(修改数字即横纵坐标及数据值:选中之后选择设置坐标轴格式(或者是数据标签格式)然
后对字体、刻度进行修改。
第三节 频数分析图的制作
(3)图表选项及图表类型
?图表选项:在修改区域但不是图表区域点击一下,右键选择图表选项 A(图表标题及X轴、Y轴的标签调整
B(坐标轴:X轴、Y轴是否显现,如果选中就表示显现,如果不选就不会显现;
C(网络线:主要网络线,也可以去掉
D(图例:显示图例选中,不显示就不选中;
E(数据标签:选中值;
F(数据表:选中
?图表类型:在修改区域但不是图表区域点击一下,右键选择图表类型 如果不喜欢可以选择其他类型,
第四节 基本描述统计量交叉列联表与等级相关分析
第一节 交叉列联表分析
交叉列联表分析是对两个变量(两个定类变量或是一个定类变量和一个定序变量)之间关系分析的方法。系统对两个变量进行交叉列联表分析后生成交叉表和输出卡方(X2)检验结果。一般用来分析群体差异,比如说不同性别的人对网络文化的看法有何差异等。
基本命令:
Analyze Descriptive Statistics Crosstabs
基本统计量:卡方检验:Person-chi-square ,临界值所对应的显著性水平,0.05,则认为是相关的,如果大于0.05则认为是不相关的。
交叉列联表分析第一节
例:用“大学生网络文化调查”的数据分析:不同性别的大学生对玩网络游戏的喜欢程度是否存在差异。
打开“大学生网络文化调查”数据,执行下列操作: 1、确立交叉列联表分析的变量是A1题和C16题
2、Analyze Descriptive Statistics Crosstabs 3、将要分析的两个变量放入Row(行)和Column(列),进入Row(行)窗口中的变量取值作为行的标志输出,而进入Column(列)窗口中的变量则作为列的标志输出。
性别 Row(以行的形式出现);喜欢程度 Column(以列的形式出现)
在 statistics选中卡方值检验统计量chi-squre;
在Cell选中row作为输出量 ,可得结果如下
第二节 等级相关分析
如果要分析两个顺序变量之间的关系,不仅可以用交叉列表和卡方检验的方法来分析变量是否存在相关,还可以用等级相关系数来描述变量之间相关的大小和方向。
基本命令:多选变量分析
多选变量分析
在问卷调查中都会存在一定量的多项选择题。对多选变量进行分析时,我们不仅希望知道某些选项在第一选、第二选或第三选中分别被别人选择过,我们还希望知道某些选项在多次选择中总共被选择了多少次,这个问题要通过多选变量来解决。
第一节 限选变量分析
一、生成新变量
基本命令:
Analyze Mutiple Response Define Variable sets , 例:分析《大学生网络调查》C23题
第一步: Analyze Mutiple Response Define Variable sets , 将C23所有设置选项丢到Variable in set;
第二步:激活:categories range:_____through______,分别输入变量取值的最小值和最大值;
第三步:在Name 中输入“上网”作为新生成的变量名,激活ADD按钮,单击ADD按钮,将新生成的变量“上网”添加到Mult response sets 窗口中; 第四步:单击Close按钮(如图)
第一节 限选变量分析
第一节 限选变量分析
第一节 限选变量分析
三、限选变量的交叉列联表分析
基本命令:Analyze Mutiple Response Crosstables 例:不同专业的人通过上网获得好处的比较
第一步: Analyze Mutiple Response Crosstables , 第二步:专业 row;上网 Colums;
第三步:Define ranges:专业取值是1-4
第四步:单击Continue按钮(如图),此后的分析描述方法与单选题类似
第二节 多选变量分析
生成新变量 、频率分析、交叉分析
基本命令:
Analyze Mutiple Response Define Variable sets , 例:分析《大学生网络调查》B7题
第一步: Analyze Mutiple Response Define sets , 将B7题所有设置选项丢到Variable in set;
第二步:激活:Dichoto第一节 回归分析概述
第一节 回归分析概述
mies(二分法)counted value:在方框内输入“1”;应该统计的是选择的次数,所以要输入“1”
第三步:在Name 中输入“上网”作为新生成的变量名,激活ADD按钮,单击ADD按钮,将新生成的变量“上网”添加到Mult response sets 窗口中; 第四步:单击Close按钮
其余分析、描述方式与限选题相同
Analyze Descriptive Statistics Crosstabs
基本统计量:Gamma系数 如果Approx. Sig(显著性水平)
,(0.05),则认为是相关的,如果大于0.05则认为是不相关的。而在相关前提下如果Gamma系数值为负,刚认为是负相关,如果为正,则认为是正相关.
第二节 等级相关分析
例:不同年级的大学生每周上网次数是否有差异?
基本步骤:
(1)Analyze Descriptive Statistics Crosstabs
(2)把年级 Row(行)
把上网次数 Column(列)
(3)选择统计量:statistics Gamma Continue
单击ok, 提交运行
通过频数分析把握数据的整体分布状况之后,通常还需要对定距变量的分布特征有更为精确的认识,这就需要通过计算基本描述统计量等途径来实现。 基本命令:Analyze Descriptive Descriptive •分析统计量主要有(集中趋势)Mean:平均数、Median中位数、Mode:众数、Sum:总和 (离散趋势)Std.deviation:
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差、Variance:方差、Minimum:最小值、Maximum:最大值
数据文件中将消失。
在该窗口的下面有两项关于窗口中变量来源的说明:
※表示这个变量名是目前正在工作的数据文件;
+表示要合并过来的这个文件的变量名。
(3)在这个窗口的右侧:Variables in New Active 是即将生成的新的数据文件变量的窗口,执行合并合并后,在该窗口中的所有变量都在新的数据文件中存在。
Indicate case source as variable:是指明case来源的选项。如果选择此项,执行命令后,系统将生成一个新的数据文件,并在这个数据文件最右侧生成一个表示个案来源的新变量,系统默认的变量名是Source 01,也可自己设定.0表示来源于原工作数据文件,1表示来源于外部数据文件。
因子分析
第一节 回归分析概述
第一节 因子分析概述
第一节 因子分析概述
第二节 因子分析的基本理论
第二节 因子分析的基本理论
第二节 因子分析基本理论
为因子负荷矩阵,也就是我们理论上要构造的变量相关矩阵,理论上来说我们可以求出第1因子、第2因子、…第P因子。
第二节 因子分析的基本理论
提取因子常常采用的方法是主成分分析法。所谓主成分分析法是以线性方程式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合称为主成分。第一次线性组合建立后,计算出的第一个主成分估计,可以解释全体变异量的最大一部分。其所解释的异量即属第一主成分所有,分离后剩余的变异量,经过第二个方程式线性合并,抽出第二个主成分因子,其所涵盖的变异量即属于第二个主成分的变异量。依此类推,I个变量就有I个主成分,并且各个主成分之间不相关。
第二节 因子分析的基本理论
抽取公共因子的基本原则是:取出的因子数目越少越好,但其对变量的解释力则越大越好。那么,究竟抽取的因子少到几个才合适了,众说纷纭,很难统一。下面选择两个常用提取因子的指标来介绍之:
第二节 因子分析的基本理论
(1)特征值。特征值表示该因子所能解释的各变量方差的总和.不同的因子具有不同的特征值。特征值越大,说明该因子对解释变量的贡献越大。在提取的过程中,应保留特征值大
于1的因子。目前一般电子计算机程序中最流行、通常默认的一种。但是,也可根据研究适当调整,但理应大于等于0.8。
第二节 因子分析的基本理论
一种是根据贡献率的大小排位,计算累计贡献率,一般来说累积贡献率在70%—85%或以上所对应的前m个因子即可作为我们的主因子。 第二节 因子分析的基本理论
通常采用特征值与贡献率相结合的方法来确立因子的数目。 第二节 因子分析的基本理论
在因子分析中,除要找出变量间的公共因子外,还要对所找到的因子作出适当的解释。一般因素分析得到的结果往往是很难加以解释的,尤其是当某些变量同时在几个公共因子上都有相当程度的负荷量(即某些变量同时与几个公共因子都具有相当程度的共性)时,因子的解释工作就更加困难,这就需要采用因子旋转使每一个变量仅在一个公共因子上有较大负荷,而在其他公共因子上的负荷比较小,但同时不改变原有因子负荷矩阵各横行的平方和(即共性方差)从而使因子或成分能够清楚的区分。
第二节 因子分析的基本理论
公共因子抽出来后,我们必须知道各因子所代表的意义是什么,也就是说对因子进行命名并作出解释。需要指出的是,因子的命名和解析带有主观的色彩,因人的不同,主因子的命名也有所不同,但是事物的本质使得各变量间的联系一般来说具有某种稳定性。
第二节 因子分析的基本理论
通过因子分析,我们找出了多个变量中所隐含的公共因子及各因子的意义。最后,我们还希望利用所找出的因子来衡量各样本单位的性质,这种性质可以用样本单位的因子得分来表示。
第二节 因子分析的基本理论
第三节 因子分析的适用性检验
第三节 因子分析的适用性检验
第四节 因子分析的
案例
全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例
分析
例如,某企业想在年终对员工进行综合评估,作为是否升职、调动等的考察标准,为了尽可能地全面收集反映员工综合素质的资料,该文化企业设置了10个指标,分别为专业水平、创新能力、自信心、理解能力、工作的积极性、诚信、经验、洞察力、对同事的影响力和工作的适应能力。
第四节 利用SPSS软件进行因子分析的步骤
第一步:根据收集到的资料,运行SPSS17.0,按照建立数据库的要求和方法,建立数据库;
第四节 利用SPSS软件进行因子分析的步骤
(4)单击“OK”。
?3.1.1 增加变量
增加变量是指将外部数据文件中的变量增加到当前的工作文件中,也称横向合并。
命令:
Data Merge Files Add Variables
?3.1.1 增加个案
实例:将“休闲调查1”与“休闲调查3”的变量合并
打开数据文件“休闲调查1”后,执行下列操作: (1)Data Merge Files Add Variables ,打开选择文件对话框; (2)在对话框的文件列表中选择“休闲调查3”,单击“打开”按钮,会出现一个对话框;
(3)在这个窗口的左侧:Excluded Variables 是拒绝变量窗口,即指在将要合并的两个数据文件中,如果存在与当前工作文件的变量名同名的变量,这部分被拒绝回到合并后的新的数据
文件中去。
在该窗口的下面有两项关于窗口中变量来源的说明:
※表示这个变量名是目前正在工作的数据文件;
+表示要合并过来的这个文件的变量名。
(3)在这个窗口的右侧:New Working Date File 是新的工作数据文件窗口,该窗口中包括了原工作数据文件中的全部变量及合并过来的外部数据文件中与原工作数据文件不同名的变量,该窗口中的所有变量将存于新生成的数据文件中。
(4)同样在选择Indicate case source as variable之后点击“OK”即可。
3.2 数据分割
在对数据进行统计分析时,经常要分组分析。如按性别不同来分析收入,按学历不同来分析住房面积等。
分割文件的功能就是将当前使用的数据文件分割成两个或两个以上的小组,随后的分析将对每个小组分别进行。
基本命令:
Data Split File
?3.2 数据分割
实例:将“休闲调查1”按性别进行分割
打开数据文件“休闲调查1”后,执行下列操作: (1)Data Split File ,打开选择文件对话框;
(2)在对话框的文件列表中选择“休闲调查3”,单击“打开”按钮,会出现一个对话框;
(3)在这个窗口的右侧:选择Compare group 选择分组变量进入Groups Based on 单击OK
?3.3 数据的限选
在社会调查的定量研究中,有时只分析一部分个案,比如分析30-50岁的中年人的收入;分析受教育水平为初中以下人们的职业分布;分析收入为3000元以上人们的休闲生活等。选择个案的功能是选择出一些符合一定条件的个案,分析时只对这些个案进行分析。
基本命令:Data select cases
?3.3 数据的限选
实例:将“休闲调查1”的数据文件中,按不同的条件选择个案
(1)选择年龄在50岁以上的个案
打开数据文件“休闲调查1”后,执行下列操作: (1)Data select cases if condition is satisfied(如果条件被满足)——点击“if”
?3.3 数据的限选
(2)在条件对话框右上方窗口中输入“年龄,50”,点击“continue”,回到最开始的对话框中
?3.3 数据的限选
?3.3 数据的限选
实例:将“休闲调查1”的数据文件中,按不同的条件选择个案
(2)随机抽样20%的个案
打开数据文件“休闲调查1”后,执行下列操作:
Data select cases random sample of cases 激活smple 选择 Approximately
20% of all cases 单击 Continue 单击OK
?3.3 数据的限选
实例:将“休闲调查1”的数据文件中,按不同的条件选择个案
(3)从前100个个案中随机选择30个个案
打开数据文件“休闲调查1”后,执行下列操作:
Data select cases random sample of cases 激活smple 选择 Exactly 30 cases from the fist 100 cases 单击 Continue 单击OK
?3.3 数据的限选
实例:将“休闲调查1”的数据文件中,按不同的条件选择个案
(4)选择第3到第6个个案:在设定的范围内随机选择个案
打开数据文件“休闲调查1”后,执行下列操作:
Data select cases Based on time or case range 激活range 在 Fist cases 后输入 3 ,在 last case后输入 6 单击 Continue 单击OK
?3.3 数据的限选
实例:将“休闲调查1”的数据文件中,按不同的条件选择个案
(5)Use filter variable:使用过滤变量的选项
在社会调查中,不能保证每名被调查者对所有问题都进行了回答,因此在很多变量中都存在一定的空缺;使用过滤变量选择个案的目的是只选择有效回答的个案,属于空缺的个案被剔除。
打开数据文件“休闲调查1”后,执行下列操作:
Data select cases Use filter variable 选择“文化程度” 单击OK,
可以看到在数据窗口中文化程度为缺失值的个案未被选中。 ?3.4 个案的排序与排秩
一、个案的排序
虽然系统已经按录入的先后将所有的Cases排队了,但是在进行数据处理时,有时需要按某个变量值重新排序,比如按照年龄大小排序,按收入高低排序等。
基本命令:Data sort cases
?3.4 个案的排序与排秩
实例:将“休闲调查”按年龄排序
打开数据文件“休闲调查”后,执行下列操作:
Data sort cases 从左侧窗口中选择“年龄”进sort by 年龄Ascending(升序) 单击 OK
Descending:降序排列
如果要按多个变量排序,系统会先按第一个变量排序,第一个变量值相等时,再按第二个变量排序,依次类推。
?3.4 个案的排序与排秩
二、变量值的排秩
秩是指变量排序后的顺序号,排秩指令的功能是将排序的结果生成一个新变量,新变量的取值是排序后的顺序号。
最典型的就是学校考试成绩排榜。
基本命令:Transform rank cases
?3.4 个案的排序与排秩
实例:将“考试成绩1”数据文件中的“数学1”求秩
打开数据文件“考试成绩1”后,执行下列操作:
(1)打开对话框;Transform rank cases
(2)选择排秩量;选择“数学1”进入Variables
(3)确定排秩的顺序:
左下角:Assign rank 1 to:把秩值1分配给
Largest value:按照降序来排秩(即最高分为为1)
smallest value:按照升序来排秩
(4)确定相同秩的取值方法:右下方点击 “Tiles”
选择 sequential ranks to unique values 单击Continue Ok
?3.4 个案的排序与排秩
总练习:分割、排序、排秩
将“考试成绩1”文件打开,将同学们的考试成绩分男女按数学成绩从高到低排列,并求出数学成绩1的秩。
操作方式:
(1)按数学成绩从高到低的排:Data sort cases
(2)求出“数学1”的秩(按男女,按性别)
(3)再按男女分割文件
?3.5 变量内容的重新编码
在统计分析时,最初设定的变量的值可能不符合统计分析的要求,这就需要对已经录入的变量的值进行重新设定。有时还需要把尺度变量转化为定序变量或定类变量。比如,把人们的年龄与他们的自体状况进行交叉分析时,研究者所关心的并不是某一年龄的人们的身体状态如何,而关心的是某一年龄段的人们的身体状态如何。这就需要对年龄变量进行重新编码,将其转化为老中青或10年一段的定序变量,也就是要重新编码生成一个新变量。
基本命令:Transform recode into different variable ?3.5 变量内容的重新编码
实例:将“休闲调查1”数据文件中的年龄分为青年人、中年人和老年人三个年龄段。打开数据文件“休闲调查1”后,执行下列操作:
(1)打开对话框;Transform recode into different variable
?3.4 变量内容的重新编码
?3.6 变量的运算
在定量分析的过程中经常要遇到变量之间进行运算的情况,有时还需要对某些变量进行加权计算,也就是对变量的数据数据数据进行重置。
基本命令:Transform Compute
实例:将“贫困调查”数据文件中的“粮油”、“副食”、“水果”三个变量计算贫困家庭的食品支出,并计算贫困家庭的恩格尔系数。打开数据文件“贫困调查”后,执行下列操作:
(1)打开对话框;Transform Compute Variable
?3.6 变量的运算
?2.4 其它文件类型数据的导入
Excel 文件的导入
File open date 在文件类型中选择扩展名为.excel的文件并打开,即可将excel文件导入。