下载

2下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 SPSS教材第二章 数据文件的管理

SPSS教材第二章 数据文件的管理.doc

SPSS教材第二章 数据文件的管理

张子彧2011
2018-09-07 0人阅读 举报 0 0 暂无简介

简介:本文档为《SPSS教材第二章 数据文件的管理doc》,可适用于IT/计算机领域

第二章数据文件的管理(上)(医学统计之星:张文彤)最后一次更新时间: 建立与保存数据文件File菜单 新建数据文件 直接打开 使用数据库查询打开 使用文本导入向导读入文本文件 打开其他格式的数据文件 保存数据文件 File菜单中的其他条目 编辑数据文件 定义新变量 直接定义新变量 从原有变量计算新变量Transform菜单 数据的录入 直接录入 数据录入技巧 进一步整理数据文件Data菜单 不言而喻一切统计分析都是以数据为基础的因此统计软件的数据管理能力非常重要。SPSS以其豪华的界面为依托为用户提供的便捷的数据管理功能下面我们就来具体看一下。§ 建立与保存数据文件和大多数应用软件相同SPSS中数据文件的管理功能基本上都集中在了File菜单上该菜单的组织结构和WORD等也极为相似因此这里我们只介绍比较有特色的几个菜单项。SPSS有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。他们共享许多菜单项如File菜单就大部分相同这里介绍的许多内容在五个窗口中都是通用的。 新建数据文件如果你正从头开始进行一个新的课题刚刚把数据收集上来要做统计分析自然需要新建一个数据库然后将所有的数据从纸上请到计算机里。在SPSS中新建一个数据库容易的不得了--已经到了什么都不用做的地步!是这样当你进入SPSS系统时系统就已经生成了一个空数据文件即你看到的空白的数据管理界面。你只要按自己的需要定义变量输入数据然后存盘就是了(这些操作马上会讲到)。  打开其他格式的数据文件凡是做过数据输入工作的人都知道:这活又费眼睛又累人出错太多了还要挨批评非常影响个人的光辉形象。算了还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?因为我请了个老外!)。可是非常不幸该同志只会用EXCEL(又是一个被微软成功洗脑的家伙)数据现已输好怎么转成SPSS数据文件呢?没关系SPSS提供了以下几种方法来打开其他格式的数据文件。 直接打开SPSS现在可以直接读入许多格式的数据文件其中就包括EXCEL各个版本的数据文件。选择菜单File==>Open==>Data或直接单击快捷工具栏上的“”按钮系统就会弹出OpenFile对话框单击“文件类型”列表框在里面能看到直接打开的数据文件格式分别是:SPSS(*sav)SPSS数据文件(~版)SPSSPC(*sys)SPSS版数据文件Systat(*syd)*syd格式的Systat数据文件Systat(*sys)*sys格式的Systat数据文件SPSSportable(*por)SPSS便携格式的数据文件EXCEL(*xls)EXCEL数据文件(从版~版)Lotus(*w*)Lotus数据文件SYLK(*slk)SYLK数据文件dBase(*dbf)dBase系列数据文件(从dBaseII~IV)Text(*txt)纯文本格式的数据文件data(*dat)纯文本格式的数据文件选择所需的文件类型然后选中需要打开的文件SPSS就会按你的要求打开你要使用的数据文件并自动转换为数据SPSS格式。也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外中间还有一个“Paste”按钮该按钮在SPSS的大多数对话框中都存在是用于自动生成SPSS程序的我们以后会专门讲解该问题。 使用数据库查询打开SPSS可以直接打开许多类型的数据文件但这并不是说它可以打开所有类型的数据文件(废话)比如FoxPro以上版本的*dbf文件就不能直接打开(有兴趣的话你可以试试)。为此SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。实际上SPSS在这里使用的是一种叫ODBC(OpenDatabaseCapture)的数据接口该接口被大多数数据库软件和办公软件(如MSOffice)支持通过它应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。由于SPSS可以直接打开EXCEL所有系列的数据文件因此数据库查询接口的用处不是很大。但是在及以前的版本中该查询仍是直接打开EXCEL、及数据文件的唯一办法。ODBC数据引擎是独立与各种应用软件直接安装到Windows系统中的因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。还好大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MSOffice)。不过有一点要提醒大家许多机器的OBDC数据引擎安装有问题(尤其是D版)在SPSS中使用它往往要死机。选择菜单File==>OpenDatabase==>NewQuery系统会弹出数据库向导的第一个窗口其中会列出你使用的机器上已安装的所有数据库驱动程序选中所需的数据源然后单击下一步向导会一步一步的提示你如何做直至将数据读入SPSS。我原来准备举一个具体例子但后来发现不同版本的ODBC引擎所弹出的对话框并不相同!不仅如此不同的数据驱动程序其对话框也各不相同!比如说有的需要你的LoginID和Password有的又不需要因此我这里就不再讲了。由于它使用上太专业(尤其在版中版还好些)如果确实要用请找一个对数据库接口比较熟的人来帮你。 使用文本导入向导读入文本文件选择菜单File==>ReadTextData系统就会弹出OpenFile对话框对!和前面的情况完全一样只是文件类型自动跳到了Text(*txt)。实际上该功能在SPSS中已被整合到了OpenFile对话框中之所以在菜单上保留该条目有两个原因:读入纯文本的情况非常普遍放在这里更加醒目为了和SPSS老版本的使用上保持兼容。例现有一数据文件以纯文本的形式存为“c:Litxt”且第一行为变量名请将其读入SPSS。解:在OpenFile对话框选中相应的文件名并单击“确定”系统会自动启动文本导入向导对话框如下:在SPSS中该向导并没有重新设计因此仍然有问题被截断无法显示完的情况出现。可以看到该向导共分步这是第一步。中部为一对单选按钮问题为“你的文本文件和预定义格式相一致吗?”下方为按预定义格式读入的数据文件的预览。显然SPSS的预定义格式并没有正确识别该文件。因此选择“No”并单击“下一步”系统弹出向导的下一个对话框如下:最上方的问题是“你的变量是如何排列的?”下面的选项分别为Delimite(用某种字符区分)和FixedWidth(固定宽度)一般都是Delimite第二个问题是“变量名包括在文件最前面了吗?”我们当然选“Yes”,单击“下一步”系统弹出第三个对话框:最上方的句子意为“第一条记录从第几行开始?”右侧可以输入行数。由于我们所用的数据第一行为变量名因此这里输入。下面的问题是“你的记录是怎样存储在文件中的?”。可以是“每一行代表一条记录”或者“每**个变量代表一条记录”数据一般都是第一种情况。下一个问题是“你想导入多少条记录?”可以是“所有记录”、“前**条”或“随机导入**的记录”。一般也选前者。单击“下一步”第四个对话框如下:我这里写的非常详细但实际使用中你可以不管大多数问题因为SPSS一般都能自动正确设置。最上方的问题为“变量间用的是哪种分隔符?”可选的有Tab键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格可见系统已经自动识别并选择了空格而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步”第五个对话框如下:上方的提示为“定义在数据预览窗口中所选择的变量。”。顾名思义在这个对话框中你可以在数据预览窗口中选择某一列变量然后更改其变量名和类型。当然在这里我们不用这样做直接单击“下一步”系统弹出文本导入向导的最后一个对话框如下:最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?”一般这两个问题我们都可以不管。单击“完成”系统最终成功的读入了Litxt。 保存数据文件在对数据做了修改后保存数据文件是必不可少的工作之一。选择菜单File==>Save如果数据文件曾经存储过则系统会自动按原文件名保存数据否则就会弹出和选择Saveas菜单时相同的Saveas对话框。里面可以保存的数据类型和可以打开的几乎一样多选择合适的类型确定就是了。 Save命令的快捷键为^S如果你曾经领教过Windows死机的巨大潜力那么你一定会同意习惯性的随手按^S至少不能算是一个坏习惯。如果你准备将数据存为SPSS以外的其他类型要注意有些设置可能会丢失如标签和缺失值等。尤其是缺失值如果想存的数据格式不支持缺失值那你的数据可能会变的面目全非。 File菜单中的其他条目【DispDataInfo】该菜单项用于显示数据的基本信息选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件选择好后按OK系统就会在结果窗口中列出所选数据的基本情况如建立时间、标签设置、记录数、变量设置等。【ApplyDataDictionary】即使用数据字典该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等但不包括数据类型)举个例子吧:请打开Lisav文件将变量x的长度从改为标签删掉然后选择菜单File==>ApplyDataDictionary在文件对话框中选择Lisav并按OK(即将Lisav的变量设置按相同变量名一一套用在现在的数据集上)怎么样?一切都变回去了吧。【CacheData】建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据如果是从远程用SQL调用数据库这会非常的费时。现在使用CacheData可以将数据全部读入暂存盘建立活动数据的缓冲区。大大加快处理速度。不过我特意试了一下如果是处理本机数据的话该命令对速度的提升不是非常明显:(。【Print和PrintPreview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来其中PrintPreview是新增加的使用上和WPS的打印预览非常相似(其实用的是同样的程序)不过和SPSS结果的打印程序一样用SPSS直接打印数据非常的浪费纸张用不用你自己决定吧。【StopProcessor】用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢如果你正在对一个大型的数据执行统计命令等了半天都没有结束此时你的另一半约你逛街的时间又要到了可是你的结果还没有存执行命令时又存不了怎么办呢?试试这个命令吧。 并非所有的命令都可以喊停的许多数据库操作命令(计算变量合并等)好象就停不了。§ 编辑数据文件在SPSS中数据文件的编辑、整理等功能被集中在了Data和Transform两个菜单项中这两个菜单的内容如下所示:Data菜单项Transform菜单项下面我们将根据其功能来分别讲述。 定义新变量 直接定义新变量大多数情况下我们需要从头定义变量在SPSS中定义变量的操作界面和FoxPro等数据库非常相似只需单击左下方的VariableView标签就可以切换到变量定义界面开始定义新变量。如Lisav的变量定义如下所示:以变量x为例:变量名为x类型为Numeric宽度为小数位数位(因小数点还要占一位故整数位只有一位)变量标签位为“血磷值”。右侧在图中未能看到的依次为Values用于定义具体变量值的标签Missing用于定义变量缺失值Colomns定义显示列宽Align定义显示对齐方式Measure定义变量类型是连续、有序分类还是无序分类。使用该窗口我们可以一次定义许多新变量不会象老版本那样一个一个的定义了。由于SPSS是英文软件变量名采用中文会有潜在的冲突(的兼容性是不存在的典型的例子就是微软公司的产品)。对于喜欢搞点花样的用户这里有必要介绍一下SPSS中标签和缺失值的定义方法:标签 和老版本不同现在变量标签和变量值标签被分开设置变量标签就在Label框中直接输入变量值标签则在它右侧的Value框定义。以group为例单击Value框右半部的省略号会弹出变量值标签对话框如下:上部的两个文本框分别为变量值输入框和变量值标签输入框分别在其中输入“”和“克山病患者”此时下方的Add钮变黑单击它该变量值标签就会被加入下方的标签框内。与此类似定义变量值“”为“健康人”最后按OK变量值标签就设置完成。此时你做任何分析在结果中都有相应的标签出现。如果你现在就想看效果切换回DataView界面然后选择菜单View==>ValueLabels怎么样看到了吗?缺失值 单击missing框右侧的省略号会弹出缺失值对话框如下:界面上有一列三个单选钮默认值为最上方的“无缺失值”第二项为“不连续缺失值”最多可以定义个值最后一项为“缺失值范围加可选的一个缺失值”文如其意不用我多解释了吧。回第一章回教程首页到第二章(下) 

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/13

SPSS教材第二章 数据文件的管理

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利