下载

2下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 SPSS教材第二章 数据文件的管1

SPSS教材第二章 数据文件的管1.doc

SPSS教材第二章 数据文件的管1

张子彧2011
2018-09-07 0人阅读 举报 0 0 暂无简介

简介:本文档为《SPSS教材第二章 数据文件的管1doc》,可适用于IT/计算机领域

第二章数据文件的管理(下)(医学统计之星:张文彤)最后一次更新时间: 建立与保存数据文件File菜单 新建数据文件 直接打开 使用数据库查询打开 使用文本导入向导读入文本文件 打开其他格式的数据文件 保存数据文件 File菜单中的其他条目 编辑数据文件 定义新变量 直接定义新变量 从原有变量计算新变量Transform菜单 数据的录入 直接录入 数据录入技巧 进一步整理数据文件Data菜单HYPERLINK"http:medstatstarmyetangcomspsscoachspssbhtm"l"#" 用于数据管理的菜单项 正交设计菜单项 从原有变量计算新变量从头定义变量的情况多数在建立数据集时出现。但是当数据集已经建立需要整理、转换变量时碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是首先我们需要了解一下所用的对话框界面的情况。【SPSS对话框元素介绍】下面是我们在第一章曾经见过的两样本t检验对话框:这是一个非常典型的SPSS对话框。它包含了许多具有SPSS特色的对话框元素:·对话框左侧为候选变量列表框里面列出了可被该对话框使用的变量·右上方为TestVariables框可将变量选入其中注意在两个框的中间用“”相连这是变量移动按钮其方向表明是将变量从那个框移动到哪个框上图中我们选中了变量group两个移动按钮均变黑并向右指表明变量group可以移动到他们右侧的两个框里去改变当前框(在其他两个框里单击)移动按钮就会转向、变灰等以表明不同的意思(墙头草一个可别小看这个功能我想用VB实现这个功能也是费了些工夫才把它搞定了)·右侧为一排五个按钮分别是确定、粘贴、重置、取消和帮助。这五个兄弟也是几乎永远一起出现的另外四个大家都比较熟悉了重置(Reset)按钮用于取消对话框内已做的选择恢复到默认的状态·最下方有个Options按钮用于设置专门用于该对话框的选项·OK、Paste两个按钮为灰色表明所需条件尚未满足该按钮暂不可用。同理GroupingVariable框下方的DefineGroups按钮为灰色显示也表明暂不可用。【ComputeVariable对话框】例 在lisav中建立新变量temp令其值当血磷值大于时为否则为。解:这里需要用到ComputeVariable对话框外加一点技巧。首先给变量temp均赋值为然后将血磷值大于的记录其temp变量值改为即可。选择菜单Transform==>Compute弹出ComputeVariable对话框如下:左上角为需要计算的变量名在其中键入“temp”此时“TypeLable”按钮就会变黑喜欢精确的朋友可以在这里对temp进行详细的定义但如果你和我一样非常懒就可以对它视而不见(不要生气聪明人大多都非常懒:))左下方为候选变量列表现在还用不着中部为类似计算器的软键盘可以用鼠标按键输入数字和符号这里我们直接输入“”输入的内容回立刻在右上方的数值表达式窗口中出现软键盘右侧为函数窗口可以在这里找到并使用所需的SPSS函数这次也用不到。好现在“OK”按钮已经变黑单击他系统就会自动生成一个新变量temp并且取值均为。软键盘上几个奇奇怪怪的符号的含义如下:~=|**~不等号等价于<>逻辑符号AND逻辑符号OR乘方相当于函数EXP()逻辑符号NOT在函数窗口中选中某个函数并单击右键系统就会弹出该函数的用法说明。函数主要是和变量名组合起来使用的比如说ABS(x)就是取变量x的绝对值。好现在开始进行第二步再次选择菜单Transform==>Compute系统也再次弹出这个对话框--等等!注意到了吗?该对话框自动记住了你上次输入的内容几乎所有SPSS的对话框都有这个特性这会大大方便我们的使用。好将数值表达式窗口中的改为然后单击中下部的“If”按钮系统弹出记录选择对话框如下:不需要太多解释大部分内容都是前面见过的。由于我们这里不是对所有记录做变换因此选中第二个单选钮“Includeifcasestatisfiesconfition:”此时下方的所有窗口变亮表明现在可用而“Continue”按钮变灰表明当前还没有提供所需的信息好我们就来提供在左侧选中血磷值(x)然后单击“”x就被引入了右侧的变量框任你用键盘或者用鼠标总之将下面这个算式补充完:x>。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它(开个玩笑)系统回到ComputeVariable对话框请注意If按钮右侧的变化:x>。如果你做的结果不一样请重来一遍。现在单击“OK”按钮由于我们要替换变量值系统会弹出一个确认对话框确认替换马上你就会看到我们已经把这道题做完了。【Count对话框】Count对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象有点拗口)比如我们想看看有哪些记录的血磷值在~之间选择菜单Transform==>Count系统弹出Count对话框如下:TargetVariable框中用于指定记录变量值是否出现的变量名在这里输入temp选中血磷值(x)将其选入Variables窗口此时“DefineValues”按钮变黑单击它系统弹出变量值定义窗口如下:左半部为变量值定义窗口可以定义某个值、系统缺失值、系统或用户定义缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择Range在through两侧分别键入、然后单击已变黑的“Add”按钮“thru”就会被加入“ValuestoCount”框内。然后单击“Continue”再单击Count对话框的“OK”可以看到系统自动生成变量temp其中、号记录因血磷值介于和之间temp取值为其余的记录temp取值均为。SOSSOS请大家千万注意Count对话框有一个潜在的bugs当你需要计算同时满足两个变量取值条件的记录数有多少时直接用该对话框会得出完全错误的结果。这里有一点技巧需要对对话框生成的指令加以修改至于怎么修改嘛我们将在Syntax(语法)窗口使用详解一章中讲述:)。【Recode对话框】Recode对话框用于从原变量值按照某种一一对应的关系生成新变量值可以将新值赋给原变量也可以生成一个新变量。例 在Lisav中生成新变量temp当血磷值小于时取值为~时取值为大于时取值为。解:选择菜单Transform==>Record==>IntoDifferentVariablesRecode对话框如下:将血磷值(x)选入InputVariable>OutputVariable框此时OutputVariable框变黑在其中键入新变量名temp并单击Change可见原来的x>变成了x>temp。现在单击“OldandNewValues”系统弹出变量值定义对话框如下:许多东西和前面类似不再重复。按照题目的要求选择Range:Lowestthrough在右侧框中键入然后在右上方的Value右侧框中键入对应的新变量值此时下方Add键变黑单击它Old>New框中就会加入Lowestthru>按照类似的方法依次加入另两条转换规则最终Old>New框中共有Lowestthru>、thru>、Else>三条现在单击Continue再单击OK系统就会按要求生成新变量temp。哎呀不得了图片太多了虽然这样非常直观但下载速度太慢了。等大家对基本界面操作熟悉了后我们将对比较简单的对话框试着对操作用文字的方式描述比如上面的操作我们将用文字表达为:OutputVariable框:选入xOutputVariableName框:键入temp:单击Change钮选中x>temp:单击OldandNewValues钮:  Range:Lowestthrough单选钮:键入:NewValueValue单选钮:键入:单击Add钮  Range:through单选钮:两侧分别键入、:NewValueValue单选钮:键入:单击Add钮  Range:Allothervalues单选钮:NewValueValue单选钮:键入:单击Add钮  单击Continue单击OK怎么样还能理解吧。【CategorizeVariables对话框】CategorizeVariables对话框用于将连续性变量自动按要求分成等间距的几类。其界面非常简单许多东西都是我们所熟悉的唯一特别的是右下方的numberofcategories框用于输入变量的等级数默认为比如我们希望将血磷值按大小分成个等级先将血磷值选入CreateCategories框然后将下面的改为单击OK就会看到系统产生了一个新变量nx(即numberofx之意)其取值就对应了血磷值相应的个等级(~)。重复一下具体操作步骤为:CreateCategories框:选入xNumberofcategories框:OK【RankCases对话框】例 请分组计算血磷值的秩和。解:选择菜单Transform==>RankCases弹出RankCases对话框如下:将血磷值选入Variable框分组变量选入By框单击OK即可。系统会建立一个新变量rx(即原变量名前加r表示Rank之意)其取值为x分组的秩次。解释一下RankCases对话框的其他几个零件:·左下角的AssignRankto框架用于选择将秩次赋给最小值还是最大值·中下部的Displaysummarytables复选框用于确定是否在结果窗口内输出结果报表·RankTypes钮用于定义秩次类型有Rank(秩分数)、Savage评分(新变量值按指数分布)、Fractionalrank(新变量值是秩分数除以非缺失值观测量的权重之和)、Fractionalrank(新变量值是秩分数除以非缺失值观测量数乘)、Sumofcaseweights(新变量值是各观测量的权重之和)、Ntiles(新变量值是按所选变量的百分位数分组的组序号)默认值为Rank。单击More按钮还会有更多的设置这里就不再讲了。·Ties钮用于定义对相同值观测量的处理方式可以是取平均秩次、最小值、最大值或当作一个记录处理默认值为取平均秩次。【AutomaticRecord对话框】该对话框用于按原变量值的大小生成新变量变量值就是原值的大小次序功能和RankCases对话框重复(等价于相同值观测量当作一个记录处理的情况)。【CreateTimeSeries对话框】用于自动生成时间序列变量由于太专业这里不做过多解释。【ReplaceMissingValue对话框】用于填充缺失值结果存入一个新变量。填充方法有:序列的均数、相邻若干点的均数、相邻若干点的中位数、线性内插、线性外延默认值为序列的均数。 数据的录入 直接录入我想直接录入的问题就不用多讲了吧直接敲就是了! 数据录入技巧和其他常用统计软件相比SPSS数据界面最大的优势就是支持鼠标的拖放操作以及拷贝粘贴等命令下面的数据录入技巧就是对这些功能的利用。【连续多个相同值的输入】如前面group变量有连续多个如果直接输入可以在第一格内输入并回车然后回到刚才的单元格并单击右键选择copy最后用拖放方式选中所有应输入的单元格单击右键并选择paste所有选中的单元格就会都被刚才拷贝的填充。【将EXCEL数据直接引入SPSS】Excel已经打开原数据并且数据量较少的时候可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名)然后选择拷贝命令然后切换到SPSS最好使行列单元格成为当前单元格然后执行粘贴命令数据就会全部转入SPSS再定义相应的变量即可。 进一步整理数据文件Data菜单在许多情况下我们需要先对数据进行一些整理(如分组、合并、加权等)才能将其用于最终的统计分析。这些功能基本上都集中在Data菜单项中下面我们就对这些对话框做逐一介绍。用于数据管理的菜单项【SortCases对话框】例 对数据集lisav按group升序x降序的次序排列。解:选择菜单Data==>SortCases系统弹出SortCases对话框该对话框并不复杂其中比较特殊的是下方的SortOrder单选钮有升序和降序两种选择。请注意该单选钮是和上方的SortBy框一起使用的具体方法如下:确认升序单选钮被选择将Group选入SortBy框选择降序单选钮将x选入SortBy框。请注意:group和x后面分别跟着Ascending和Descending表明前者是按升序、后者按降序排列由于Group在前因此排序时以Group优先。【Transepose对话框】该对话框用于对数据进行行列转置可以在原数据文件中指定一个变量记录转置后的变量名。原变量名则自动保存在系统产生的名为caselbl的字符变量中。该对话框也非常简单左侧为候选变量框右上方为Variable框用于选入需要转置的变量一般应选入除名称变量外的所有其他变量如果有变量未选入则转置时会被自动丢弃右下方为NameVariable框用于指定原数据文件中记录转置后变量名的字符变量但不是必需的此时系统会将新变量自动按var、var的顺序命名。【MergeFiles对话框】用于合并数据文件实际上包括了两个对话框分别对应了两种合并方式:从外部数据文件中增加记录到当前数据文件中称为纵向合并用AddCases对话框完成相互合并的数据文件中应该有相同的变量。选择菜单Data==>MergeFiles==>AddCases系统首先弹出打开数据文件对话框选中需要添加的数据文件并按OK系统才弹出AddCases对话框左侧显示的是新、老数据文件中不匹配的变量名右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicatecasesourceasvariable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK该操作就完成了。实际上右侧显示的是将要包括在合并后数据集中的变量如果有哪个你不需要把它弄到左侧框中即可。从外部数据文件增加变量到当前数据文件称为横向合并用AddVariable对话框完成相互合并的数据文件中应包含同样的记录。选择菜单Data==>MergeFiles==>AddVariable对话框系统同样先弹出打开数据文件对话框单击OK后弹出和前面相似的AddVariable对话框。按需选择即可。【Aggregate对话框】用于对数据进行分类汇总所谓分类汇总就是按指定的分类变量对观测值进行分组对每组记录的各变量值求指定的描述统计量结果可以存入新数据文件也可以替换当前数据文件。上图中各个零件的含义如下:·BreakVariables框:用于选择分组变量·AggregateVariables框:用于选择被汇总的变量·NameLabel钮:用于定义新产生的汇总变量的名称和标签·Function钮:用于定义汇总函数共有三组函数以最常用的第一组为例可选的函数有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最大值共个·SaveNumberofcasesinbreakgroupasvariable复选框:用于定义一个新变量以存储同组的记录数·Createnewdatafile单选钮:定义一个新文件以存储汇总的结果右侧的File钮用于具体文件名的定义默认文件名为AGGRsav·Replaceworkingdatafile单选钮:用汇总的结果替换原来的数据。例 计算Lisav中两组的血磷值标准差。解:该题完全可以用更简单的方法完成这里只是演示一下汇总对话框的用法。BreakVariables框:GroupAggregateVariables框:xFunction钮:(Standarddeviation单选钮:Continue钮)Replaceworkingdatafile单选钮:选中OK【SplitFile对话框】用于将数据文件分组进行处理该对话框我们在第一章时已经使用过了这里再介绍一下各个对话框元素的用途:·Analyzeallcases单选框:和下面的两个单选框为一组选中本框不拆分文件·Comparegroups单选框:按所选变量拆分文件各组分析结果紧挨在一起便于相互比较·Organizeoutputbygroups单选框:按所选变量拆分文件各组分析结果单独放置· Groupsbasedon框:用于选择拆分数据文件的变量·Sortthefilebygroupingvariables单选框:将数据按所用的拆分变量排序·Fileisalreadysorted单选框:数据保持原状不按所用的拆分变量排序。【SelectCases对话框】很多时候我们不需要分析全部的数据而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前个数据进行分析以了解大概情况)这时使用SelectCases对话框可以大大简化工作。该对话框界面如下所示:其中主要的对话框元素为:·Allcases单选钮:和下面的个单选钮为一组选中它则分析所有的记录·Ifconditionissatisfied单选钮:只分析满足条件的记录· If按钮:和If单选钮一起使用单击后弹出If对话框·Randomsampleofcases单选钮:从原数据中按某种条件抽样· Sample按钮:和Random单选钮一起使用可以设定按百分比抽取记录或者精确设定从前若干个记录中抽取多少个记录·Basedontimeorcaserange单选钮:基于记录序号来选择记录· Range按钮:和Based单选钮一起使用用于输入记录序号范围·Usefiltervariable单选钮:使用筛选指示变量来选择记录必需在下面选入一个筛选指示变量该变量取值为非的记录将被选中进入以后的分析·Filtered单选钮:和下面的Deleted单选钮为一组表示未被选中的记录只是被隔离这些记录的记录号会被加上斜杠以示区别·Deleted单选钮:未被选中的记录将被删除一般不要使用。当对数据集做出筛选后所做的筛选将在以后的分析中一直有效直到再次改变选择条件为止。同时在多数情况下系统会自动产生一个名为filter$的筛选指示变量被选中的记录该变量取值为反之则为。【WeightCases对话框】在默认情况下每一行就是一条记录这在多数情况下没有什么问题但有时却非常麻烦想想看如果你需要计算一个四格表卡方有例如果每一行就是一条记录你就需要输入条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理就需要用到WeightCases对话框。该对话框的使用极为简单界面上有两个单选钮分别是不权重记录和用某变量权重记录如果选择后者则需要选中一个权重变量。【Data菜单中的其余对话框】·Definedates对话框:可以自动生成时间变量。·InsertVariable命令:在当前列插入新变量。·Insertcases命令:在当前行插入新记录。·Gotocases对话框:到达指定记录号的记录该命令在记录数极多时(条以上)非常有用。 正交设计菜单项正交设计不包含在SPSSBASE模块中因此由于解密范围的问题有的D版中不含该菜单项不过我用的版里是有的:)。以前我以为SPSS不能作正交设计感谢网友edofsh的提醒经研究在SPSS中可以直接进行正交设计OrthogonalDesign子菜单项就是专门用于完成该任务的具体做法用下面的例子说明如下:例做A、B两个因素的正交设计A因素有三个水平B因素有两个水平。解:选择Data>OrthogonalDesign>generate弹出的就是正交设计窗口操作如下:Factorname框:输入A单击ADD钮确定变量A被选中单击Definevalue钮 Value列:头三行分别输入、和代表变量A的三个水平 单击continue钮Factorname框:输入B单击ADD钮确定变量B被选中单击Definevalue钮 Value列:头两行分别输入、代表变量B的两个水平 单击continue钮单击OK在第步定义完后对话框应如下图所示:在其他没有用到的选择项中各种LABELS当然适用于定义相应的各种标签的DataFiles单选框组用来定义产生的数据文件是存为制定的文件名还是直接替换当前工作文件而DefineValue对话框中的Autofit框可以自动填充从到你输入的那个数值这么多个水平的定义特别适合我这种懒人。这里我们直接替换当前工作文件在这个自动产生的正交设计数据集中前两个变量就是要分析的A和B各个水平已经按正交设计的要求排列好了。后面的status和card变量是系统产生的LOG变量可以不管它。现在你再建立一个结果变量输入实验结果就可以进行正交设计的分析了。 回第二章(上)回教程首页到第三章 

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/16

SPSS教材第二章 数据文件的管1

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利