下载

2下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 SPSS教材第十章 多元线性回归与曲线拟合

SPSS教材第十章 多元线性回归与曲线拟合.doc

SPSS教材第十章 多元线性回归与曲线拟合

张子彧2011
2018-09-07 0人阅读 举报 0 0 暂无简介

简介:本文档为《SPSS教材第十章 多元线性回归与曲线拟合doc》,可适用于IT/计算机领域

第十章:多元线性回归与曲线拟合――Regression菜单详解(上)(医学统计之星:张文彤)上次更新日期:Linear过程简单操作入门界面详解输出结果解释复杂实例操作分析实例结果解释CurveEstimation过程界面详解实例操作BinaryLogistic过程界面详解与实例结果解释模型的进一步优化与简单诊断模型的进一步优化模型的简单诊断 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中此类问题很普遍如人头发中某种金属元素的含量与血液中该元素的含量有关系人的体表面积与身高、体重有关系等等。回归分析就是用于说明这种依存变化的数学关系。§ Linear过程简单操作入门调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中用户还可根据需要选用不同筛选自变量的方法(如:逐步法、向前法、向后法等)。例:请分析在数据集Fatsurfactantsav中变量fat对变量spovl的大小有无影响?显然在这里spovl是连续性变量而fat是分类变量我们可用用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法回归分析来解决它。回归分析和方差分析都可以被归入广义线性模型中因此他们在模型的定义、计算方法等许多方面都非常近似下面大家很快就会看到。这里spovl是模型中的因变量根据回归模型的要求它必须是正态分布的变量才可以我们可以用直方图来大致看一下可以看到基本服从正态因此不再检验其正态性继续往下做。界面详解在菜单中选择Regression==>liner系统弹出线性回归对话框如下:除了大家熟悉的内容以外里面还出现了一些特色菜让我们来一一品尝。【Dependent框】用于选入回归分析的应变量。【Block按钮组】由Previous和Next两个按钮组成用于将下面Independent框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法如果对不同的自变量选入的方法不同则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。【Independent框】用于选入回归分析的自变量。【Method下拉列表】用于选择对自变量的选入方法有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有变量均有效。【SelectionVariable框】选入一个筛选变量并利用右侧的Rules钮建立一个选择条件这样只有满足该条件的记录才会进入回归分析。【CaseLabels框】选择一个变量他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。【WLS>>钮】可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框出现WLSWeight框在该框内选入权重变量即可。【Statistics钮】弹出Statistics对话框用于选择所需要的描述统计量。有如下选项:·RegressionCoefficients复选框组:定义回归系数的输出情况选中Estimates可输出回归系数B及其标准误t值和p值还有标准化的回归系数beta选中Confidenceintervals则输出每个回归系数的可信区间选中covariancematrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。·Residuals复选框组:用于选择输出残差诊断的信息可选的有DurbinWatson残差序列相关性检验、超出规定的n倍标准误的残差列表。·Modelfit复选框:模型拟合过程中进入、退出的变量的列表以及一些有关拟合优度的检验:RR和调整的R,标准误及方差分析表。·Rsquaredchange复选框:显示模型拟合过程中R、F值和p值的改变情况。·Descriptives复选框:提供一些变量描述如有效例数、均数、标准差等同时还给出一个自变量间的相关矩阵。·Partandpartialcorrelations复选框:显示自变量间的相关、部分相关和偏相关系数。·Collinearitydiagnostics复选框:给出一些用于共线性诊断的统计量如特征根(Eigenvalues)、方差膨胀因子(VIF)等。以上各项在默认情况下只有Estimates和Modelfit复选框被选中。【Plot钮】弹出Plot对话框用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图应变量、预测值和各自变量残差间两两的散点图等。【Save钮】许多时候我们需要将回归分析的结果存储起来然后用得到的残差、预测值等做进一步的分析Save钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的SPSS数据文件或XML中。【Options钮】设置回归分析的一些选项有:·SteppingMethodCriteria单选钮组:设置纳入和排除标准可按P值或F值来设置。·Includeconstantinequation复选框:用于决定是否在模型中包括常数项默认选中。·MissingValues单选钮组:用于选择对缺失值的处理方式可以是不分析任一选入的变量有缺失值的记录(Excludecaseslistwise)而无论该缺失变量最终是否进入模型不分析具体进入某变量时有缺失值的记录(Excludecasespairwise)将缺失值用该变量的均数代替(Replacewithmean)。输出结果解释根据题目的要求我们只需要在Dependent框中选入spovlIndependent框中选入fat即可其他的选项一律不管。单击OK后系统很快给出如下结果:Regression这里的表格是拟合过程中变量进入退出模型的情况记录由于我们只引入了一个自变量所以只出现了一个模型(在多元回归中就会依次出现多个回归模型)该模型中fat为进入的变量没有移出的变量具体的进入退出方法为enter。上表为所拟合模型的情况简报显示在模型中相关系数R为而决定系数R为校正的决定系数为。这是所用模型的检验结果可以看到这就是一个标准的方差分析表!有兴趣的读者可以自己用方差分析模型做一下就会发现出了最左侧的一列名字不太一样外其他的各个参数值都是相同的。从上表可见所用的回归模型F值为P值为因此我们用的这个回归模型是有统计学意义的可以继续看下面系数分别检验的结果。由于这里我们所用的回归模型只有一个自变量因此模型的检验就等价与系数的检验在多元回归中这两者是不同的。上表给出了包括常数项在内的所有系数的检验结果用的是t检验同时还会给出标化未标化系数。可见常数项和fat都是有统计学意义的上表的内容如果翻译成中文则如下所示: 未标准化系数标准化系数 模型 系数b系数标准误系数βt值P值常数  fat复杂实例操作分析实例例:请分析在数据集plasticsav中变量extrusn、additive、gloss和opacity对变量tearres的大小有无影响?已知extrusn对tearres的大小有影响。显然这里是一个多元回归由于除了extrusn确有影响以外我们不知道另三个变量有无影响因此这里我们将extrusn放在第一个block进入方法为enter(我们有把握extrusn一定有统计学意义)另三个变量放在第二个block进入方法为stepwise(让软件自动选择判断)操作如下:Analyze==>Regression==>LinerDependent框:选入tearresIndependent框:选入extrusn单击next钮Independent框:选入additive、gloss和opacityMethod列表框:选择stepwise单击OK钮结果解释最终的结果如下:Regression上面的表格依次列出了模型的筛选过程模型用进入法引入了extrusn然后模型用stepwise法引入了additive另两个变量因没有达到进入标准最终没有进入。上面的表格翻译出来如下:模型进入的变量移出的变量变量筛选方法extrusn 进入法additive stepwise法(标准:进入概率小于移出概率大于)上表是两个模型变异系数的改变情况从调整的R可见从上到下随着新变量的引入模型可解释的变异占总变异的比例越来越大。上表是所用两个模型的检验结果用的方法是方差分析可见二个模型都有统计学意义。上表仍然为三个模型中各个系数的检验结果用的是t检验可见在模型中所有的系数都有统计学意义上表的内容翻译如下:  未标化的系数标化的系数  模型 B标准误Betat值P值(常数)   extrusion(常数)  extrusion additive这是新出现的一个表格反映的是没有进入模型的各个变量的检验结果可见在模型中未引入模型的候选变量additive还有统计学意义可能需要引入而模型中没有引入的两个变量其P值均大于无需再进行分析了。CurveEstimation过程CurveEstimation过程可以用与拟合各种各样的曲线原则上只要两个变量间存在某种可以被它所描述的数量关系就可以用该过程来分析。但这里我们要指出由于曲线拟合非常的复杂而该模块的功能十分有限因此最好采用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析或者采用其他专用的模块分析。界面详解CurveEstimation过程中有特色的对话框界面内容如下:下面我们分别解释一下它们的具体功能。【Dependent框】用于选入曲线拟和中的应变量可选入多个如果这样则对各个应变量分别拟合模型。【Independent单选框组】用于选入曲线拟和中的自变量有两种选择可以选入普通的自变量也可以选择时间作为自变量如果这样做则所用的数据应为时间序列数据格式。【Models复选框组】是该对话框的重点用于选择所用的曲线模型可用的有:·Linear:拟合直线方程实际上与Linear过程的二元直线回归相同·Quadratic:拟合二次方程Y=bbXbX·Compound:拟合复合曲线模型Y=b×bX·Growth:拟合等比级数曲线模型Y=e(bbX)·Logarithmic:拟合对数方程Y=bblnX·Cubic:拟合三次方程Y=bbXbXbX·S:拟合S形曲线Y=e(bbX)·Exponential:拟合指数方程Y=bebX·Inverse:数据按Y=bbX进行变换·Power:拟合乘幂曲线模型Y=bXb·Logistic:拟合Logistic曲线模型Y=(ub×bX)如选择该线型则要求输入上界。上面的几种线型和其他的模块有重复如Logistic、Liner等由于本模块的功能有限在重复的情况下建议用其它专用模块来分析。【Includeconstantinequation复选框】确定是否在方程中包含常数项。【Plotmodels复选框】要求对模型做图包括原始数值的连线图和拟合模型的曲线图。【save钮】弹出SAVE对话框用于定义想要存储的中间结果如预测值、预测值可信区间、残差等。【DisplayANOVAtable复选框】要求显示模型检验的方差分析表。实例操作例:锡克试验阴性率()随着年龄的增长而增高某地查得儿童年龄(岁)X与锡克试验阴性率Y的资料如下试拟合曲线。年龄(岁)锡克试验阴性率()首先对年龄和阴性率作散点图发现两者有斜率逐渐放缓的曲线趋势因此选择二次曲线模型、三次曲线模型和对数曲线模型最终取其中结果最优者做法如下:Analyze==>Regression==>CurveestimationDependant框:选入阴性率Independant框:选入年龄Models复选框组:选择Quadratic、Curbe、Logarithmatic取消对Liner的选择。单击OK结果如下:CurveFitMODEL:MODIndependent:年龄DependentMthRsqdfFSigfbbbb阴性率LOG阴性率QUA阴性率CUB上表给出了所拟合的三个模型的检验报告包括拟合优度、模型的检验结果和各个系数值从检验结果看三个模型均有统计学意义但从拟合优度看三次方曲线的拟合优度最高似乎应选择三次方曲线但注意三次方曲线多一个参数要复杂一些而它的拟合优度和二次方曲线相差不大因此仅从这里的结果还不好对它们两者作出判断下面我们还要看看模型曲线的情况。上图是三个模型曲线和实际值连线的情况可见在岁以前二次方和三次方曲线对模型的拟合相差不大岁以后三次方曲线则要明显优于二次方曲线但我们的观察值只有例样本量太少在曲线回归中模型的简洁性和拟合优度的高低同样重要拟合优度太高的模型往往对新样本的拟合度较差我认为在这种情况下选择参数较少的模型为宜因此最终选择二次方曲线模型。其实这里由于观察样本太少无论选择哪种模型影响都不大而且各人的意见不会相同往往是有多少条曲线就会有多少种意见最后还是要结合专业知识来决定我这样写只是让大家明白曲线拟和是非常复杂的问题千万不能轻易下结论。回第九章回教程首页到第十一章 

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/13

SPSS教材第十章 多元线性回归与曲线拟合

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利