下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 定量研究方法论--多变量回归建模

定量研究方法论--多变量回归建模

定量研究方法论--多变量回归建模

雪儿
2008-11-24 0人阅读 举报 0 0 暂无简介

简介:本文档为《定量研究方法论--多变量回归建模pdf》,可适用于高等教育领域

第八章线性回归的建模引言我们以前对于单变量与多变量回归模型的介绍侧重于理解应、自变量之间的最基本的数量关系也即回归模型是如何表达应变量是如何被自变量解释的、应变量中的信息可以如何被分解成不同的部分、这些不同的信息如何反映在回归系数、(偏)决定系数、部分相关系数、残差、与方差分析上。我们在这一章所侧重的是如何理解与测试自变量之间的关系。在社会学的研究中一个线性回归模型并不只是简单地把所有的预期有用的自变量放入到一个模型中而是需要我们同时也要考虑自变量之间的关系。比如两个自变量之间也可能是因果相关的或者它们是从类似的角度来表达同一个现象或者一个自变量对应变量的作用受到另外一个自变量水平的影响。对这些不同的自变量之间的关系的分析是一个科研模型在数据收集与测试之前的不可或缺的步骤。在这一章我们将先介绍多重共线性(multicollinearity)它描述了两个变量之间的因为有过多的信息重复而导致的问题。然后我们介绍自变量之间的中继关系即一个自变量通过另一个自变量对应变量起作用。最后我们介绍两个自变量之间的调节作用即一个自变量对应变量作用的大小取决于另外一个自变量的水平。多重共线性我们先来回顾一下前一章的例子。我们假设消费者对网店的信任受到两个变量的影响:网店的易用性与易学性。我们的方差分析结果表明虽然这两个变量在独自作用时对应变量都有显著影响当组合在一起时:ModelSumofSquaresdfMeanSquareFSigRegressionxx|xResidualTotal所以根据额外平方和易学性在易用性的基础上没有显著地增加对信任的解释。我们把这种结果归因于易学性和易用性之间的信息重复。这种模型的“危害”有哪些呢?我们在以前已经提到过这种模型:*没有简洁性*具有误导性。如果我们只看回归分析的结果我们很可能得到一个错误的结论:易学性是不重要的。版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0如果我们查看组合模型的回归系数我们还会发现易学性的系数是负的()这几乎是这个变量单独作用是的相反数()。这“说明”易学性对信任有负的作用。这是误导性的另外一个表现:回归系数的方向不正确。如果我们查看组合模型的回归系数我们还会发现易用性系数也受到了影响。这个系数在单独作用时是在组合模型中是几乎翻倍。这是误导性的另外一个表现:回归系数不稳定。这种不稳定性还表现在如果我们用不同的样本我们可能得到相当不同的回归系数。在这个例子中组合模型可以理解为先是过高地表达了易用性对信任的作用()然后再用易学性进行反向调整()。显然这不是我们建立回归模型的初衷(或者说我们以前往往对回归分析有一种误解认为每一个回归系数表达了一个自变量对应变量的直接作用)。我们还会发现回归系数的标准差变大了。对于这两个自变量它们的标准差至少翻倍。这与回归系数的不稳定性是一致的标准差变大意味着回归系数的变化范围变大。同时它也意味着这两个变量都变得更不容易具有显著性因为显著性与系数的标准差成反比。独立作用时组合模型UnstandardizedCoefficientstSigUnstandardizedCoefficientstSigBStdErrorBStdErrorpeoupeoupeolpeol这些问题在线性回归中叫做多重共线性问题因为线性关系不只出现在自、应变量之间而且出现在自变量之间。这种出现在自变量之间的线性关系使得自变量对应变量的作用难以直观解释并使得线性回归的结果不具有可靠性。那么多重共线性的最基本的形成原因是什么呢?从理论的角度看这是因为自变量之间的信息重叠。这种信息重叠会导致一系列的数学后果最终使得回归系数变得无法解释或者不可靠。如何鉴定多重共线性呢?对于一个经过标准化的两个自变量的回归模型我们在前一章提到过:)(brrrr−−=−−=yx'x'yx'yx'=(x的相对于x的残差与y的积和x中的独特信息)所以b是一个y的线性组合。这意味着当x中的独特信息很少即很小b的方差就会很大。x)(r−k中在被其它所有的自变量联合解释后的独特信息又被叫做它(相对于其它自变量)的容限(tolerance)。一个自变量中的独特信息越多它的容限越小即它越不容纳其它自变量中的信息。当一个变量中的信息全部是独特是时候它的容限是。注:PedharzurandSchmelkindefinedtoleranceinanotherwayThisneedstobechecked。的倒数叫做方差膨胀系数(VIFvarianceinflationfactor)。可以证明(附一)在标准化后的回归模型中b的方差是残差的方差乘以这个方差膨胀系数。当一个自变量中全部是独特信息时方差膨胀系数=。方差膨胀系数是一个多重共线性的重要指标。在社会)(kR−)(kR−版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0科学中经验法则是每一个自变量的方差膨胀系数应该小于(ref)(Kutneretal,)。显然这个经验法则要求每一个变量的独特信息至少是。但是方差膨胀系数小于并不意味着没有多重共线性。在这个例子中VIF(x)=()=。但是显然多重共线性已经产生严峻的副作用。另外一个鉴定多重共线性的常用指标是状况系数(conditionindex)。它的计算方法是(VellemanandWelsch,):*先把每一列的x值标准化为长度为*对于标准化的自变量计算其X’X*求出X’X的特征根(λi)*计算每个自变量xi的状况系数=iλλmax。状况系数的基本思想是先求出自变量中的主成份。我们会在以后更详细地介绍主成份分析。主成份表明一组自变量中的信息可以重新表述为一组相互独立的主成份。其中每个主成份是所有自变量的一个线性组合。这样得到的主成份对应于一组特征根特征根的大小表示一个主成份的信息量。如果两个变量具有很高的相关性就会产生很小的特征根。因为状况系数与一个主成份的信息量成反比所以状况系数越大一个主成份越不重要。这里的经验法则是如果状况系数大于多重共线性的问题就可能很严重。这时我们会查看哪些自变量与很小的主成份相关。如果两个自变量可以同时由这个很小的主成份解释并表现为自变量的方差中大于是由这个很小的主成份贡献的我们就知道这两个自变量之间有多重共线性(常数项除外)。在以上的例子中从SPSS的输出我们得到:CollinearityDiagnostics(a)ModelDimensionEigenvalueConditionIndexVarianceProportions(Constant)peoupeolaDependentVariable:trust可以看出PEOU和PEOL同时负载一个很小的主成份信息所以具有多重共线性。除了这两种方法以外我们可以用其它相对比较不正式方法比如观察两个自变量相关系数的大小、不同模型复杂程度时回归系数的大小、方向、与方差等。对于VIF与状况指数一般来讲只要任何一个表明有多重共线性我们就应该认为这个模型中有多重共线性问题(myopinion)。那么如果我们的模型中有多重共线性问题我们该怎么办呢?首先我们要把变量中心化。中心化有助于降低计算过程的舍入误差舍入误差是另外一个多重共线性的原因。一种办法是把有问题的自变量中的一个拿掉。这意味着修改原来的理论模型。而基于数据的模型修改永远是危险的。我们所发现的多重共线性可能只是版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0由于这个样本的特殊性。“后见之明”会增加我们拒绝一个不该拒绝的假设的风险从而降低这个模型的统计效用(statisticalpower)。所以正确的方法是在设计理论模型的过程中就充分考虑到多重共线性出现的可能性避免相关性高的自变量从根本上解决这个问题。另一种方法是组合相关性很高的自变量(Stevens,)。在这种情况下多个相关性很高的自变量其实被看作一个隐性变量(latentvariable)的显性测度。常用的办法是把这些相关自变量进行加总或平均然后再放入回归模型。这种方法必须首先保证相关自变量具有理论上的相关性。否则这种组合是没有意义的。在实际研究中研究者往往事先计划(而不是事后投机)使用多个高度相关的显性测度来表示一个隐性变量并用其均值进行回归。当然理论模型要针对隐性变量而不是显性测度。我们会在以后再详细介绍这种使用多个测度项的方法。第三种方法是用(ridgeregression)。使用这种方法不需去除自变量。但这种方法也被批评在行为研究中极少被应用。中介作用(mediatoreffect)多重共线性也可能表明一个自变量对应变量的作用是由另外一个自变量所中介。如果x和z对y的单独作用是显著的但是当我们把它们放在一起的时候我们可能发现x对y的影响(c’)为零(回归系数为或不显著)或者回归系数相对于x单独作用于y时显著地降低(c’)但仍大于零(图?)。如果x的回归系数变为零这种情况叫做完全中介如果只是显著降低则为部分中介(partialmediation)。显然部分中介的情况更为普遍(BaronKenny,Frazieretal,)。z是中介变量(mediator)。中介作用表达了一组变量之间的间接因果关系。这样的关系往往就是一个理论假设的重点。很多论文的主题就是为了测试几个变量之间的的间接关系。如果一个中介作用成立它至少有两个作用:一是给出一组因果关系的过程描述从而给模型一些在时间维度上的意义虽然严格的过程测试需要使用追踪调查(longitudinalstudy)第二以y为核心变量这种方法给出一种区分外围与直接原因的工具。这样我们可以理清哪些变量是y的最直接原因从而简化且深化对y的理解。所以这种测试计划首先必须是基于理论论证的。Baron与Kenny()早期提出了测试中介作用的三个步骤。第一用x对y作回归并显示x对y是显著的。第二用x对z作回归并显示x对z是显著的。第三用z对y作回归并显示z对y是显著的。第四用x与z对y作回归并显示x的作用显著降低(cc’)。其中(cc’)与ab是等价的(请读者思考xxbcyzyzac’y版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0为什么)theunderstandardizedcoefficientsab是正态分布且方差为(Kenny,)。Frazier等()总结前人认为第一步骤是不必要的因为一个变量x可能被两个其它变量所中介而且这两个中个变量具有相反的作用从而使x的直接作用不显著。babasssasb哪些变量我们应该假设为中介变量呢?这首先是由理论决定的。但是除了理论之外选择测试哪个中介变量还有一些实际考虑。第一个实际中的问题是统计效能(power)的问题(Frazieretal,)。有的中介变量虽然存在却很难测试到。这个问题是这样产生的:x与z可能是高度相关的因为多重共线性的问题这就可能导致在y=f(x,z)中z不具有显著性从而不满足Baron与Kenny()的测试条件。一种增加统计效能的办法是增加样本量。对于一个样本量NKenny等()提供了一个计算有效样本量的公式:其中r)(xzrN−xz是x与z的相关系数。这个公式意味着一个大小为N的样本只能具有大小为的实际效能。研究者应该先估算r)(xzrN−xz并适当调整样本大小。一般来讲样本量在以上是最低要求(HoyleKenny,)。第二个实际问题是rxy与rzy的大小。Kenny等()建议rxy要小于等于rzy以确保有足够的统计效能。这种要求不难理解:如果rxy大于rzy很可能在y=f(x,z)中z不具有显著性从而让人质疑是x中介了z还是z中介了x。另外一个导致统计效能降低的原因是测量误差。用多个测度项是一种解决办法。研究者可以使用结构方程模型其测试过程与回归模型是一样的。一个理论模型往往也包含其它自变量那么在测试中介关系时是否要包含它们呢?Kenny等()建议在y=f(x,z)中包含其它变量。这样如果有一个变量是x与z的共因就会被发现从而避免似是而非的中介关系。此时以上的方差计算公式就不适用(为什么?)。我们现在来看一个例子。在心理学中一个建立已久的观点是行为意愿由我们对事物的态度决定而态度则是由一些对事物的认知决定。相应地我们的理论模型认为网店的易用性是通过网店的有用性对购买意愿产生影响也即:我们可以得到以下的回归结果:测试步骤PathBSEBSIGCI标准BPI=f(PEOU)(c),*PU=f(PEOU)(a),**PI=f(PEOU,(c’),PU)(b),***p<,**p<显然作中介分析的条件是成熟的。我们然后计算:)(=×××==babasssasbabsabs(ab)=。PEOUPUPI版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0这个zscore远大于所要求的所以这个降低是显著的中介关系成立。要注意一般的统计软件并不提供这种测试过程研究者要自行计算。调节作用(moderatoreffect)在社会学与行为学的研究中一个经常会碰到的现象是一个变量对另外一个变量的影响受到第三个变量的影响。在管理学中七八十年代发展起来的所谓权变管理(contingencymanagement)理论的主要论点就是管理方法要应情境的不同而变化因为事物之间的关系会因为情境的变化而变化。当工人的工资水平低下时增加工资可以提高工作业绩当工资水平高是再提高工资水平就不见得有效了。权变管理理论不是一个统一的理论而是一类覆盖各种课题、庞杂多样的研究其共同点是探索两个变量在不同情况下的关系。而代表这个“不同情况”的第三个变量就是我们在这里所要讲的调节变量(moderator)有时也叫条件变量(condition)。一个调节变量是一个类别型的或连续型的变量它影响一个自变量对一个应变量的作用的大小或方向(BaronKenny,)。在这个关于工资的例子中一个工人的工资水平影响工资水平对工作业绩的作用。在此工资水平是其自身的调节变量。这是一种并不少见的现象。在线性回归或者实验分析的范畴中这种调节作用也常被叫做相互影响作用(interactioneffect)。Cohenetal()把相互影响定义为两个自变量通过相互作用对应变量产生影响这种影响超乎它们各自对应变量影响之和。虽然调节作用与相互影响在数学分析上是一模一样的这两种名称的不同在于调节作用强调了一个调节变量所起的特殊角色。这种角色的区分是理论上的而不是数学上的在数学分析中一个变量是调节变量还是一般的自变量并没有不同。这种相互影响往往通过引入一个自变量与调节变量的积来表示。这样的回归分析叫做有调节多变量回归(MMR,moderatedmultipleregression)。权变管理的思想本身并没有什么新意但是定量方法论的发展与应用却使对这种思想的科学测试变得可能。yz=z=x版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0Baron和Kenny()从概念上区分了两种不同的调节作用。第一种是一个自变量与应变量之间的零阶相关系数(即我们所讲的两个变量之间的相关系数)因调节变量的不同而变化这种不同被叫作合理性差异(differentialvalidity)。Sharmaetal()给出一种不同的定义当调节变量与自变量与应变量同时不相关时自变量与应变量关系的强弱被理解为在不同调节变量取值下(比如不同的组别中)自变量所解释的应变量信息即R的变化而不是回归系数的变化。这样调节变量被叫做同质化调节变量(homologizer)。我很难想象这种情形:如果调节变量与应变量同时不相关它又如果降低应变量中的方差?第二种是一个自变量与应变量的关系的性质、表现为相关性的正负方向因着调节变量的变化而变化这种变化被叫作预测性差异(differentialprediction)。有的学者(CarteRussel,)认为MMR只适用于预测性差异但是没有提出具体的原因。主流的作法似乎并不区分这两种不同(例:Cohenetal,)。另外在实验设计中尤其是因子设计中(factorialdesign)一个因子往往是调节变量。实验设计与回归分析在理论上是一致的所以我们对于MMR的讨论也将适用于实验设计。Baron和Kenny()指出不同的调节作用不管是在相关分析的框架内还是在实验设计的框架内可以有共同的分析框架并用一样的MMR来测试调节作用。Baron和Kenny()的调节作用测试框架可以表示为下图:Predictorx在这个框架中预测变量x(如此命名以区分调节变量)与调节变量z对y的直接作用叫做这两个变量的主作用(maineffect)它们的积对Y的影响叫作调节作用。如果调节作用是显著的那么一个调节作用假设就被支持。对于一个调节作用假设主作用的显著与否并不是条件。当调节变量没有主作用是且与预测变量不相关时Sharmaetal()把它叫作单纯调节变量(puremoderator)否则半调节变量(quasimoderator)。单纯调节变量的回归系数有比较清晰的解释对半调节变量的回归系数的理解就必须谨慎我们会在下面讨论。理解回归系数调节作用的实质是什么呢?尽管以下的图示给我们一些直观的认识我们现在对它进行数理方面的分析。我们先来看最普通的情形:预测变量与调节变量都是连续变量。我们假定:ModeratorzOutcomeyInteractionx×z版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0ˆbXZbZbXbY=其中X与Z是中心化了的XZ是中心化的X与中心化的Z的积XZ本身没有中心化。这个方程表示在不同的Z取值上有不同的Y与X的回归线。所以Y与X的关系是以Z为条件的。从数学的角度我们容易看出:)()(ˆbZbXZbbY=。)(Zbb是Y与Z之间的简单回归斜度这个斜度是以Z为条件的。如果我们想画这个的不同回归线我们应该如何画呢?Cohenetal()建议使用ZM、ZH、和ZL对应于Z的均值、均值加一个标准差、均值减一个标准差。对于大部分行为研究而言我们往往对b的显著性感兴趣所以Z值的选取只是为了以图例增加说明对于其斜度的理解(即X对Y作用的强度)需十分谨慎。如果这些回归线在有意义的取值范围内互不相交这时调节作用是次序性(ordinal)否则是非次序性的(disordinal)(AikenWest,)。行为研究中很少对这个交点感兴趣。我们前面提到对X与Z的中心化为什么呢?MMR一个重要的数学特征是它不具有尺度稳定性(scaleinvariant)也就是说回归系数及其显著性会随测量尺度的变化而变化。我们来看:如果X’=Xc,Z’=Zf:)(''')(')(ˆcfbfbcbbZXbZcbbXfbbY−−−−=如果b=当对X或Z的尺度加一个常数项时b与b并不会变化。如果b≠当对X或Z的尺度加一个常数项时b与b会变化但b不会。由于与坐标轴的交点也发生了变化调节作用的次序性也会发生变化。所以对次序性的理解也要考虑尺度的影响。总结来讲MMR中回归系数不具有尺度稳定性这与没有调节作用项时的回归是不同的。另外以上的推导也说明一个MMR的回归系数可能会因为尺度的不同而改变正负并误导我们对模型的理解。中心化的另外一个好处是降低多重共线性而不至于影响真正关系。b可以理解为X对于Z或Z对于X(取决于理论假设我们以Z为调节变量)的增强或减弱作用。而b与b是一种X或Z对Y在一定条件下的作用(conditionaleffect)这个条件是另外一个变量的取值。当Z是中心化的时候不难看出b是Z为时X对Y的作用也就是X对Y的平均作用。当X与Z未经标准化的时候我们就很难有这样直观的解释。(考虑一下如果我们使用Likert尺度且不对Z作中心化我们可以直观理解b吗)当调节变量是类别变量时通常我们使用哑元当然我们也可以在必要的时候使用未加权编码或加权编码。这些编码的建立过程与适用情况我们已经在前一章讨论过了。当使用类别变量时我们仍然可以对X作中心化或标准化但不需对哑元或其它编码作标准化。我们来看一个例子。如果我们对学生成绩GPA与毕业时工资y的关系感兴趣但我们又认为这种关系因专业不同而不同我们可以有建立一组哑元:EE人文专业LA版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0工程专业E管理专业BUS我们的回归方程是:ˆbGPAEbGPAEbGPAbEbEbY××=那么b至b各代表什么意思呢?我们把这个问题留给读者作为练习。测试过程在测试之前我们可以对X与Z作不同的数据处理:一、用X与Z的原始数据和原始数据的积二、中心化X与Z并由此得到积三、标准化X与Z并由此得到积。对于以上每一个种数据处理我们又会得到未标准化与标准化的回归系数。那么到底哪一个结果是我们应该使用的结果呢?(AikenWest,Friedrich,)建议首先标准化X与Z得到zx与zz然后用它们来计算zxzz。这些值再被用到对Y的回归中。Cohenetal()建议勿需对Y进行标准化以对它进行直接预测而不需单位转化。得到的未标准化的回归系数是最后的解而不是标准化的解。但是如果一个变量具有有意义的零点是所谓的比例变量(ratiovariable)比如网上购买次数、兄弟姐妹个数则不须中心化或标准化(Cohenetal,)。对其系数相应的解释也应不同这时一个变量的回归系数不是平均作用而是零点时的作用。要注意就各回归系数的显著性而言是否中心化或标准化X、Z、Y并不没有影响。数据准备好了以后我们可以用分层多变量回归方法(hierarchicalmultipleregression)来分析数据。我们可以有三个回归模型:第一个只包含预测变量的一次项(有的学者认为(Frazieretal,)这一步可省)第二个只包含预测变量与调节变量的一次项第三个在一次项的基础上包含调节作用。我们应该用逐步向下还是逐步向上的步骤呢?在逐步向下过程中我们以一个包括调节作用的完整模型开始然后去掉调节作用最后去掉调节变量的一次项。在逐步向上的过程正好相反。就显调节作用的著性而言显然我们只关注完整模型所以采用哪个过程并无不同。所不同的时当我们使用逐步向上的过程时我们可能会在做一阶项回归时被诱惑去解释一次项的回归系数。这时的解释是不应该的因为我们还不知道调节作用是否显著。逐步向下的过程可以在一定程度上避免这种诱惑所以可能更好(AikenWest,)。我们不应该使用有调节作用、却没有调节变量的主作用的的模型(Cohenetal,)因为如果一次项是显著的那么对调节项的理解就被这个忽视的一次项所混淆(confounded)。对于调节变量的显著性有的学者(CarteRussel,)认为应该就这一项所增加的R作Ftest而不是直接解释系数的的ttest。当一个调节变量调节多个预测变量时或者在调节变量是哑元时(这时我们有多个调节变量)显然Ftest是必须的。我们推荐使用Ftest。测试后对于我们面临如下问题:如果b不显著是否要去除XZ并重新估计其它系数?Aiken和West,()认为这是理论决定的。如果在理论中我们有很强的理由来认为有这样的调节作用即使结果不显著我们也ˆbXZbZbXbY=版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0不要重新估计。这有助于积累这个领域的发现并为以后的宏观分析(metaanalysis)作铺垫。当然我们也可以尝试着去掉XZ来观看对b、b的影响这时这种观察是探索性的而不是实证性的。调节作用中的统计效能学术界曾一度对权变管理的思想的有效性产生怀疑因为大量的测试发现所假设的调节作用往往不被支持。虽然在管理中很多地方我们现在仍然不知道何时应该“随机应变”何时应该“以不变应万变”从方法论的角度来看许多实际存在的调节作用在实证研究中却是很难测到。很多时候这可能不是因为调节作用不存在而是我们的数学工具即MMR或是我们的研究设计与分析过程中的疏忽使得我们很难测到这种调节作用从而让我们觉得调节作用是不存在的。无法测到存在的关系是一个统计效能的问题。我们在此总结一些影响统计效能的因素(Frazieretal,)。第一研究者应事先估计调节作用的效用大小(effectsize)。一个变量的效用大小指的是它在其它变量的基础上带来的额外的R。对于调节作用这是在一次项基础上的额外的R。这种估计是基于对前人研究的总结。调节作用的效用往往是很小的。而检测到效用所需的样本量与效用大小成反比所以对于调节作用的测试需要大的样本量。另外其它预测变量的效用也对测试调节作用的效能产生影响。其它预测变量的效用越高越好。一样这需要从前人的研究中去总结。第二变量的选择。对于类别型的调节变量各组别的样本量应尽量相等。当各组别的样本量不同时统计效能开始下降。一般地各组别的样本大小差异应控制在以内。另外各组的残差方差应当尽量一致。当调节变量是连续变量时测量误差会降低统计效能。这不是MMR所特有的问题。但是因为MMR中有一个二次项(积)测量误差使得调节项的可靠性(reliability)大大降低。过粗的尺度(比如点尺度)是其中一个原因。把本来连续预测变量或调节变量二元化是另外一个被强力反对的做法(Cohenetal,)。应变量的测量尺度也是一个因素。理论上讲如果自变量用点尺度调节项就有种组合。如果应变量不想失去自变量中的信息也应该用至少点的尺度。实际中研究者往往用调查对象熟悉的点尺度。但作者的经验是如果用点尺度调查对象往往以分、分作单位使其实际作用相当于点或点尺度。(Tobecontinued)例子多重共线性的情况下变量的选择Carte,TA,Russel,CJ()Inpursuitofmoderation:NinecommonerrorsandtheirsolutionsMISQuarterly,(),版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0Sharma,S,Durand,RM,GurArie,O()Identificationandanalysisofmoderatorvariables,JournalofMarketingResearch,XVIII(August),Baron,RM,Kenny,DA()Themoderatormediatorvariabledistinctioninsocialpsychologicalresearch:Conceptual,strategic,andstatisticalconsiderationsJournalofPersonalityandSocialPsychology,(),Frazier,PA,Tix,AP,Barron,KE()TestingmoderatorandmediatoreffectsincounselingpsychologyresearchJournalofCounselingPsychology,(),Kenny,DA,Kashy,DA,Bolger,N()DataanalysisinsocialpsychologyInDTGilbert,STFiske,GLindzey(Eds),Thehandbookofsocialpsychology(thed,pp)NewYork:OxfordUniversityPressVelleman,PF,andWelsch,RE(),"EfficientComputingofRegressionDiagnostics,"TheAmericanStatistician,(),Hoyle,RH,Kenny,DA()Samplesize,reliability,andtestofstatisticalmediationInRHoyle(Ed),Statisticalstrategiesforsmallsampleresearch(pp)ThousandOaks,CA:Sage附一方差膨胀系数我们可以以一个双自变量的模型为例我们对所有的自变量和应变量进行标准化使其方差为、均值为零。这时iiiixxyεββ=。此时:⎥⎦⎤⎢⎣⎡−−−=⎥⎦⎤⎢⎣⎡==−−−)'(rrrrrrXXXX⎥⎦⎤⎢⎣⎡−−−==−)(rrrrXXεεσσbσ。不难看出对于每一个自变量的回归系数其方差是标准化后残差方差的r−倍。版权所有徐云杰博士新加坡国立大学电脑学院信息系统系。xuyjcompnusedusg。版本号:D1-0第八章线性回归的建模引言多重共线性中介作用(mediatoreffect)调节作用(moderatoreffect)理解回归系数测试过程调节作用中的统计效能多重共线性的情况下变量的选择

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/11

定量研究方法论--多变量回归建模

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利