首页 第6章 方差分析

第6章 方差分析

举报
开通vip

第6章 方差分析第6章方差分析方差分析(AnalysisofVariance,简称ANOVA),又称"变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。实际生活中,经常碰到这样的问题:影响产品质量、销售量、工资收入的因素很多,但必须找出对产品质量、销售量影响的显著因素。为此,我们进行试验,根据试验数据进行方差分析,即可鉴别各个因素对试验效果的影响。为了分析某一个因素A对所考察的随机变量X的影响,我们可以在实验时使其他因素保持不变,而只让因素A改变,这样的实验叫做单因素使用,因素A所...

第6章  方差分析
第6章方差分析方差分析(AnalysisofVariance,简称ANOVA),又称"变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。实际生活中,经常碰到这样的问题:影响产品质量、销售量、工资收入的因素很多,但必须找出对产品质量、销售量影响的显著因素。为此,我们进行试验,根据试验数据进行方差分析,即可鉴别各个因素对试验效果的影响。为了分析某一个因素A对所考察的随机变量X的影响,我们可以在实验时使其他因素保持不变,而只让因素A改变,这样的实验叫做单因素使用,因素A所处的状态叫做水平。因素又称因子。我们关心各个水平下,随机变量的均值是否有显著差异。实验6-1单因素方差分析方差分析是检验多个总体均值是否相同的统计方法。例为了寻求适应本地区的高产油菜品种,今选了五个不同品种(A1,A2,…,A5)进行试验,每一个品种在四块地上试种,得到每一块土地的亩产量如下:田和品种A1A2A3A4A51256244250288206222230027728021232802902303152204298275322259212问不同品种的平均亩产量有无显著差异?significance1方差分析的统计模型"因.子水平、观测值A1xx12…x1W1A2x12x22…x2n2Arxr1xr2…xrn单因素方差分析中,记因素为A,设因素A有r个水平:A1,A2,…,Ar,在每个水平下考察的指标视为一个总体,并且假定:(1)每个总体视为正态总体,记为:N(R.,C.2);(2)各个总体的方差相同,即b2=b2=...=b2=b2;(3)从每个总体中抽取的样本相互独立。我们欲检测因素A显著与否,可以作如下的假设检验:H0:A的r个水平均值相同-H1:A的r个水平均值不相同即:H0:u=旦=…=旦—H1:u卫旦丰…卫旦\12r12H0:nullhypothesisSig值<0.05,则各因子水平均值有显著差异:拒绝H0Sig值:P{H0为真而拒绝H0} 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf '因.子水平、A1xx12…x1n1xA2x12x22…x2n2xArxr1xr2…xrnx总平均X第i组组平均记为:12vX——匕^X,i—1,,roij=1全部观测值的平均称为总平均,记为x=12乙niji=1j=1记总偏差=x-X,x-X=(-X)+G-X)ijijii总偏差平方和SST为:SST=22X-X)i=1j=1组内偏差平方和SSE为:SSE==22七-X1i=1j=1组间偏差平方和SSA为:SSA==22(X-X口n.G—X1i=1j=1i=1可以证明:SST=SSA+SSE偏差平方和的均方和分别为:MSA=华,MSE=旦r-1n-r欲检验H°是否成立,可以采用下面的统计量厂MSASSA/(r-1)FMSESSE/(n-r)根据上述讨论,可得:方差分析表偏差来源平方和自由度均方和F统计量组间SSAr一1MSA=SSA/(r—1)厂MSASSA/(r-1)FMSESSE/(n-r)组内SSEn—rMSE=SSE/(n-r)总和SSTn—1上表中,如果F>孔(尸-1,n-r),则拒绝H0,认为因素A显著。2实验内容数据来源:Zhusiliao.savfodderweight1133.001125.301143.101128.901135.702151.202149.002162.702143.002153.503193.403185.303182.803188.503198.604225.004224.604220.404212.30意为:饲料1饲料2饲料3饲料4个体1133.80151.20193.40225.80个体2125.30149.00185.30224.60个体3143.10162.70182.80220.40个体4128.90143.80188.50212.30个体5135.70153.50198.60实验输出结果如下:方差齐性检验weightLevene统计量df1df2显著性.024315.995H0:b2=b2==b2=b20.995>0.05,接受H0,认为b;=b;=...=b2=b2(无显著差异)单因素方差分析weight平方和df均方F显著姓组间20538.69836846.233157.467.000组内652.1591543.477总数21190.85818H0:u=旦=…=旦—H1:u卫旦丰…卫旦\12r12Sig值<<0.05,故拒绝H0,接受H1,认为各个因子水平下的均值有显著差异,即u卫日丰…卫日。多重比较因I变量:weight⑴fodder(J)fodder均值差(I-J) 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误显著性95%置信区间下限上限B-18.68000*4.17024.000-27.5687-9.7913AC-56.36000*4.17024.000-65.2487-47.4713D-87.41500*4.42321.000-96.8428-77.9872A18.68000*4.17024.0009.791327.5687BC-37.68000*4.17024.000-46.5687-28.7913LSDD-68.73500*4.42321.000-78.1628-59.3072A56.36000*4.17024.00047.471365.2487CB37.68000*4.17024.00028.791346.5687D-31.05500*4.42321.000-40.4828-21.6272A87.41500*4.42321.00077.987296.8428DB68.73500*4.42321.00059.307278.1628C31.05500*4.42321.00021.627240.4828B-18.68000*4.35318.016-33.7633-3.5967AC-56.36000*4.16353.000-70.8053-41.9147D-87.41500*4.31164.000-103.1431-71.6869A18.68000*4.35318.0163.596733.7633BC-37.68000*4.21260.000-52.3109-23.0491TamhaneD-68.73500*4.35904.000-84.6022-52.8678A56.36000*4.16353.00041.914770.8053CB37.68000*4.21260.00023.049152.3109D-31.05500*4.16966.001-46.4051-15.7049A87.41500*4.31164.00071.6869103.1431DB68.73500*4.35904.00052.867884.6022C31.05500*4.16966.00115.704946.4051*.均值差的显著性水平为0.05。3方差分析中的多重比较多重比较的目的通过方差分析表得到了拒绝H0的结论,那么这种差异究竟出现在哪些七之间呢?这就需要作多重比较了,即通过r.之间的配对比较来检验到底哪些均值之间存在显著差异。多重比较的方法多重比较的方法比较多,这里介绍最小显著差异法(LSD,LeastSignificantDifference):通过比较样本均值的差的绝对值R-匚|与临界值(LSD值)来判定u和七.是否有显著差异。H:u=uIH1:u。u计算均值差T=|x-xj,即下表中的均值差(I-J)。多重比较因变量:weight⑴fodder(J)fodder均值差(I-J)标准误显著性95%詈信区间下限上限B-18.68000*4.17024.000-27.5687-9.7913AC-56.36000*4.17024.000-65.2487-47.4713D-87.41500*4.42321.000-96.8428-77.9872A18.68000*4.17024.0009.791327.5687BC-37.68000*4.17024.000-46.5687-28.7913LSDD-68.73500*4.42321.000-78.1628-59.3072A56.36000*4.17024.00047.471365.2487CB37.68000*4.17024.00028.791346.5687D-31.05500*4.42321.000-40.4828-21.6272A87.41500*4.42321.00077.987296.8428DB68.73500*4.42321.00059.307278.1628C31.05500*4.42321.00021.627240.4828作业:exercise6-1实验6-2单因变量多因素方差分析1单因变量双因素方差分析双因素方差分析是同时考虑两个因素对因变量的影响,它比单因素方差分析的情形要复杂,一般分为无重复观测和等重复观测两种情况。这里只介绍无重复观测双因素方差分析。设观测值七由两个因素A和B,如下表所示:无重复观测双因素方差分析数据表因素BB]B2…Bs行平均值因素Axx1sA2x21Axr1xrs列平均值数学模型:提出假设:TOC\o"1-5"\h\zA因素:H:|L1a=.A...=.A—H:|LlAop,A...op,A012r112rB因素:H:.B=.B=.B—H:.Bo.Bo.B012S112S可以构造统计量建立下列无重复观测双因素方差分析表:无重复观测双因素方差分析表偏差来源平方和自由度均方和F统计量A因素SSAr一1MSA=SSA/r-1厂MSAF=aMSEB因素SSBs-1MSB=SSB/s-1厂MSBF=BMSE随机误差SSE(—1)(s-1)MSE=SSE/(r-1)(s-1)总和SSTrs一1例电池数据:factorysamplelsample2sample3sample4sample51A40.0048.0038.0042.0045.002B36.0034.0030.0023.0032.003C39.0040.0043.0050.0050.004可以看出影响电池寿命(lifetime)的因素为factory(A、B、C)和sample(1-5)。重新录入为:点击:一般线性模型单变量进入选择变量:然后点击确定,得到输出结果:主体间因子factoryC51.0032.003sample3.0034.006描述性统计量因变量:lifetimefactorysample均值标准偏差N1.0040.0000.12.0048.0000.1A3.0038.0000.14.0043.50002.121322总计42.60003.9749251.0036.0000.12.0034.0000.1B3.0030.0000.14.0030.00002.828432总计32.00003.1622851.0039.0000.12.0040.0000.1C3.0043.0000.14.0050.0000.000002总计44.40005.3197751.0038.33332.0816732.0040.66677.023773总计3.0037.00006.5574434.0041.16679.261036总计39.66676.8937515误差方差等同性的Levene检验a因变量:lifetimeFdf1df2Sig..113.检验零假设,即在所有组中因变量的误差方差均相等。a.设计:截距+factory+sample+factory*sample主体间效应的检验因变量:lifetime源III型平方和df均方FSig.校正模型652.833a1159.34814.244.025截距21172.595121172.5955081.423.000factory317.1902158.59538.063.007sample43.167314.3893.453.168factory*sample160.733626.7896.429.078误差12.50034.167总计24267.00015校正的总计665.33314a.R方=.981(调整R方=.912)估算边际均值总均值均值标准误差39.292.551因变量:lifetime95%詈信区间下限上限37.53841.046从主体间效应的检验表我们就可以看出结果来。注:上表未反映交互作用。2单变量三因素方差分析例(数据文件:xinlixue.sav)教育心理学实验。设因变量为心理运动测验分数score,score由三个因素决定:目标(target)有四个水平(1、2、3、4);测验设备(device)有三个水平(1、2、3);照明环境(light)有两个水平(1、2)。即有数据表如下图所示:注:观测值有120个,这里只显示12个。实验操作过程:这个例子要研究交互效应点击绘制:输出结果:主体间效应的检验因I变量:score源III型平方和df均方FSig.校正模型783.467a2334.06446.451.000截距3162.13313162.1334312.000.000target*device*385.0001722.64730.882.000lighttarget235.200378.400106.909.000device86.467243.23358.955.000light76.800176.800104.727.000误差70.40096.733总计4016.000120校正的总计853.867119a.R方=.918(调整R方=.898)从上表中可以看出各因素显著性检验结果。还可以显示估算边际均值图:target*device*lightscore的估算边际均值light=11处device—di——d2d3n-~rt2t3it4targetscore的估算边际均值light=12处targetdevice作业:exercise6-3补充:例研究人员随机选择了6位忧郁症患者,并对这些患者使用了3种治疗方法:行为改变、认知改变和安慰剂,并在白天和晚上分别进行治疗。经过一段时间的治疗后,测其忧郁状的强度如下:时间行为改变白天304521286025晚上35认知改变安慰剂3556367046892065409650937093506575445580584072408060605080请判断不同的治疗方法是否有显著差异,不同的治疗时间是否对治疗效果有显著差异,治疗方法与治疗时间是否有相互作用Excel输出结果:方差分析差异源SSdfMSFP-valueFcrit1133.44411133.4446.5787440.0155644.170877列8687.05624343.52825.210723.77E-073.31583交互854.38892427.19442.4795240.1007923.31583内部5168.66730172.2889总计15843.5635IS
本文档为【第6章 方差分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_769254
暂无简介~
格式:doc
大小:605KB
软件:Word
页数:23
分类:
上传时间:2019-11-18
浏览量:0