首页 浙江大学医学统计学方差分析举例

浙江大学医学统计学方差分析举例

举报
开通vip

浙江大学医学统计学方差分析举例PAGE\*MERGEFORMAT#PAGE\*MERGEFORMAT#第四章方差分析方差分析(analysisofvarianee,ANOVA)是R.A.Fisher提出的,是数理统计的基本方法之一,是医学研究中分析数据的一种工具。目前各种实验设计的方法在医学领域中得到越来越广泛的应用,取得了可喜的效果。方差分析就是实验设计中分析数据的一种有效方法。方差分析主要应用范围是:两个及两个以上样本均数所代表的总体均数之间差异的比较;同时可分析多个因素的作用;可以分析因素间的交互作用等。实际上,检验两个样本均...

浙江大学医学统计学方差分析举例
PAGE\*MERGEFORMAT#PAGE\*MERGEFORMAT#第四章方差分析方差分析(analysisofvarianee,ANOVA)是R.A.Fisher提出的,是数理统计的基本方法之一,是医学研究中分析数据的一种工具。目前各种实验 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的方法在医学领域中得到越来越广泛的应用,取得了可喜的效果。方差分析就是实验设计中分析数据的一种有效方法。方差分析主要应用范围是:两个及两个以上样本均数所代表的总体均数之间差异的比较;同时可分析多个因素的作用;可以分析因素间的交互作用等。实际上,检验两个样本均数代表的总体均数差异的t检验是方差分析的特例。方差分析的应用条件:各个样本来自正态总体;各个样本是相互独立的随机样本;各样本代表的总体方差齐性等。方差分析可以说是检验几个样本代表的具有相同方差、相互独立的正态总体均数是否相等的问题的一种统计分析方法。第一节单因素方差分析在医学领域中经常会遇到这样的问题,有几种不同的治疗 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,要比较它们的治疗效果;几位检验员检查同一份血样,想了解他们的检验技术是否有所不同;给药的不同时间对病人的治疗效果是否有影响。这里研究的对象:治疗方案、检验员、给药时间称为因素。当研究的因素只有一个时,称为单因素问题,所做的实验叫单因素实验。相应的设计叫单因素设计(完全随机设计/成组设计),在实验研究,将受试对象按照完全随机方法分配到各处理组或对照组之中;在抽样研究中,指研究对象从相互独立的总体中按随机化的方法抽样得到。此类资料的组间总体均数的比较可以考虑用单因素方差分析(one-wayANOVA)。一、问题的提出先看一个例子。例4.1将24名贫血患者随机分为三组,分别用甲、乙、丙三种方案治疗,治疗一月后血红蛋白变化量见表4-1,要分析三种治疗方案对贫血患者的疗效是否有差异。表4-1三种方案治疗贫血患者血红蛋白的变化量(g%)ABC0.51.42.12.3-0.21.93.72.32.0Xij2.40.7-0.31.10.21.12.71.20.93.60.00.53.2-0.40.8刀刀Xj19.55.29.033.7(刀X)ni88824(n)2.43750.65001.1250—Xi1.1042(X)256.699.4215.02281.13(刀X)二Xij(*资料来自:刘玉秀等主编《新药临床研究设计与统计分析》)从平均值来看,治疗方案不同对贫血患者的疗效是有一定影响的,但仔细观察一下数据就会发现如下问题:(1)同一治疗方案下患者血红蛋白的变化量并不完全一样,产生这种变异的原因是由于患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差所致。(2)不同治疗方案下患者血红蛋白的变化量并不完全一样,产生这种变异的原因包括治疗方案的不同、患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差等。由于患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差的存在,对于不同治疗方案下得到的不同疗效是由于方案不同引起的呢,还是有患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差造成的?因此,应做仔细的分析以后再下结论为好。由于治疗方案不同引起的患者血红蛋白的变化量的变异叫做处理变异。例4-1的全部24个数据,参差不齐,它们的变异叫做总变异。产生总变异的原因一是随机测量误差,一是处理变异。方差分析解决这类问题的思想是:由数据的总变异中分解出处理变异和随机测量误差,并赋予它们的数量表示。用处理变异和随机测量误差在一定意义上进行比较,如果两者相差不大,说明处理的不同对研究指标的影响不大;如处理变异比随机测量误差大得多,说明处理的不同影响是很大的,不可忽视。选择较好的处理或确定进一步实验的方向。因此,首要的问题是如何给变异一个数量表示。最后再介绍两个常用的术语。水平一一因素在实验时所分的等级或组分叫水平。在例4-1中,治疗方案分三个水平:A、B、C。处理一一在一项实验中,同一实验条件下的实验叫做一个处理,不同实验条件下的实验叫做不同处理。在例4-1中有三个处理。二、变异的数量表示有n个参差不齐的数据X1,X2,…,Xn,它们之间的差异称为变异。如何给变异一个数量表示呢?一个最直观的想法就是用极差R表示.极差简单直观,便于计算,但是其缺点是对数据提供的信息利用不够。人们后来有想出另一种表达的方法一一离均差平方和,以SS记之,n即SS八(Xj_X)2i=4SS是每个数据离平均值有多远的一个测度,它越大表示数据间的差异越大。由于求和符号后面的部分是非负数,所以,在同样的波动程度下,数据多的平方和要大于数据少的平方和,因此仅用平方和来反映波动的大小还是不够的。我们要设法消去数据个数的多少给平方和带来的影响。为此引进自由度的概念。一个直观的想法是用平方和除以相应的项数,但是从数理统计的理论上可以证明这不是一个最好的办法,而应把项数加以修正,这个修正的数叫做自由度。设有n个数Xj,i=1,2,…,n。如果有m个(Owm尸0.05(2,21)=3.47,,所以PV0.05。结论:按〉=0.05水准,拒绝Ho,可以认为3种不同治疗方案对贫血患者血红蛋白的疗效是有影响。以上方差分析的结果常以方差分析表的形式表达,如表4-3所示。表4-3表4-1资料的方差分析表变异来源SSVMSF值P值组间13.715826.85797.1675<0.05组内20.0938210.9568总33.809623第二节双因素方差分析一、问题的提出在医学研究中,影响我们所关心的某个研究指标的因素往往不止一个,而是许多因素。它们相互联结,相互渗透,相互对立,又相互依存。随着因素的增多,要透过表面现象抓住事物的本质,揭示出事物发展的内部规律就愈加困难,这里有两个方面的问题:一是如何进行实验设计,使得实验次数既少,获得的信息又多;一是如何分析数据。多因素实验最简单的设计是全面实验,即把每个因素的水平一切可能的组合都做一遍,这种方法的优点是揭示事物内部的规律性比较清楚。但是,全面实验一般实验次数太多,当因素较多时,在实际上是行不通的,因此是不值得提倡的。当只有两个因素时,我们一般采用随机区组设计、交叉设计、析因设计等等。先看下面三个例子:4窝不同种系的大白鼠例4-2为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取表4-4大白鼠注射不同剂量雌激素后的子宫重量/g合计缝合方法1个月2个月1030(b=4),每窝3只,随机地分配到3个组内k=3)接受不同剂量雌激素的注射,然后测定其子宫重量,结果见表4-4。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?大白鼠7r’、BTXj'iy丿种类0.20.40.80A106116145367B4268115225C70111133314D426387192n°缝合后时间)44412(N)E65.089.5120.091.5(X)bTV"J壬2603584801098近X)bQTXjj壬196643437059508113542吃X?)(*资料来自徐勇勇主编《医学统计学》)例4-3为了研究蒸馏水的PH值和硫酸铜溶液浓度对化验血清中白蛋白与球蛋白的影响,将蒸馏水PH值和硫酸铜浓度分成如表4-5所示的水平进行实验:表4-5蒸馏水的PH值和硫酸铜溶液浓度两因素的水平分组情况水平因素1234PH值5.405.605.705.80硫酸铜浓度0.040.080.10实验米取交叉分组,即同一种血清,在不同的PH值和不同的硫酸铜浓度配比之下各做一次,实验结果(白蛋白与球蛋白之比)如表4-6所示:表4-6血清实验结果(白蛋白与球蛋白之比)PH值硫酸铜浓度5.405.605.705.800.043.52.62.01.40.082.32.01.50.80.102.01.91.20.3对于这样一个实验该如何分析?例4-4将20只神经损伤的家兔随机等分4组,分别用两种神经缝合方法、在缝合后两个时间观察缝合后神经的轴突通过率,试验结果见表4-7。试进行统计分析。表4-7家兔神经缝合后轴突通过率(%)A雌激素剂量/ug*100g10403070外膜缝合5060103010502050束膜缝合307050603030(*资料来自郭祖超主编《医学统计学》)以上三个例子,均是研究两个因素对观察指标的影响情况的问题,但是从设计角度来看,是稍微有点不同的,例4-2的设计是随机区组设计(randomizedblockdesign)又称配伍组设计。这种设计相当于配对设计的扩大。具体做法是将受试对象按性质(如实验动物的性别、体重,病人的性别、年龄及病情)相同或相近者组成b个单位组(配伍组),每个单位组中有k个受试对象,分别随机地分配到k个处理组。这样,各个处理组所用受试对象不仅数量相同,生物学特点也较均衡。例4-3是利用交叉分组无重复设计,方法是:先将两个因素的各个水平全面组合,然后在不同组合条件下只做一次实验。而例4-4所采取的是交叉分组有重复设计,即析因设计,方法与交叉分组无重复设计基本相同,不同之处就在于在不同组合条件下是进行重复实验的,即实验次数不止一次。对于以上不同的设计情况,其分析数据的方法也各不相同,但是其基本思想大多来自方差分析,所以方差分析是分析双因素数据的一个基本方法。二、无交互作用的双因素方差分析象例4-2随机区组设计资料,或者例4-3交叉分组无重复设计的资料,均可以使用无交互作用的双因素方差分析的方法。其基本思想类似于单因素的方差分析的方法,将总变异分解成处理变异、区组变异和误差(或者说:因素1的变异、因素2的变异和误差)。下面以例4-2为例介绍其方差分析的步骤TOC\o"1-5"\h\z-(雌激素对大白鼠子宫重量无影响);0123H//不等或不全相等(雌激素对大白鼠子宫重量有影响);11'2'3■■-0.012•计算F值列方差分析表,计算各离均差平方和SS,自由度;,均方MS和F值。表4-8随机区组设计的方差分析计算表SSMS处理处理二k-1MS处理SS处理■■■■处理F处理MS处理MS误差区组二b—1SS组SS组■■■■区组F区组MS区组MS区组SS误差误差S9差二SS、一SS^理-、S误差区蛋'总一\处理一\区组MS误差==N-k一b1误差总计SS、=N-1fb、瓦Xijli=1丿k区组二b-1处理组间离均差平方和s$理及自由度、处理的计算与单因素方差分析的一样,单位组间离均差平方和按下式计算:b2SS立八kXj-x八j生j=1各部分均方的计算方法也同完全随机设计资料。注意,在计算f处理值时,分母是误差均方MS误差,分子是MS处理。本例:C=10982=100467,12SS、=113542-00467=13075,222SS理二260一358—480-100467=6074SS且22223672253141923-100467=6457.67S3差工13075-6074-6457.67=543.33。列方差分析表:按表4-8填入离均差平方和并计算相应的自由度;、均方MS和F值,得表4-9。变异来源SSVMSF值P值处理6074.0023037.0033.54〈0.01区组6457.6732152.5623.77<0.01误差543.33690.55总计13075.0011表4-9例4-2资料方差分析3.查F值(附表4)表,确定P值,下结论本例+处理=2,”误差二6,查附表4得,F0.01(2,6)=10.92,因F处理>F0.0i(2,)=10.92,所以P0.01。结论;按〉=o.oi水准,拒绝h0,可以认为3个剂量组的大白鼠子宫重量的差别具有统计学意义,即注射不同剂量的雌激素对大白鼠子宫的重量有影响。若想进一步了解哪两组间有差别,可进行多个均数的两两比较,具体见本章第三节。随机区组设计在进行方差分析时将区组间的变异从组内变异中分解出来,当区组之间差异有统计学意义时,其误差较完全随机设计小,使试验效率提高。三、有交互作用的双因素方差分析在一些实验中,不仅因素对研究指标有影响,而且因素之间还会联合起来对研究指标产生作用,这个联合的作用叫做交互作用。先看先面两个实验:A1A2A1A2B125B125B2710B273左边一个实验,当A从A1变化到A2时,研究指标都增加3,与B取B1或B2无关;同样,B从B1变化到B2时,研究指标都增加5,与A的水平无关,即A2-A1B2-B1B13A15B23A25我们将A与B没有交互作用。而右边一个实验情况则大不一样,且看A2-A1B2-B1B13A15B2-4A2-2这就是说,因素A对指标的影响与B取什么水平有关,因素B对指标的影响与A取什么水平也有关,这时我们就称A和B之间有交互作用,记作AXB。现在以例4-4的资料为例来介绍最简单的2X2析因设计方差分析。所谓2X2析因设计(factorialexperiment),就是有G个处理组由2个因素(每个因素有2个水平)全面组合而成,对此就有4个处理组。然后,采用完全随机设计安排4个处理组。2X2析因设计方差分析的基本思想:是在前面单因素方差分析和无交互作用的方差分析的基础上对误差进一步分解。将总变异分解成因素A的变异、因素B的变异、交互作用AXB的变异和误差四项。注意:2X2析因设计实验要求各组例数相等,每组例数不少于2例,否则无法分析因素之间的交互作用。2X2析因设计方差分析的基本步骤:建立假设和给定检验水准■■H0:神经缝合方法对缝合后神经的轴突通过率无影响H1:神经缝合方法对缝合后神经的轴突通过率有一定的影响H0:缝合后时间对缝合后神经的轴突通过率无的影响H1:缝合后时间对缝合后神经的轴突通过率有一定的影响H0:神经缝合方法和缝合后时间无交互作用H「神经缝合方法和缝合后时间有交互作用,■/.=0.05按表4-102X2析因设计的方差分析表计算表4-102X2析因设计的方差分析表变异来源VSSmsfp处理间312SStr=Ti_Cr主效应a11八2"2SSa=A1'A22r-CMSaFa=MSa/MSeB1142=2SSb=B1'B22r-CMSbFb=MSb/MSe交互作用AXB1SSab=SStr-SSa-SSbMSabFab=MSab/MSe误差N-4SSe=SSt-SStrMSe合计N-12SSt=匕X-C注:A1、A2表示A因素两水平的小计;B1>B2表示B因素两水平的小计,Tj(i=1,2,3,4)为4个处理组小计;r为每组的例数;c='X2N本例中,i=j=2,r=5,Ti=120,T2=220,T3=140,T4=260,Ai=340,A2=400,Bi=260,B2=480,代入表4-10,得到表4-11的结果表4-11例4-4析因实验的方差分析表变异来源ssVmsFP处理26203a18011800.60>0.05B2420124208.07<0.05AXB201200.07>0.05误差480016300总742019查F临界值表,确定P值推断下结论。根据表4-11结果,在〉=0.05的水准下,只有缝合时间(B因素)对神经的轴突通过率有影响。第三节多组间的两两比较当方差分析结果为p<0.05时,只说明k组总体均数之间不同或不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的两两比较或称均数间的多重比较(multiplecomparison)。若用上一章学习的两均数比较的t检验进行多重比较,将会加大I类错误的概率〉,从而可能把本无差别的两个总体均数判为有差别。例如,有4个均数,两两组合数为C42=6,若用t检验做6次比较,且每次比较的检验水准选为二=0.05,则每次比较不犯I类错误的概率为(1-0.05),6次均不犯I类错误的概率为(1-0.05)6,这时,总的检验水准为1-(1-0.05)6=0.26,比0.05大多了。因此,均数间的多重比较不能直接用两均数t检验的检验水准和 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误。多重比较检验的方法很多,如最小显著差异检验(Leastsignificantdiffereneetest,LSDtest)、Ducan多界值检验(Ducan'multiplerangetest),亦称Duncan新法、Newman-Keuls检验(Student-Newman-Keulstest,SNKtest)、Tukey检验(Tukey'honestsignificantdiffereneetest,HSDtest)、Scheffe检验(Scheffe'test)和Dunnett检验(Dunnetttest)等,这些方法的原理基本相似,不同的是其检验界值有所不同,SNK检验的敏感性居中。没有一种检验在任何情况下都是最好的。目前对多个均数两两之间的全面比较,最常选用SNK检验法;LSD检验法适用于一对或几对在专业上有特殊意义的均数间差别的比较;Dunnett检验法适用于几个处理组与一个对照组均数差别的多重比较,该检验有专门与之对应的检验临界值。另外还可以通过校正检验水准Bonferroni校正检验(Bonferronicorrectiontest)。下面介绍四种多重比较的常用方法:SNK检验、LSD检验、Dunnett检验和Bonferroni校正检验法。1、SNK检验SNK检验,亦称q检验。检验统计量q的计算方法见下式XiXj其中MS误差'丄+丄)2enj丿式中,Xi,ni为第i组的样本均数及样本例数,xi,ni为第j组的样本均数及样本例数,ms误差为方差分析表中的误差均方。完全随机设计资料,ms误差即是ms组内。例4-6续例4-1。试比较3种治疗方案疗效两两之间的差别。TOC\o"1-5"\h\zi.建立假设并确定检验水准:H0:」Jj(即任两对比组的血红蛋白含量的总体均数相等);H1:」Jj(即各对比组的血红蛋白含量的总体均数不等或不全相等);:=0.052•计算q值①将3个样本均数从小到大排列,并赋予秩次:均数0.65001.12502.4375组别B万案C万案A万案秩次123②列出对比组(见表4-16第(1)栏),并计算两对比组均数之差的绝对值(见表4-16第(2)栏)。如第一行两对比组均数之差的绝对值为:|0.6500-1.1250|=0.475。写出两对比组所包含的组数:-(见表4-16第(3)栏)。如第2行,1与3比,包含了1,2,3三个组,故〉=3。计算检验统计量q值。本例已求得MS误差=0.9568(见表4-3),又各组列数均为10,所以,由公式4-5计算q值,其中sx^=y警(8+8卜0.3458。结果见表4-16第(4)栏。表4-163个均数两两比较q值表比较组秩次XiXjaqP值(1)(2)(3)(4)(5)1,20.475021.374>0.051,31.787535.169<0.012,31.312523.796<0.053.查界q值表(附表5),确定P值,下结论已知、..误差二21,查附表5,=2时,q=2.95;0.05(20,3)=3时,q3.58,q4.64。0.05(20,3)0.01(20,3)以实际的q值和相应的q界值做比较,确定对应的P值(见表4-16第(5)列)。结论:按〉=0.05水准,除了1与2组外均拒绝H。,可以认为血红蛋白上升克数在A方案和B方案、A方案和C方案之间有统计学意义,而B方案和C方案之间没有统计学意义。2、LSD检验LSD检验,即最小显著差异(Leastsignificantdifferenee)t检验。其统计量t的计算公式为:XiXjSr巳误差其中,MS误差无偏性PAGE\*MERGEFORMAT#PAGE\*MERGEFORMAT#注意,这里的LSD检验中t统计量的计算公式与成组设计两样本均数代表的总体均数比较的t检验公式是不同的,区别就在于两样本均数差值的标准误S和自由度的计Xi-Xj算上,在成组设计两样本均数代表的总体均数比较的t检验公式里是用合并方差s2来计算,v=ni•n2-2,而这里是用方差分析表中的误差均方MS误差来计算XiX误差3、Dunnett检验Dunnett检验,检验统计量为q',q■的计算公式如下Xi-X。Sx^-x;其中SXi杀Inn。丿这里,X「ni分别为第i个实验组的样本均数和样本例数,X。,n。分别为对照组的样本均数和样本例数。4、Bonferroni校正检验多重比较的次数不多(如不超过5次)时,可以考虑用Bonferroni校正检验的方法。假设原来所给的检验水准为〉,所用的检验统计量是成组设计的两样本比较的t(或u)统计量,需要进行两两比较的次数为m次,则单次的两两比较应以:-/m作为检验的实际水准,这种校正方法称为Bonferroni校正检验。例如,3组均数之间的两两比较,原定〉=0.05,现在进行了3次t检验,则其每次t检验的检验水准该取:/3=0.0167,而不是0.05。第四节方差分析中的若干问题一、题的提出前面已介绍了方差分析的一些常见的一些常见类型,以及这些类型的分析方法。在医学研究的实际问题中有时会提出许多如下的问题:数据缺失了怎么办?数据不符合方差分析的模型怎么办?当某个因素是有统计学意义时,能否进一步判断这个因素的各水平之间两两也有统计学意义,等等。以上这些问题,就在本节中展开讨论。二、数据的处理方差分析的数据一般都是通过精心安排的试验而获得的,当研究因素超过一个时,要求的数据很整齐的,否则分析时会带来很多麻烦。有时,某些试验不幸做坏了,或者数据丢失了,客观条件不允许重做。例如,在实验中,一只实验动物不是处理之故而生病或突然死亡,或由于测量仪器发生故障,致使实验数据发生缺失,这时就要考虑有无统计学方法进行弥补。弥补数据可以有各种各样的原则,最常用的是使SSe达到最小的办法。下面分两种情况进行讨论1、试验有重复,并且每个处理至少有一个数据没有缺失。这种情况最简单,既然每种处理都有数据,那么缺失的数据就是同处理而没有丢失数据的平均值来代替。如果总共丢失了m个数据,则误差的自由度等于原误差自由度减去m,2、有些处理的数据缺失。这种情况主要以随机区组设计和正交设计为多见。即补上去的m个数不能算在自由度之内。C大白鼠,剂量0.2和B大白鼠,剂量0.4对应的两个数据缺失,分别记为a和b,按表4-12进行计算。表4-12大白鼠注射不冋剂量雌激素后的子宫重量/g大白鼠种类雌激素剂量/ugJ*100g3、Xij0.20.40.80i=4A106116145367B42b115157+bCa111133244+aD4263871924■-Xijj1190+a290+b480960+a+b2由表4-12得,C=(960+a+b)/121222SStr=x[(190+a)+(290+b)+480]-C先看一个例子,假如例4-2中缺失了12222SSb=x[367+(157+b)+(244+a)+192]-C422222SSt=106+116+…+87+a+b-CSSe=SSt-SStr-SSb现在SSe的大小与a,b有关,选择a,b的原则就是使SSe达到最小,由微积分定理就是使.:SSe=0:a.:SSe=0-b由此解得a=41.94,b=48.44缺失的数据补上以后仍按通常方法进行计算,但是误差自由度原来是6,现在要减掉2,即误差=4。由于误差自由度减小,方差分析的灵敏度降低,对分析问题是不利的,而且补救的数据毕竟不是真实的,只是作为分析问题的参考,丢失的信息是难以补救的,所以最好不要出现数据缺失的情况。三、数据的变换在方差分析中,对实验误差一般要求:独立性方差齐性正态性以上的方法都是建立在这四个假设上的。独立性一般是能满足的,只要各次实验之间没有互相牵连;无偏性表示误差有正有负、正负相当,一般也能满足;方差齐性在绝大多数的情况下能满足,但有些情况就不能满足,如勉强按等方差的模型来分析,有时会得不到正确的结论。且看下面的例子。例4-5为了诊断某种疾病,需要测量一个指标,并且在四种不同的条件下(记作Ai、A2、A3、A4)来测这一个指标以增加诊断的可靠性。今对四位健康的人测得数据如下:表4-13四个健康人在不同条件下测得的某一指标值健康人编号A1A2A3A4140000002200060007802150000013000340072031000000030000160001900410000085005200550以上四个条件下的数据数量级不同,方差齐性是不成立的。如果我们对此进行以10为底的对数转化,结果就转化成如表4-14所示:表4-14四个健康人在不同条件下测得的某一指标的对数值健康人编号A1A2A3A416.604.343.782.8926.184.113.532.8637.004.484.203.2845.003.933.722.74表4-15数据变换前后的实验误差比较变换前变换后健康人A1A2A3A4A1A2A3A4编号11000003625-1650-207.50.4050.125-0.0275-0.05252-2400000-5375-4250-267.5-0.015-0.105-0.2775-0.082536100000116258350912.50.8050.2650.39250.33754-3800000-9875-2450-437.5-1.195-0.285-0.0875-0.2025显然,通过对数转化,把方差不等的情况就变换成等方差(其变换前后的误差见表4-15),使模型更符合实际,这是一种常用的一种手段,但是这不是万能的方法,有时需要用其它的方式来转换。2|对于Poisson分布资料,:二=",数据可以按y=、X来转化,变换后不但等方差,而且分布也近于正态。对于二项分布资料,匚2=」(1」),数据可以按y=sin-1(•一X)来转化,变换后不但等方差,而且分布也近于正态。以上介绍的几种方法在实际研究中比较常见,是解决非正态数据或方差不等问题的有效方法。(李秀央)
本文档为【浙江大学医学统计学方差分析举例】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥15.0 已有0 人下载
最新资料
资料动态
专题动态
is_113440
暂无简介~
格式:doc
大小:67KB
软件:Word
页数:0
分类:
上传时间:2020-07-18
浏览量:6