混杂偏倚-效应修正

混杂偏倚-效应修正一、混杂偏倚的概念在病因研究中，当对所关心的某种暴露因素(E)与某种疾病(D)之间的关联进行定量估计时，由于其他因子(F)的影响，致使E和D之间关联的真实性被歪曲，关联强度被放大或缩小，这种歪曲关联真实性的作用被称作混杂作用(confoundingeffect)，起到混杂作用的因子被称为混杂因子(confounder或confoundingfactor,F)。第一页，共44页。♦混杂偏倚本质√一种人为造成的偏倚√是在研究的设计阶段未对混杂因子加以控制或资料分析时未能进行正确校正所致√是完全可以避免和控制的一种系统...

一、混杂偏倚的概念在病因研究中，当对所关心的某种暴露因素(E)与某种疾病(D)之间的关联进行定量估计时，由于其他因子(F)的影响，致使E和D之间关联的真实性被歪曲，关联强度被放大或缩小，这种歪曲关联真实性的作用被称作混杂作用(confoundingeffect)，起到混杂作用的因子被称为混杂因子(confounder或confoundingfactor,F)。第一页，共44页。♦混杂偏倚本质√一种人为造成的偏倚√是在研究的设计阶段未对混杂因子加以控制或资料分析时未能进行正确校正所致√是完全可以避免和控制的一种系统误差♦混杂因子成立的条件(1)必须是所研究疾病的危险因素或保护性因素(2)必须和暴露因素之间存在统计学关联(3)一定不是暴露因素与疾病因果链上的中间变量第二页，共44页。二、混杂偏倚产生的机理例:氡气与肺癌的定群研究♠以RR值描述暴露于氡气人群与不暴露于氡气人群在肺癌发生频率之间的关联强度。第三页，共44页。肺癌患者(D+)未患肺癌者(D–) 暴露于氡气的人群(E)aba+b未暴露于氡气的人群(Ē)cdc+da/(a+b)RR=----------------------c/(c+d)以四格表的数据计算关联强度指标RR值第四页，共44页。♦RR值的真实性评价此RR值是否真实地反映了氡气与肺癌之间的关联强度，完全取决于下述条件：(1)氡气暴露人群（E）和未暴露人群（Ē）之间在产生肺癌的易感性方面是否可比(2)导致肺癌的其它危险因素在两组人群之间的分布频率是否可比。第五页，共44页。“a”例肺癌的归因可能性(来自暴露人群)：（A）由氡气所致（B）由吸烟所致（研究者已知道的致肺癌因素）（C）由其它未知因素所致“c”例肺癌的归因可能性(来自非暴露人群)：（B）由吸烟所致（C）由其它未知因素所致第六页，共44页。 ♦对RR值的解读此相对危险度RR在本项研究中包含有三种效应：（A）氡气的致癌效应（B）吸烟的致癌效应（C）其它未知因素的致癌效应♦RR值产生混杂偏倚的条件（B）吸烟的致癌效应RRS≠1（C）其它未知因素的致癌效应RRU≠1第七页，共44页。♦当吸烟的致癌效应RRS≠1时下述情况下吸烟可导致该研究产生混杂偏倚：◘研究设计阶段：未保证吸烟者在两人群中的均衡性◘分析阶段：未先将两人群按吸烟和未吸烟分层，然后再按每一层去确定氡气暴露和肺癌之间的关联该研究中混杂偏倚产生的机理：是因为导致肺癌产生的另一因素吸烟在两组人群中分布不均衡。第八页，共44页。三、混杂偏倚和混杂因子的判别 ♦根据专业知识确定研究中可能存在的混杂因子在流行病学研究中，混杂因子可分为两类：1.人口统计学因子:年龄、性别、种族、职业、经济收入、文化水平等人口统计学指标，是经常遇到的混杂因子。第九页，共44页。2.暴露因素以外的其它危险因子：研究中混杂因子广泛存在，表现形式多样，常常在隐匿中起到混杂作用。♦利用分层分析进行定量判别－以定群研究为例－分层分析：将研究人群按是否暴露于可疑混杂因子F分类（最简单可分为暴露与不暴露两组），然后再做单因素分析。第十页，共44页。未分层资料的分析cRR暴露人群(E)aba+b未暴露人群(Ē)cdc+d患者(D+)非患者(D-)第十一页，共44页。暴露人群(E)a1b1未暴露人群(Ē)c1d1患者(D+)非患者(D-)aRR1aRR2分层资料的分析a2b2c2d2患者(D+)非患者(D-)暴露第三因子F未暴露第三因子F第十二页，共44页。D+D－E+a1b1E－c1d1D+D－E+a2b2E－c2d2D+D－E+abE－cdcRRaRR1aRR2F+F－第十三页，共44页。♦用简单公式描述：1.cRR=aRR2或aRR1：F不是混杂因子，cRR值不存在F的混杂偏倚。2.cRRaRR2或aRR1：F是混杂因子，cRR值存在F的混杂偏倚。上述分析也可适用于病例对照的OR值分析。第十四页，共44页。四、混杂偏倚的方向根据偏倚的产生机理，当混杂因子对暴露与疾病之间的关联产生歪曲时，混杂偏倚具有一定的方向性和大小。其方向可正可负，其作用可大可小，取决于E、F和D之间的关系。♦正混杂：cRR或cOR被放大，高于真实值♦负混杂：cRR或cOR被缩小，低于真实值第十五页，共44页。五、混杂偏倚的控制(一)在设计阶段进行控制1.限制。2.随机分配：随机分配又可细分为简单随机分配和分层随机分配（stratifiedrandomization）两种方式。3.匹配（matching）：匹配是最经常用于控制混杂因子的方法。第十六页，共44页。♦群体频数匹配指混杂因子发生的频度在不同组应大致平横；♦个体匹配指按一个至数个混杂因子分层，为病例选择同层的对照，一个病例配的对照数多为1-4个。♦匹配的好处√可以有效地控制混杂因子的作用，提高研究结果的真实性；√在减少总样本数的情况下得到结论，提高研究的效率。第十七页，共44页。♦匹配的缺点:(A)难以对匹配掉的混杂因子及交互作用做深入分析；(B)在病例对照调查中，用匹配的方法控制混杂经常低估暴露对疾病的作用，严重时会引起过度匹配（overmatching）的问题，掩盖暴露的真实作用。(C)过分苛刻的匹配，会使得部分病例找不到对照，致使信息浪费，使研究的效率反而降低。第十八页，共44页。(二)在分析阶段控制混杂1.分层分析：分层分析是按混杂因素分层后，分别就暴露对疾病的关联做分析，可以使用Mantel-Haenszel方法在分析阶段控制混杂因子。－可以评价在各层中暴露与疾病的关联；－可整体估价用分层技术排除混杂后的暴露与疾病总的关联强度。第十九页，共44页。例：食管癌病因研究—病例对照研究设计第二十页，共44页。因素病例对照年龄（岁） 25-111535-919045-4616755-7616665-5510675+1331均值60.050.2标准差9.214.3酒精（克/天） 0-2938640-7528080-5187120+4522均值84.944.4标准差48.431.9食管癌病例组和对照组暴露因素分布第二十一页，共44页。♦对资料进行初步审查(1)对照组年轻人比重大于病例组(2)在病例组中，饮酒消耗量的均值大于对照组，且重度饮酒者的比例大于对照组(3)年龄和饮酒之间呈现轻度的负相关根据上述资料和已往医学知识，即食管癌在年龄大者中多见，推测年龄这一因素可能对判断饮酒与食管癌之间的关联起一定的混杂作用。饮酒(E)→食管癌(D)＼∕年龄(F)第二十二页，共44页。♦计算未分层时总的比值比cOR 饮酒不饮酒计食管癌病例96(a)104(b)200(n1) 对照109(c)666(d)775(n0) 计205(m1)770(m0)975(N)第二十三页，共44页。cOR=ad/bc=(96x666)/(104x109)=5.64 [(ad-bc)–0.5N]2(N–1)X2=--------------------------------------n0m0n1m1 =108.11df=1,P<0.0001第二十四页，共44页。cOR的95％可信限区间估计公式为： lnORU,lnORL=EXP[lnOR±1.96x(Var(lnOR))1/2] 式中： Var(lnOR)=1/a+1/b+1/c+1/d lnORu,lnORL=1.730.34,即：ORL=4.02,ORu=7.93第二十五页，共44页。年龄（岁）组别每日饮酒量aORi80克0-79克25-病例对照19010635-病例对照42651645.0545-病例对照2529211385.6755-病例对照4227341396.3665-病例对照191836882.5875+病例对照50831♦按可疑的混杂因子年龄分层计算每层比值比aOR第二十六页，共44页。♦比较cOR和aOR发现cOR与多组aORi有较大不一致，提示年龄可能起了一定混杂作用。♦用Mantel-Haenszel方法计算调整年龄这一混杂因子影响后总的ORmh。 ∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)第二十七页，共44页。∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)(1x106/116)+(4x164/199)+…+(5x31/44)]ORM-H=--------------------------------------------------(0x9/116)+(2x26/199)+…+(8x0/44)]=5.158第二十八页，共44页。♦对分层后总的ORmh=5.158做X2检验确定这一样本来自OR=1的总体的概率，计算公式为： (∑ai–∑Ai–1/2)2X2＝-----------------------------------[∑Var(ai;OR=1)] 式中：ai为各年龄组中第一小格内的实际观察值第二十九页，共44页。Ai为各年龄组中第一小格内理论值，其估计公式为：m1in1iAi＝---------------(1)Ni Var(ai;OR=1)为来自总体OR=1的样本分层后各层暴露病例数ai的方差，其计算公式为： m1in1im0in0iVar(ai;OR=1)=-------------------------(2)Ni2(Ni–1)An1-Am1-An0-m1+An1n0m0m1第三十页，共44页。在特定的无效假设下，即H0：OR=1时，可根据前述公式(1)计算理论值A：m1in1iAi＝--------------Ni计算每一层内第一小格理论值Ai的结果如下：25-岁组：A1=（10x1）/116=0.08635-岁组：A2=(30x9)/199=1.356······75+岁组：A7=(5x31)/44=1.477第三十一页，共44页。每层的方差按述前公式(2)计算Var(a1;OR=1)如下：25-岁组：Var(a1;OR=1)=(10x106x1x115)/1162X(116-1)=0.079 35-岁组：Var(a2;OR=1)=(30x169x9x190)/1992X(199-1)=1.106·········75+岁组：Var(a7;OR=1)=(5x39x13x31)/442X(44-1)=0.944 每层的Ai值和Var(ai;OR=1)值见下表：第三十二页，共44页。年龄（岁）aiAiVar(ai;OR=1)25-10.0860.07935-41.3561.10645-2511.6636.85855-4221.66810.67065-1912.6406.44975+51.4770.9449648.89026.106第三十三页，共44页。代入上述X2公式，得：(96–48.890–1/2)2X2=--------------------------------=83.2226.106df=1,P<0.0001 ORmh的95%可信限区间估计公式为： ORu,ORL=ORmh[1±1.96/(x2)1/2] 式中：X2应为未作连续校正的值，该值为：X2=(96-48.890)2/26.106=85.01；第三十四页，共44页。以此带入[1±1.96/(x2)1/2]计算得： [1±1.96/(x2)1/2]=0.7874,1.2126 代入上式得： ORu,ORL=5.1580.7876,5.1581.2126=3.64,7.31 比较cOR和ORmh，显示两者有较小的差别，表明年龄起轻微的混杂作用，经分层调整消除年龄的混杂作用后，食管癌与饮酒之间的关联为：ORmh=5.158，95%可信限为3.64-7.31。第三十五页，共44页。2.多因素分析－当分析多个因子的混杂效应时，会出现分层过多的现象，以至难于实现对混杂的调整；－应用多因素分析方法可有效控制混杂因子的影响常用的方法有下述几种。（1）多元Logistic回归分析和Cox回归分析适用于因变量为二值函数(患病，不患病)的定群研究病和例对照研究。（2）协方差分析适用于因变量是一连续变量的资料分析。第三十六页，共44页。效应修正作用的识别与描述第三十七页，共44页。D+D－E+a1b1E－c1d1D+D－E+a2b2E－c2d2aRR1aRR2F+F－效应修正作用概念：外部因子改变了研究因素与疾病的关联强度测量：如果aRR1≠aRR2，存在效应修正作用：如果aRR1＝aRR2，不存在效应修正作用：意义：探讨病因正交互作用：aRR1>aRR2负交互作用：aRR1

                    本文档为【混杂偏倚-效应修正】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

混杂偏倚-效应修正

你可能还喜欢