下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 ROC_meta

ROC_meta.pdf

ROC_meta

ncstdchina
2012-03-13 0人阅读 举报 0 0 暂无简介

简介:本文档为《ROC_metapdf》,可适用于自然科学领域

第四节诊断试验的Meta分析宇传华(中山大学公共卫生学院博士后第四军医大学预防医学系教员)见:方积乾陆盈主编现代医学统计学人民卫生出版社p~P对于某一个诊断试验过去已有多个研究者进行了研究但由于这些研究具有不同的随机抽样误差且各自采用的诊断界点也往往不同因此获得的诊断试验准确度评价指标如灵敏度与特异度也往往不同。为了对不同的研究结果进行综合性分析获得综合的结论需要采用诊断试验的Meta分析方法。诊断试验的Meta分析可按以下步骤进行:①决定Meta分析研究的目的及范围。为了获得某疾病的诊断试验准确度需要明确研究的诊断试验、疾病和“金标准”是什么该疾病的临床问题和背景又如何。②复习有关文献给出查找文献的关键术语弄清文献进入和剔除的标准。由两个以上研究者摘录和整理资料并分别对原研究的设计和诊断试验的可靠性作出评价分析各个原研究获得不同诊断试验准确度的原因。这些原因包括:“金标准”的选择是否合适金标准试验与诊断试验的评价是否独立每个受试者是全部得到金标准证实还是只有部分受试者得到证实试验设计有无缺陷具体的诊断界点是多少受试人群的患病率是否相同等等。主要作者应对各个研究者的分析结果进行全面考虑。以上两点是Meta分析的共性问题本节不将展开叙述具体要求请参见本章的前面有关内容。图平均灵敏度与特异度不能小结诊断试验Meta分析的结果诊断试验Meta分析的目的与其执行方案与前面提到的临床试验的Meta分析相似但也存在一些特殊的问题。首先诊断试验的性能不仅由灵敏度决定也由特异度决定诊断试验Meta分析同时需要考虑两个指标。第二需要同时考虑灵敏度与特异度如果分别对灵敏度与特异度加权然后采用一般的平均率进行Meta分析将会失去灵敏度与特异度间的非线性关系。由图可以看出平均灵敏度与特异度对于诊断试验Meta分析不起作用。图中六个点是六个研究的灵敏度与特异度的观察值实线是其相应的ROC曲线。当我们不考虑其内部关系取这六个点的灵敏度与特异度的平均获得平均点“”该点不在ROC曲线上。该图提示采用传统的Meta分析分别分析灵敏度与特异度获得的综合特征并不属于该诊断试验。造成以上矛盾的原因是由于由于灵敏度与特异度间的非线性关系任何使灵敏度与(-特异度)间的成线性的变换将有助于简化诊断试验的Meta分析SROC方法就是其中的一种方法。③估计综合的诊断试验准确度。估计综合诊断试验准确度的统计分析方法有多种下面重点介绍综合接受者工作特征(summaryreceiveroperatingcharacteristic,SROC)的分析即SROC分析本节的后面也将简要介绍几种其它诊断试验的综合方法。一、SROC分析为了评价一个诊断试验(diagnostictest)的准确度首先需要知道受试者的真实分类情况即哪些属于对照组哪些属于病例组常采用金标准(goldstandard)试验划分受试者属于病例还是对照医学研究中常见的金标准有:活组织检查、尸体解剖、手术探查和跟踪随访结果等。尽管金标准不需要十全十美但是它们应比评价的诊断试验更可靠且与评价的诊断试验无关。对于按金标准确定的二项分类总体如病例与对照采用诊断试验检测的结果分别写成阳性与阴性资料可列成四格表形式。表中有四个可能结果其中两个是正确的即病例被诊断为阳性(真阳性a)和对照被诊断为阴性(真阴性d)两个是错误的即对照被诊断为阳性(假阳性b)和病例被诊断为阴性(假阴性c)(见表)。表诊断试验资料的×四格表真阳性率(truepositiverateTPR)也称灵敏度是病例被正确诊断为阳性的概率即)(caaTPR=())()(cacTPR=−为假阴性率或漏诊率。假阳性率(falsepositiverateFPR)也称为误诊率它等于(特异度)是对照被错误诊断为阳性的概率即)(dbbFPR=。())()(dbdFPR=−为真阴性率或特异度。SROC直线回归模型的建立“金标准”诊断结果病例对照合计a(真阳性)b(假阳性)abc(假阴性)d(真阴性)cd阳性阴性合计acBdabcd=N对TPR和FPR采用logit变换有:)(ln)(logitTPRTPRTPR−=())(ln)(logitFPRFPRFPR−=。()令D=)(logitTPR)(logitFPR()S=)(logitTPR)(logitFPR()经整理由()式得:漏诊率误诊率特异度灵敏度假阴性率假阳性率真阴性率真阳性率××=××=−−=lnln)()(lnFPRFPRTPRTPRD()由()式得:假阴性率真阴性率假阳性率真阳性率××=−−×=ln))((lnFPRTPRFPRTPRS()以D为应变量S为自变量使SROC曲线在(DS,)平面变成了一条直线建立SROC直线回归模型为:SBAD×=ˆ()式中D为对数优势比【见()式】其优势比表示病例组中阳性结果的优势(真阳性率与假阴性率之比)与对照组中阳性结果的优势(假阳性率与真阴性率之比)的比值。D值的大小与选择的诊断界点有关表达了诊断试验的“判别”能力。S表示区分诊断试验是否为阳性的阈值【见()式】当灵敏度和特异度相等即真阳性率与真阴性率相等时由()式可得=S在此基础上增加灵敏度或降低特异度有>S为正值降低灵敏度或增加特异度则<S为负值。A为直线回归模型的截距项是S=即灵敏度等于特异度时的对数优势比。B为回归系数反应了对数优势比(D)依赖于阈值(S)的程度如果回归系数为或与的差异无统计学意义则可采用截距项A作为多个原研究的公共对数优势比。SROC直线回归模型参数的求解求解()式的回归模型参数可采用一般最小二乘法、加权最小二乘法、稳健法等。()一般最小二乘法一般统计学教材均有这种方法其基本思想是使实测值与估计值之差(残差)的平方和最小求解参数A与B。该方法的缺点是没有充分考虑原研究的样本含量大小问题。()加权最小二乘法为了利用原研究的样本含量大小的信息可采用对数优势比D的方差的倒数为权重采用加权最小二乘法进行分析。加权最小二乘法的基本思想是使经权重加权的残差平方和最小求解参数。如果用a、b、c、d分别表示真阳性数、假阳性数、假阴性数、真阴性数(见表)权重记为W则权重即方差的倒数可表示为:W=)()var(−−=dcbaD()如果某一原研究的a、b、c、d中的任一个数据为为了避免分母为的情况可将所涉及研究的每个观察值加此时该研究的观察值变为(a)、(b)、(c)、(d)。加权法估计也不够精确某些情况下也可导致偏倚由此Moses,Shapiro和Littenberg于年提出了SROC分析的稳健法。()稳健法以S为横轴D为纵轴可将各研究的(SD)散点描在坐标中。用两条竖线将(SD)散点分成三组并使两条竖线之间、及左右侧的散点各占。比如有个散点则三组各应有个点有个散点时两条竖线之间占个点左右侧各占个点有个散点时两条竖线之间占个点左右侧各占个点。总例数除以后其得数四舍五录取整可得左右侧的散点个数。分别找到左右侧散点的S与D的中位数并在图中作上标记将标记的两点连成一条线该线的斜率就是回归系数B。观察这条线的上下散点是否相等如果不相等应将该直线上下平移使上下散点数基本相等。如果用),(DS和),(DS分别表示直线上距离相隔较远的两个点(如左右侧S与D的中位数所在的点)采用下列公式可计算回归参数A与B:SSSDSDA−−=SSDDB−−=()稳健法求解SROC线性回归模型参数的示意图见图该图采用后面表中的S、D等数据绘制该线的回归系数为直线基本与横轴平行。图稳健法求解SROC曲线参数的示意图SD(S,D)散点左竖线右竖线稳健回归线中位数点SROC曲线回归方程的建立无论采用哪种方法求得回归参数A、B均可建立SROC曲线的回归方程为:)()()(−−−−−=BBBAFPRFPReTPR()对于一般ROC分析一般采用ROC曲线下面积表示诊断试验的准确度对于SROC分析可采用*TPR表示诊断试验的准确度。*TPR为()式获得的SROC曲线与直线=FPRTPR()相交处的灵敏度反映了SROC曲线与左上角接近的程度值越大表示诊断试验的准确度越高。=FPRTPR是一条经过左上角()至右下角()的直线在这条直线上灵敏度等于特异度也就是S=。由S=及()式有:S=)(itlogTPR)(itlogFPR=也就是TPRFPRitlogitlog−=()将()式代入()式得:D=)(itlogTPR)(itlogFPR=)(itlogTPRSBA⋅==A整理得:)(itlogTPR=A。()变换()式得:)(−−=AeTPR()为了不与一般的TPR混淆记SROC曲线的诊断试验准确度指标为*)(−−=AeTPR它对应的标准误可通过*)cosh()ˆ()(AASETPRSE=。()计算式中)ˆ(ASE为直线回归方程的截距项A对应的标准误cosh为双曲余弦函数。如果需要比较两组独立诊断试验的准确度当研究数不太少(如大于)时可采用Z统计量)()(****TPRSETPRSETPRTPRZ−=()Z为正态离差值*TPR、*TPR为比较的SROC曲线诊断准确度指标)(*TPRSE与)(*TPRSE分别为*TPR与*TPR对应的标准误。如果SROC曲线的回归系数B=那么对于每一个研究的FPR其相应的TPR的可信区间可写成:−−−−−−,FPRFPReFPRFPReULAA()其中LA与UA为截距A的可信区间上下限。实例分析Pap试验是一种收集、制备和检查子宫颈脱落细胞的试验因为该试验快速、价廉、无创伤所以医生常用它作为早期宫颈癌的筛选目前也有人用它作为女性患者随访前的检查。因该试验受医生宫颈癌知识、宫颈癌发病率和检查时细胞数量多少的限制报道的该诊断试验的准确度有较大差异灵敏度和特异度的变化范围分别为~和~。下面借用Fahey,Irwig和Macaskill报道的个研究资料说明SROC分析的方法。Fahey,Irwig和Macaskill的资料中没有给出真阳性数(a)、假阳性数(b)、假阴性数(c)和真阴性数(d)的值但列出了病例数、非病例数及灵敏度、(特异度)等值因为方法的需要我们根据他们所列数据计算了a、b、c、d(见表)。因文献第、号研究的b和第号研究的d为为了避免计算方差倒数时出现分母为的情况所以对这三个研究的a、b、c和d采用增加作矫正。表篇文献报道的Pap试验的灵敏度与特异度文献号i真阳性数a假阳性数b假阴性数c真阴性数d灵敏度TPR特异度FPR权重WDS以()式计算权重如第一个研究的权重为:==−W以()式与()式分别计算真阳性率)(==TPR与假阳性率==)(FPR。采用()式于()式分别计算D与S值第一个研究的D=)()(ln−−=S==−−×))((ln依次类推。以D为应变量S为自变量并利用所计算的权重拟合加权最小二乘直线回归模型得诊断试验阈值(S)引起的对数优势比(D)变异的剩余标准差为。截距A=其标准误SE(A)=t检验得t=,P≤用)(,ASEtA±计算得A的可信区间为~结果表明:在检验水准A与间的差异有统计学意义。回归系数B=其标准误SE(B)=t检验得t=,P≤结果表明:在检验水准参数B与间的差异无统计学意义。优势比为)exp()exp(==A可以认为异常组阳性优势明显高于正常组根据()式与()式分别得诊断试验准确度指标*=TPR其标准误)(*=TPRSE。一般(非加权)最小二乘估计结果得诊断试验阈值(S)引起的对数优势比(D)变异的剩余标准差为。拟合模型得截距A=其标准误SE(A)=t检验得t=,P≤用)(,ASEtA±计算得A的可信区间为~结果表明:在检验水准A与间的差异有统计学意义。回归系数B=其标准误SE(B)=t检验得t=,P≤结果表明:在检验水准参数B与间的差异无统计学意义。优势比为)exp()exp(==A可以认为异常组阳性优势明显高于正常组根据()式与()式分别得诊断准确度指标*=TPR其标准误)(*=TPRSE。为了获得稳健法的参数值以S为横轴D为纵轴将个研究的S、D点描在坐标中用两条竖线将(SD)散点分成三组其中左右两侧各占个点【因()四舍五录取整得】对左右两侧散点的S与D分别取中位数有:左侧),(),(−=DS右侧),(),(=DS。由()式得回归参数A与B分别为A=B=由此可建立直线回归方程为:SDˆ=为了使该直线的上下散点数相等需要固定斜率不变改变截距项使直线上下平移。这实际上相当于:将各散点代入方程改变截距项A值使所得估计值Dˆ与实际值D之差(即残差)的正负号相等。经多次改变截距项A值检查直线上下的观察点使这些点分布在直线上下基本相等此时得A=优势比为)exp()exp(==A诊断准确度*=TPR。加权、非加权回归与稳健回归获得的结果总结如下(见表)。表加权、非加权与稳健回归计算的诊断试验准确度与有关数据方法ASE(A)CLBSE(B)CLTPR*SE(TPR*)优势比加权~~非加权~~稳健由以上三种方法各自的A、B代入()式分别获得加权法、非加权法、稳健法的SROC曲线分别为:−−−=FPRFPReTPR加权−−−=FPRFPReTPR非加权−−−=FPRFPReTPR稳健为了获得光滑SROC曲线可将FPR按等差递增从增至(可任意设置以满足获得光滑曲线为准)根据以上各自的SROC曲线方程计算TPR产生个SROC工作点用()、()和以上产生的工作点可绘出光滑SROC曲线。该资料的加权法、非加权法、稳健法SROC曲线和个研究工作点(特异度灵敏度)见图。由图可见加权法获得的曲线下面积较大非加权法与稳健法获得的曲线下面积相似几乎重叠这与表中反映诊断试验准确度的指标TPR*与优势比的结果一致。如果忽略加权法与非加权法的相关性并且假定两法所得*TPR近似服从正态分布可粗略采用()式检验它们所得*TPR是否有差异经检验得:Z=双侧P=,结果表明加权法与非加权法计算所得*TPR的差异无统计学意义。三种回归方法求解SROC曲线参数的SAS程序SAS程序加权法、非加权法与稳健法进行SROC分析的SAS程序行号程序OPTIONSLS=PS=MAXNODATELETN=*给出总的研究文献数量N=******************LETAROB=*修正稳健截距项AROB=使直线上下散点相等****DATASROCRETAINIINPUTTPFNFPTN图加权,非加权及稳健法的SROC曲线特异度灵敏度加权法非加权法个散点机率线稳健法INRL=ROUND(N)W=(TPFNFPTN)TPR=TP(TPFN)FPR=FP(FPTN)D=LOG(TPR(TPR))LOG(FPR(FPR))S=LOG(TPR(TPR))LOG(FPR(FPR))CARDSTITLE'由TP,FN,FP,TN计算的灵敏度、特异度、权重、D、S'PROCPRINTRUNTITLE'权重为:W=(VAR(LN(OR)))的加权回归方法'PROCREGDATA=SROCOUTEST=WOUTSEBSIMPLEMODELD=SWEIGHTWDATAWSETWPROCTRANSPOSEDATA=WPREFIX=AWOUT=WWDATAXXSETWWORSROC=EXP(AW)AL=AWAW*TINV(,N)AU=AWAW*TINV(,N)TPRSW=(EXP(AW))SETPRW=AW(*(COSH(AW))**)IFNAME^='INTERCEP'THENDOAL=AU=ORSROC=TPRSW=SETPRW=ENDDATAXXXSETXXIFNAME^='INTERCEP'THENDELETEPROCPRINTPROCREGDATA=SROCOUTEST=NWOUTSEBSIMPLEMODELD=STITLE'非加权的一般回归方法'DATANWSETNWPROCTRANSPOSEDATA=NWPREFIX=AOUT=WWDATAXXSETWWORSROC=EXP(A)AL=AA*TINV(,N)AU=AA*TINV(,N)TPRSTAR=(EXP(A))SETPR=A(*(COSH(A))**)IFNAME^='INTERCEP'THENDOAL=AU=ORSROC=TPRSTAR=SETPR=ENDDATAXXXSETXXIFNAME^='INTERCEP'THENDELETEPROCPRINTDATAXXXMERGEXXXXXXKEEPTPRSWTPRSTARSETPRWSETPRZSROCPSROCZSROC=(TPRSWTPRSTAR)(SETPRW**SETPR**)**PSROC=*(PROBNORM(ZSROC))PROCPRINTTITLE'非加权回归与加权回归获得的诊断试验准确度TPRSTAR的比较'DATASROCSSETSROCPROCSORTBYSDATABSKEEPIISDSETSROCSIIIFII>NRLTHENDELETEPROCUNIVARIATEDATA=BSNOPRINTVARSOUTPUTOUT=AMEDIAN=SPROCUNIVARIATEDATA=BSNOPRINTVARDOUTPUTOUT=AMEDIAN=DDATABSKEEPIISDSETSROCSIIIFII<=NNRLTHENDELETEPROCUNIVARIATEDATA=BSNOPRINTVARSOUTPUTOUT=AMEDIAN=SPROCUNIVARIATEDATA=BSNOPRINTVARDOUTPUTOUT=AMEDIAN=DDATAAAMERGEAAAAAROBUST=(D*SD*S)(SS)BROBUST=(DD)(SS)ORROB=EXP(AROB)TPRROB=(EXP(AROB))PROCPRINTTITLE'稳健回归方法ROBUSTREGRESSIONMETHOD'DATAAAAKEEPBROBUSTAROBUSTSETAADOJ=TONBROBUST=BROBUSTAROBUST=AROBUSTOUTPUTENDDATAAAAAKEEPAROBUSTBROBUSTCOUNTCOUNTMERGESROCAAAYHAT=AROBBROBUST*SSIGN=DYHATIFSIGN>THENCOUNTIFSIGN=THENCOUNTIFSIGN<THENCOUNTTITLE'COUNT、COUNT分别为直线之上、下的散点数COUNT为落在直线上的散点数'PROCPRINTRUNSAS程序采用文中所给加权法、非加权法、稳健法求解SROC曲线在S、D平面的回归参数A、B并利用这些参数获得反应诊断试验性能的公共优势比与准确度*TPR。对于类似资料需要修改第行研究文献数n第行的真阳性数(TP)、假阴性数(FN)、假阳性数(FP)和真阴性数(TN)数据。为了精确获得稳健回归的截距项根据稳健回归截距的精确度要求(如小数位数)需修改第行的“AROB=”后的数据后运行程序观察程序运行结果中直线以上散点数(程序中为COUNT)与观察直线以下散点数(程序中为COUNT)的变化经反复修改、运行、观察最终使COUNT≈COUNT此时获得的截距项A才是文件的回归截距。程序第行用于获得包括有TP、FN、FP、TN、灵敏度、特异度、权重、D、S的文件SROC。第行获得加权回归的参数和有关值。第行获得非加权回归的参数和有关值。第~行用于比较加权法与非加权法获得的诊断准确度*TPR。第行获得稳健回归的参数和有关值通过清点残差的正负决定直线上下的散点数。SROC分析的有关问题对于Meta分析*TPR通常是ROC分析的重要小结性统计量。然而尽管它重要但有时也可能不具有实际临床意义。例如如果以前所有研究的假阳性率小于%而*TPR对应的假阳性率为%那么获得的*TPR将无实际意义因为它超出了实际的临床应用范围。在这种情况下可利用公式()、()获得(){}(){}expexpSDTPRSD=(){}(){}expexpSDFPRSD−=−该点可落在SROC曲线上。SROC的另一个可选小结性统计量是曲线下面积(AUC)正如我们采用ROC曲线下面积比较诊断试验一样SROC曲线下面积也不依赖于阈值但*TPR与阈值有关。当两条SROC曲线交叉时AUC用处更大。当假阳性率上限确定时可采用部分曲线下面积表示诊断试验的准确度。例如假如我们只关心特异度在%以上的诊断试验性能那么相应的SROC曲线下面积就是假阳性率FPR小于%的部分。SROC的优点就是将TPR与FPR间的非线性关系转化成S与D间的线性关系但公式()采用比较个*TPR点的方法来比较两个诊断试验这并没有完全利用S与D间的线性关系。实际上我们可在S与D间回归步加入指示不同诊断方式的协变量X进行协方差分析。采用线性理论检验不同诊断方式间的统计学意义。此外也可加入其它的协变量如出版年、研究设计等到线性模型中评价其它不可控制因素对诊断试验性能的影响。当Meta分析包括多种诊断方式的研究也就是一个病人采用若干诊断技术时可以在线性模型中建立个体研究的随机效应模型控制这些研究的相关性结果。文献中也可找到采用广义线性模型的几个例子二、诊断试验对数优势比的其它估计方法计算诊断试验的对数优势比可采用MantelHaenszel法、基于精确的logit可信区间估计法等。MantelHaenszel法假设共有h个诊断试验研究ia、ib、ic、id和in分别表示第i研究的真阳性、假阳性、假阴性、真阴性和总的例数(i=,,…,h)。MantelHaenszel法的调整优势比MHOR为:∑∑===hiiiihiiiiMHncbndaOR()可用公式:∑∑==−−=hiiiiiiiiiiihiiiiiiMHnndbcadcbancbda)())()()((χ()作显著性检验对应的调整优势比MHOR的)(α−的可信区间为:−−−,MHMHUMHUMHORORχχαα()α−U为α水平下的标准正态离差的可信区间=−αU。基于精确的logit可信区间估计法该法于年由Woolf提出所以又称Woof法。其优势比LOR的计算公式为:()=∑∑==hiihiiiLwORwORlnexp()对应的)(α−的可信区间为:−∑∑=−=−hiiLhiiLwUORwUORexp,expαα()其中iOR为第i研究的优势比==−))(ln(LiORVarw)(−iiiidcbaVar表示方差如果某研究的任一个格子例数为则对该研究的每个格子例数加一个较小的数值如。为了检验每个研究的优势比是否相等可采用BreslowDay齐性检验计算公式为:)|()|(MHihiMHiiBDORaVarORaEaQ∑=−=()式中E与Var分别表示期望值与方差统计量BDQ近似服从自由度为(h)的卡方分布。实例分析SAS程序MantelHaenszel法、logit法计算SROC资料的优势比行号程序DATACSETSROCA=B=F=TPOUTPUTA=B=F=FNOUTPUTA=B=F=FPOUTPUTA=B=F=TNOUTPUTTITLE'粗的优势比CRUDEODDSRATIO'PROCFREQDATA=CWEIGHTFTABLESA*BALLRISKDIFFRELRISKNOPRINTTITLE'MANTELHAENSZEL优势比和LOGIT优势比'PROCFREQDATA=CWEIGHTFTABLESI*A*BALLRISKDIFFRELRISKNOPRINTRUN利用SAS程序第行产生的SROC文件以及SAS程序可获得MantelHaenszel法、logit法估计的诊断试验优势比。程序第行将SROC文件数据转换成所需要的数据形式。第、行计算粗的优势比第、行用于计算MantelHaenszel调整优势比和基于精确的logit法得优势比。前一个FREQ过程步计算得组研究合并后的MHχ=df=,≤PMantel–Haenszel法粗的优势比为可信区间为()logit法粗的优势比为可信区间为()。后一个FREQ过程步计算出的MHχ=df=≤PMantelHaenszel调整优势比MHOR=对应的可信区间为(,)基于精确的logit法得优势比LOR=对应的可信区间为(,)。这些结果与加权回归法估计的优势比更接近。该资料经BreslowDay齐性检验得BDQ=df=≤P说明这个研究的优势比有差异并非都相等。从上述分析结果表明:几种方法给出的Pap试验诊断准确度相似*TPR在左右阳性诊断优势比在左右说明该试验在诊断早期子宫颈癌试验方面具有一定的作用但分析结果提示该试验的准确度并不很高。以上方法均假设金标准是完善的如果金标准有缺陷时则需要对获得的诊断试验准确度指标作出调整。于年Wa

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/14

ROC_meta

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利