首页 【doc】ROC曲线下面积的ML估计与假设检验

【doc】ROC曲线下面积的ML估计与假设检验

举报
开通vip

【doc】ROC曲线下面积的ML估计与假设检验【doc】ROC曲线下面积的ML估计与假设检验 ROC曲线下面积的ML估计与假设检验 I 中国公共卫生2003年第19卷第1期(JPublicHeahhJan2003Vol19No.1l27 文章编号:1001—0580【2003)010127—02中图分类号:R780.2文献标识码:A ROC曲线下面积的ML估计与假设检验 邹莉玲.沈其君,陈峰,郑凯尔 【卫生统计】 摘要:目的探讨诊断试验中配对设计资料的ROC分析方法.方法在双正态模型基 础下应用ML估计方 法计算ROC曲线下面积,正态近似法估...

【doc】ROC曲线下面积的ML估计与假设检验
【doc】ROC曲线下面积的ML估计与假设检验 ROC曲线下面积的ML估计与假设检验 I 中国公共卫生2003年第19卷第1期(JPublicHeahhJan2003Vol19No.1l27 文章编号:1001—0580【2003)010127—02中图分类号:R780.2文献标识码:A ROC曲线下面积的ML估计与假设检验 邹莉玲.沈其君,陈峰,郑凯尔 【卫生统计】 摘要:目的探讨诊断试验中配对设计资料的ROC分析 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 .方法在双正态模型基 础下应用ML估计方 法计算ROC曲线下面积,正态近似法估计面积的可信区间及假设检验.结果由迭 代法进行参数估计,得到ROC曲 线下的面积,面积的标准误及置信区间,可计算出面积比较的u检验统计量.结论可 用于配对设计的诊断试验的 比较和评价,包括对连续性和等级分类资料的处理. 关键词:双正态模型;ROC曲线下面积(AUC);ML估计;诊断试验 Maximumlikelihoodestimationandhypothesistestofareasunderreceiveroperatingcharacteristic(Roe)curvesZOU Li— ling,SHENQi-jun,CHENFeng.DepartnzentoJHealthStatistics,SchoolofPublicHealth,SoutheastUniversity(Nan— ring210009,China) Abstract:ObjectiveToexplorereceiveroperatingcharacteristic(R0C)analysismethodwithpaireddatasetsinmedical diagnostictests.MethodsOnthebasisofbinormalmodel,maximumlikelihoode~timationwasappliedtOareascalculation, andapproximatelynorrnalmethodtOconfidenceintervalestimationandhypothesistest.Resul~Bytheiterativeprocedure, MLestimationandstandarderrorsofR0CCurveparametersaandb.ROC—areaindexAzwereobtainedandhypothesistest statisticUvaluecouldbecaculated.ConclusionROCanalysiscanbeappliedtOanalyseande valuatethediagnostictestwith paireddata,includingcontinuousdataandrank—ordereddata. Keywords:binorma1model;areaunderROCCurve(AUC);MLestimation;diagnostictest 对临床诊断和筛检试验综合评价和比较,应用最广泛的 统计方法为R0C曲线分析方法,尤其在影像诊断领域应用非 常多见.医学上,ROC曲线分析的本质就是分析比较不同医 学诊断试验随诊断界值改变而动态变化的灵敏度一特异度曲 线的差异.自从BamberD【1j于1975年提出R0C曲线下面 积估计方法以来,许多学者通过对不同资料类型进行的研究, 相继提出了R0C曲线面积估计,可信区间估计和面积比较的 假设检验的参数和非参数方法.本文系统介绍了应用较为广 泛的配对设计资料的ROC曲线双正态模型的参数估计和假 设检验方法,并应用于实际影像诊断方法的分析评价和比较, 旨在探讨该方法的可行性. l统计方法原理 1.1双正态模型【2?j平滑ROC曲线的拟合是以两个决策 变量或总体R0C曲线的分布假设为基础的,尽管假设的分布 类型可有很多种,但使用最多的却是正态离差后呈直线分布 的总体ROC曲线,也即是TPF的正态离差对应FPF的正态 离差作图为一直线.无论是连续性资料还是分类等级资料, 我们都可以假定资料是来自某种潜在决策变量分布,即分类 等级资料亦可看作是来自某个潜在连续分布资料的粗分类. 通常采用正态偏差轴上的直线的纵坐标截距(a)和斜率(b)两 个参数来确定一条ROC曲线.正态偏差轴上的直线型ROC 的每个点的横,纵坐标可用以下关系式表示: 中一(TPF):a+b中一(FPF)(1) 这里中(z)表式标准正态累积分布函数,因此上式可以转化为 传统的ROC曲线的坐标形式: TPF:中[a+b中I1(FPF)](2) 式中,TPF一真阳性率.等于灵敏度(SE); FPF一假阳性率,等于[1一特异度(SP)] 假定决策变量的检测结果来自均数和标准差各不同 的两个正态分布总体的真阴性和真阳性观察个体,并以, 分别表示真阴性总体分布的均数和标准差,以,分别 作者单位:1.东南大学公共卫生学院卫生统计学教研室,南京 210009; 2.东南大学附属中大医院 作者简介:邹莉玲(1977一),女.江西高安人,在读硕士,主要从事临 床诊断与筛检试验统计分析方法的研究. 表示真阳性总体分布的均数和标准差.这样可得到真阴性个 体的条件累积分布函数(ln)和真阳性个体的条件累 积分布函数F(lS)的表达式如下: (zln):[(一,)/,](3) I(zlS)=[(z一)/C7s](4) 不失一般性,我们认为,?,C为界值点,当x?c时 判为阴性个体,而z?C时判为阳性个体,则任意界值点C对 应的FPF,rrPF的值为: FPF(C)=Prob(兰>Clneg)=1一Prob(x?Clneg) : 卜中():中()(5) 口?口" rrPF(C)=Prob(兰>Clpos):1一Prob(x?Clpos) : 1一():()(6) DD 对(5)(6)式求反函数得到 一C=,一(FPF)一=一(丁PF)一(7) 由上式推出:(了'lPF)=lj+lj(FPF) (8) 比较(1)式和(8)式得到:n:L二b:(9) O 1.2ROC曲线下面积的ML估计ROC曲线的综合评价指 标Az可由以下公式算得[: fa\ AzIJ(10) 将诊断试验结果看作是被,一1个合适的界值t,分割成 的,个等级的有序分类资料,取t0:一.o,tf=+.o,则某诊 断结果为第i类效应的概率为 真阴性个体P….:lfl(tiln)一l】I(t卜lln) (11) 真阳性个体P=1(tfI5)一1(tf一1Is)(12) 所有观察对象都有明确诊断,假设真阴性总人数为K, 真阳性总人数为L,效应间相互独立,且分类界值固定后的真 阴性簇和真阳性簇的观察个体数分别为k和z,k={k】,k2, …一 , kfl?=K},.[=;f1'…?,zfl?,l,=L}.那 么.k和z的似然值为 一 128中国公共卫生2003年第l9卷第1期ChinJPublicHealthJan2003Vo1.19No.1 (k,lIn,b,t)=(P1I)1(户2I)2… (PlI)f (P)f(P1I)1(P2I)2… (13) 自然对数似然值为: JJ lna=?kln(p)+?lln(p)(14) 利用迭代法可求得参数a,b及其标准误的ML估计值, 进而由公式(10)求得Az的估计值,再利用delta法算得Az的 标准误. 1.3面积的置信区间估计及假设检验 令=(al,/1+b),Ad=?(-2/K一1)+/L一1) 则A的(1一a)100%可信区间计算公式【]为: (?Ua/2?)(15) 对两条ROC曲线进行比较时,由前面的ML估计得到 ROC曲线下面积的估计值A1和A2,并由delta法可得到A1 和A2的标准误SE1,SE2.在H0:A1=A2H1:Al?A2的假 设下.进行面积比较的检验统计量【4]为: ' :—:三尘:一(16) 0SE+SE一2rSE1SE2 式中r是A】和A2的相关系数. 2应用实例分析 我们与本校附属医院放射科合作,用仿真胃镜螺旋CT (SCT)和钡餐造影X线片(UGI)两种影像学诊断方法对68 例胃癌可疑患者进行鉴别诊断,探讨CT仿真胃及三维重建 对胃癌诊断的价值.从中选取同时接受SCT和UGI两种影 像学诊断的胃癌可疑患者60例作为本次研究的数据,包括经 病理确诊为胃癌(胃癌阳性)的52例,胃部良性病变(胃癌阴 性)的8例. 应用前面介绍的双正态模型对这两种影像学诊断进行 ROC分析.模型参数a和b采用M法估计,由初始估计值经 过6次迭代之后得到最后的估计值(见表2),代入公式(10) 计算得到ROC曲线下面积Az的估计值,最后对SCT和UGI 两种诊断方法的AUC进行比较,在近似正态条件下作面积比 较的假设检验. 表1原始分类资料的频数分布 表2SCT和UGI诊断胃癌的ROC模型参数估计值 诊断 方法 sEsEsErr 6Az (n)(6)(Az)(A1,A2) SCq"3.1027075340.99341.09640.68380.0083 uGI2.423l0.8l470.96980.63780.49l40.0247 0.1305 Az的非对称95%:scT=(0.9447-0.9996)UGI=(0.8788-0.9952) 注:ROC曲线下面积检验统计量为0.9402,对应双尾P值为 0.3471.单尾P值为0.1736 由以上表中数据可以看出SCT的Az(0.9934)比UGI 的A(0.9698)稍大,但经假设检验认为二者差异无统计学 意义,可以增大样本量做进一步统计分析. 3讨论 本研究介绍了双正态模型条件下ROC曲线中参数的意 义,估计方法和AUC的计算公式,可信区间估计及假设检验 方法.该方法对于连续性分布资料和等级分类资料均假定其 总体分布为正态分布,对等级分类资料常当作是某个潜在的 服从正态分布的连续性分布资料的实际分类.当资料偏离正 态分布较大时,对ROC曲线下面积与参数的估计和假设检验 可用非参数方法.有学者对双正态模型与非参数方法进行了 比较研究【5],其估计结果是十分接近的,因此双正态模型法具 有较好的稳健性.对模型参数a和b采用ML方法估计时, 初始估计值的选取会影响到迭代的收敛性甚至是最终的参数 估计值.Metz等人【2】经过模拟试验认为,以ROC曲线正态 离差化后的直线经普通最小二乘法拟和得到的参数估计值作 为ML估计的初始值进行迭代,可获得可靠的参数估计值a, 6及曲线下面积A. 图1SCT和UG!用于胃癌诊断的ROC曲线 文中将该方法应用于仿真胃镜螺旋CT(SCT)和钡餐造 影(UGI)两种影像学诊断的比较和评价分析,所用数据为配 对设计的5等级分类资料,是影像上较常见的资料类型,得到 两条ROC曲线下面积分别为0.9934和0.9698,经假设检 验后认为二者差异无统计学意义,建议增大样本含量作进一 步的分析;还可能通过定量计算ROC曲线上的拐点,进一步 探讨SCT和uGI对胃癌诊断的界值. 本文仅限于完全配对设计的无协变量的简单情况,当需 以通 要考虑个体特征,操作条件或多指标对诊断的影响时,可 过协变量存在情况下建立有序或logistic回归模型原方法进 行ROC曲线下面积估计和曲线下面积比较的假设检验,部分 配对资料的面积估计及假设检验也可用ML方法则ROCKIT 软件完成.同时.本文所介绍的方法要求研究对象均需经金 标准确诊,实际研究中常用部分病例未得到确诊,即存在确诊 偏性,此时可视作随机缺失数据问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 ,采用Xiao—HuaZhou6j 提出的确诊偏性存在条件下的ML估计方法处理. 参考文献: [1]BamherD.Theareaabovetheordinaldominancegraphandthearea belowthereceiveroperatingcharacteristicgraph[J],Journalof MathematicalPsychology,l975.l2:387—4l5, [2]MetzCE,HermanBA,ShenJH,Maximum—likelihoodestimation ofreceiveroperatingcharacteristic(ROC)cu~esfromcontinuously — distributeddata[J].StatisticsinMedicine,1998,17(9):1033一 l053. [3]ReiserB.Measuringtheeffectivenessofdiagnosticmarkersinthe presenceofmeasurementerrorthroughtheuseofR()(=curves[J]. StatisticsinMedicine,2000.19:2ll5—2l29. [4]HanleyJA,McNeilBJ.Amethodofcomparingtheareasunderre— ceiveoperatingcharacteristiccu~esderivedfromthesamecases [J].Radiology,l983,148:839—843. [5]Hajian—TilakiKO,HanleyJA,Jo~phL,eta1.Acomparisonof parametricandnonparametricapproachestoR()Canalysisofquan— titativediagnostictests[JJ.MedDecisMaking,1997,17:94—102. [6]ZhouXiao—hua.ComparingcorrelatedareasundertheR()(=curves oftwodiagnostictestsinthepresenceofverificationbias[J].Bio— metrics.1998.54:453—470. 收稿日期:2002,06—11(宋艳萍编校)
本文档为【【doc】ROC曲线下面积的ML估计与假设检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_044822
暂无简介~
格式:doc
大小:25KB
软件:Word
页数:9
分类:生活休闲
上传时间:2017-09-30
浏览量:20