下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 ROC分析的基本原理ROC_basic

ROC分析的基本原理ROC_basic.pdf

ROC分析的基本原理ROC_basic

xiedao
2011-05-15 0人阅读 举报 0 0 暂无简介

简介:本文档为《ROC分析的基本原理ROC_basicpdf》,可适用于自然科学领域

ROC分析的基本原理宇传华徐勇勇ROC是受试者工作特征ReceiverOperatingCharacteristic或相对工作特征RelativeOperatingCharacteristic的缩写ROC分析五十年代起源于统计决策理论后来应用于雷达信号观察能力的评价六十年代中期大量成功地用于实验心理学和心理物理学研究Lusted首次提出了ROC分析可用于医学决策评价自从八十年代起该方法广泛用于医学诊断性能的评价如用于诊断放射学实验室医学癌症的筛选和精神病的诊断尤其是医学影像诊断准确性的评价其它准确性评价指标的局限性对于二分类总体如对照与病例或无病与有病正常与异常噪声与信号诊断试验结果分别写成阴性和阳性其资料可列成表的四格表形式这时可计算出正确百分率灵敏度特异度等指标计算公式见表这几个指标均可不同程度反映诊断的准确性正确百分率是病例正确诊断为阳性与对照正确诊断为阴性的例数和占总例数的百分比它很大程度上依赖患病率如患病率为完全无价值地诊断所有样本为阴性也可有的正确百分率其次它没有揭示假阴性和假阳性错误诊断的频率相同的正确百分率可能有十分不同的假阴性和假阳性第三它也受诊断阈值的限制更好的方法是计算灵敏度和特异度它们的值越高诊断性能越好灵敏度是病例被正确诊断为阳性的比例也叫真阳性率truepositivefractionrate简称TPF特异度是对照被正确诊断为阴性的比例也叫真阴性率特异度为假阳性率falsepositivefractionrate简称FPF应用这对指标最明显的问题是比较两个诊断系统时可能出现一个诊断系统的灵敏度高而另一个特异度高无法判断哪一个诊断系统更好此时可将灵敏度和特异度结合改变诊断阈值获得多对灵敏度和特异度即TPF和FPF值绘制ROC曲线作ROC分析来解决这一问题表诊断资料´四格表金标准诊断结果病例对照合计a(真阳性)b假阳性abc(假阴性d真阴性cd阳性阴性合计acbdabcd=N正确百分率=adN´灵敏度=真阳性率TPF=aac特异度=dbd=假阳性率FPF=bbd作者单位第四军医大学卫生统计学教研室西安疾病疾病合计Disease()Disease()Total试验()真阳性假阳性试验阳性数Test()TruepositivesFalsepositivesTestpositives试验()假阴性真阴性试验阴性数Test()FalsenegativesTruenegativesTestnegatives合计实际病人数实际非病人数所有受试者TotalDiseasepositivesDiseasenegativesAllsubjectsROC分析资料收集与整理一个诊断系统获得的原始资料可记录成连续性和离散性两种形式连续性资料常见于临床检验它是利用仪器设备等测量的数据为了叙述的方便假设某诊断系统的对照组有个受试者其检验结果为,,,病例组有个受试者其检验结果为,,,,将这个数据从大到小排列以前个数据的每一个作为诊断阈值(或截断点)大于等于该阈值为阳性小于该阈值为阴性则对于每一个诊断阈值都可整理成类似表的四格表由此可得出以下个ROC工作点FPF,TPF=(,)(,)(,)(,)(,)(,)(,)(,)实际工作中两个组的样本量往往很大可将资料整理成频数表以组中值为诊断阈值获得频数表的组数个ROC工作点也可根据临床需要取若干个诊断阈值离散性资料常见于医学影像诊断和心理学评价常将诊断结果划分为或类如果分类可将受试对象按肯定正常可能正常异常可疑可能异常肯定异常进行分类分别记为例如有份CT影像其中有份正常份异常一影像工作者对这些CT影像进行分类其结果见表表份CT影像分类诊断分类实际情况*合计正常异常*,,,分别表示肯定正常,可能正常,,肯定异常对于分类资料可从分类高到低以前个分类即分类,,,为置信阈计算ROC工作点该类及以上例数的和为阳性该类以下例数的和为阴性对每一个置信阈都可整理出一个类似表的四格表如以表分类为置信阈时则正常组阳性例数为=其假阳性率FPF==异常组阳性例数为=其真阳性率TPF==同样以表分类为置信阈计算的ROC工作点分别为FPF,TPF=(,)(,)(,)假设正常组和异常组均服从正态分布则分类等级资料可按图解释图中左边钟型曲线为正常组右边为异常组同时采用个置信阈将实验结果分为类置信阈越严格即分类越高阳性决策的置信度越高置信阈越宽松即分类越低阳性决策的置信度越低连续性资料是采用诊断阈值进行判断的也可类似理解同时采用个置信阈异常组正常组分类分类阳性决策置信度低高图分类等级资料图解ROC曲线的构建以假阳性率FPF为横轴真阳性率TPF为纵轴横轴与纵轴长度相等形成正方形在图中将ROC工作点标出用直线连接各相邻两点构建未光滑ROC曲线构建光滑曲线需要假设对照组和病例组服从某种分布用一曲线拟合技术估计参数直接用参数产生也可采用肉眼目测构建光滑曲线注意无论资料类型如何曲线一定通过(,)和(,)这两点这两点分别相当于灵敏度为而特异度为和灵敏度为而特异度为理论上完善的诊断有TPF=FPF=图中表现为ROC曲线从原点垂直上升到图的左上角然后水平到达右上角完全无价值的诊断有TPF=FPF是一条从原点到右上角的对角线一般ROC曲线位于正方形的上三角表资料对应的ROC曲线见图假阳性率FPF真阳性率TPF图未光滑的ROC曲线示意图ROC曲线对诊断的准确性提供了直观的视觉印象描述了相反两种状态间诊断系统的判别能力曲线上的每一点代表了随着病例诊断阈值或置信阈变化的灵敏度与特异度的折衷严格的标准产生较低的灵敏度和较高的特异度ROC点位于曲线的左下方宽松的标准产生较高的灵敏度和较低的特异度ROC点位于曲线的右上方如果比较的诊断系统曲线不交叉则较高的ROC曲线具有较好的诊断性能如果曲线交叉可在考虑费用与效益的前提下结合统计学检验判断其诊断性能ROC分析的准确性评价指标一般用ROC曲线下面积反映诊断系统的准确性理论上这一指标取值范围为至,完全无价值的诊断为完善的诊断为该指标及其标准误的计算目前有非参数半参数和参数方法其中得到广泛应用的方法有Wilcoxon非参数法和最大似然估计双正态参数法具体方法参见其它文献其它有关问题ROC工作点的可信区间对于每个ROC工作点可根据二项分布标准误计算公式nppSp)(=计算FPF和TPF的标准误对于FPFp=FPFn=对照组总例数对于TPFp=TPFn=病例组总例数如表资料分类的工作点(FPF,TPF)=(,的标准误为(,)其的可信区间为(±)(±)“金标准对于诊断系统的准确性评价,首先应知道受试者(人动物或影像等)的真实情况即哪些是对照组哪些是病例组划分它们的标准就是金标准常见的金标准有跟踪随访活组织检查尸体解剖等尽管金标准不需要十全十美但是它们应比评价的诊断系统更可靠且与评价的诊断系统无关最佳工作点的选择阳性似然比为真阳性率与假阳性率之比即等于TPFFPF约登Youden指数为真阳性率与假阳性率之差即等于TPFFPF一般选择阳性似然比或约登指数最大者为最佳工作点也有人采用CB(P)P计算最佳工作点的斜率表达式中CB和P分别表示花费收益和患病率在假定对病例组实施治疗而对对照组不治疗的前提下这一表达式表示治疗疾病的花费Cost和收益Benefit之比与(患病率)和患病率Prevalence之比的乘积在ROC曲线上从(FPF,TPF)=(,)到(,)工作点斜率从大到小单调改变从表达式可以看出如果疾病治疗花费多收益少或患病率低则斜率大最佳工作点接近(,确保了假阳性的减少如果疾病治疗花费少收益多或患病率高则斜率小最佳工作点接近(,确保了假阴性的减少参考文献MetzCE,HermanBA,ShenJHMaximumlikelihoodestimationofreceiveroperatingcharacteristic(ROC)curvesfromcontinouslydistributeddataStatMed,,inpressMetzCESomepracticalissuesofexperimentaldesignanddataanalysisinradiologicalROCstudiesInvestRadiol:章扬熙临床流行病学(第六讲):诊断试验研究(续)中华流行病学杂志,():FeinsteinARClinicalepidemiology:architectureofclinicalresearchWBSaundersCompany,,刘杰,林一帆,张沥等图象自动分析检测MG抗原表达预测胃癌高危价值探讨中华预防医学杂志():DwyerAJInpursuitofapieceoftheROCRadiology:

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/4

ROC分析的基本原理ROC_basic

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利