下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 使用SPSS作多变量观察值的ROC曲线分析

使用SPSS作多变量观察值的ROC曲线分析.doc

使用SPSS作多变量观察值的ROC曲线分析

我要原配也要小三_
2017-09-27 0人阅读 举报 0 0 暂无简介

简介:本文档为《使用SPSS作多变量观察值的ROC曲线分析doc》,可适用于高等教育领域

使用SPSS作多变量观察值的ROC曲线分析使用SPSS作多变量观察值的ROC曲线分析中国公共卫生年第卷第期nJPublicHealthVoNo文章编号:(}中图分类号:R文献标识码:A使用SPSS作多变量观察值的ROC曲线分析刘润幸在I临床医学中,采用金标准(来诊断是最为理想的,如恶性肿瘤的病理诊断,血液疾病的骨髓诊断,传染性疾病的病原体诊断等等但有时病人受客观情况的限制,无法利用金标准来诊断,医生仅能根据病人的临床表现对疾病作出诊断如果医生只凭单项测量指标对病人作出诊断,往往较为主观和敏感性(sensitivity,或真阳性率)较低综合利用多项测量指标对病人作出诊断能大大提高正确诊断的敏感性本文介绍如何使用SPSS的BinaryLogistic和ROCCurve过程进行多变量(多项测量指标)观察值的ROC曲线分析,并且与单变量(单项测量指标)观察值的ROC曲线作比较,说明多变量观察值的ROC曲线作诊断的优点,使用线性内插法求诊断点(cutoff),最后对某个体作出诊断lROC曲线分析与个体诊断的步骤求各个体的预测概率使用SPSS的BinaryLogistic过程进行Logistic回归求出Logistic回归方程,并在SPSS的工作数据表中产生含各个体预测概率的新变量ROC曲线分析使用SPSS的ROCCurve过程以新变量为检验变量(TestVariable),金标准的诊断结果为状态变量(StateVariable),作RC曲线分析确定诊断点根据临床实际,确定所要求的真阳性率或假阳性率可以不使用或使用线性内插法求出诊断点(R=x)为医生设定的假阳性率(或真阳性率),P(R=x)为(R=x)对应的诊断点,R为恰好小于(R=x)的假阳性率(或真阳性率),R为恰好大于(R=x)的假阳性率(或真阳性率),P和P分别为R和R对应的诊断点,根据线性内插法有:(R一R):R一(R:x)=(P一P):P一P(R=x)()个体的预测用某个体的多变量观察值代入Logistic回归方程,求出其预测概率值,并且与诊断点P(R=x)比较,得出该个体的诊断应用实例为研究肺结核的鉴别诊断,取例肺结核病人为病例组和例肺癌病人为对照组,他们分别以痰中查到肺结核菌和有肺癌病理诊断作为诊断金标准,用变量group表示(肺结核=,肺癌)每一例病人测量项指标:X线检查用变量未明=),X表示(诊断为肺结核=,肺肿瘤或肺炎=一,血沉值mmh用变量X表示,发热用变量X表示(有=,无=一),咯血用变量X表示(有=,无=一)SPSS的操作(,)作者单位:广州暨南大学医学院医学统计学教研室,作者简介:刘润幸(一),男,广东惠州人,副教授,硕士,主要从事医学统计学的教学和科研工作【卫生统计】()求协变量X时的各个体预测概率在主菜单中选择:AnalyzeRegressionBinaryLogistic'''在LogisticRegression对话框中选择:Dependent:groupCovariates:XSavePredictedValues囹Probabilities单击OK按钮运行Logistic回归过程,在SPSS的工作数据表中产生含各个体预测概率的新变量pre一()求协变量X,X,X和X时的各个体预测概率在LogisticRegression对话框中的Covariates栏再放入X,X和X后单击OK按钮运行Logistic回归过程,产生表结果和在SPSS的工作数据表中产生含各个体预测概率的新变量pre一()个ROC曲线的分析在主菜单中选择:GraphsRCCurve…在ROCCunre对话框中选择:TestVariables:pre一pre一StateVariable:groupValueofStateVariable:Display一囹R()CCurve囹Withdiagonalreferenceline囹Standarderrorandconfidenceinterval囹CoordinatepointsofROCCurve单击OK按钮运行ROC曲线过程,产生图I表和表结果SPSS的主要结果表协变量xx,)(和x的LogIstic回归系数,标准误和P值一……,一,一硼啊中国公共卫生年第卷第期ChinJPublicHealthVoNo一特异性(假阳性率)圉变量pre一《单协变量)和pre一(四个协变量)的ROC曲线的比较表变量pre一和pre一的曲线下面积,标准误,P值和可信区间表变量pre一的ROC曲线坐标点确定诊断点取假阳性率R=(即取R=)后设定诊断点从表数据得:R=,R=,Pl=和P=,代入公式()有:():):【一P(R=(O)=()P(R=):一()()()=取假阳性率R=后求得诊断点为预测概率值大于或等于判为阳性(即诊断为肺结核),反之为阴性个体的预测从表可得Logistic回归方程:P=e(一o)(oo池X一o)()如果有个病人,测得X=,X=,X=和X=一,代入Logistic回归方程得:预测概率值P=与诊断点P(R=)=比较,得PP(R=),故该病人被诊断为肺结核讨论SPSS的R()C曲线分析的适用条件:一个或以上的检验变量(TestVariables),它们均为含预测概率的变量个状态变量(StateVariable),它是二项分类变量生当协变量含有分类变量和数值变量时,应使用Log~tic回归求预测概率当协变量均是数值变量时,应使用判别分析求预测概率值得注意是:当使用SPSS的discriminam过程计算二值判别的预测概率时,会分别产生个分类预测概率变量究竟以何者作为ROC曲线分析的检验变量,这时应该选择判别分类号与状态变量的阳性值一致的分类预测概率变量,如状态变量有个值(O,),为阳性值,为阴性值,故应该选类预测概率变量(ProbabilitiesofMembershipinGroup)作为ROCCurve过程的检验变量,而不是类预测概率变量(ProbabilitiesofMembershipinGroup)SPSS的ROC曲线分析实际上是多变量(Logistic回归或前者分析判别分析)模型和单变量(ROC曲线)模型的组合单或多协变量观察值并且产生含预测概率的变量(最终结果),后者把前者的预测概率变量作为检验变量(最初分析变量)进行ROC曲线分析因此SPsS的ROC曲线分析有个优点:()资料的适用范围广:由于Logistic回归适用于各种类型的原始数据,故SPSS的ROC曲线模型能间接地分析各种类型的原始数据()可以作多协变量的分析:Logistic回归或判别分析模型能分析单或多协变量的原始数据,故SPSS的R()C曲线模型也能间接地分析单或多协变量的原始数据,比目前国内文献上叙述的ROC曲线模型(均分析单变量原始数据)更为先进了多协变量ROC曲线分具有不但能消除干扰因素的影响,并且能提高诊断效能等优点如本例变量pre一(由个协变量x线检查,血沉,发热和咯血产生)与变量pre一(由单协变量x线检查产生)的ROC曲线分析相比:图显示变量pre一的ROC曲线高于变量pre一表显示变量Pre一面积=大于变量pre一面积A腿=,对应P值为Pp以=和Pl=,说明前者有统计学意义,后者无统计学意义在Logistic回归模型中,阳性(真)和阴性(假)之间的诊断点(或判别点)是单个和固定的(诊断点固定在)但SPSS的R()C曲线模型可以自由和方便地设定单个或多个诊断点如何确定诊断点,可根据种情况:()按照临床实际要求设定诊断点本例取假阳性率为时,诊断点=()根据阳性者和阴性者分布的重叠程度设定个或个诊断点:如果两者分布重叠较少时,平衡假阳性率和假阴性率后设定个诊断点如果两者分布重叠较多时,可以在两者分布重叠处设定个诊断点,这样把阳性者和阴性者个分布划为个范围,即阳性,可疑和阴性范围因此,SPSS的ROC曲线模型的诊断更符合临床诊断的客观实际参考文献:孙军,陈峰,郑凯尔ROC曲线分析在放射学中的应用J中华放射学杂志,,()刘润幸SPSS医学统计方法与应用(高级统计)M广州:广东人民出版社SPSSIncSPSSBaseUser'SGuideMUSA:SPSSInc检验变量所含预测概率由Logistic回归或判别分析产收稿日期:(宋艳萍编辑刘铁校对)Tl『iT匪羽

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/7

使用SPSS作多变量观察值的ROC曲线分析

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利