首页 诊断试验方法的评价

诊断试验方法的评价

诊断试验方法的评价 1 诊断试验方法的评价诊断试验方法的评价浙江大学流行病学教学组浙江大学流行病学教学组金明娟金明娟诊断试验包括病史、症状和体征资料；实验室检查（如生化、病原诊断试验包括病史、症状和体征资料；实验室检查（如生化、病原学、免疫学、血液学、病理学等）；仪器检查如学、免疫学、血液学、病理学等）；仪器检查如XX线检查、超声诊断、线检查、超声诊断、 CTCT、、ECTECT和核磁共振等；疾病的诊断是一项比较复杂的过程，因为每个和核磁共振等；疾病的诊断是一项比较复杂的过程，因为每个备检对象的基本特征均不相同。备检对...

1 诊断试验方法的评价诊断试验方法的评价浙江大学流行病学教学组浙江大学流行病学教学组金明娟金明娟诊断试验包括病史、症状和体征资料；实验室检查（如生化、病原诊断试验包括病史、症状和体征资料；实验室检查（如生化、病原学、免疫学、血液学、病理学等）；仪器检查如学、免疫学、血液学、病理学等）；仪器检查如XX线检查、超声诊断、线检查、超声诊断、 CTCT、、ECTECT和核磁共振等；疾病的诊断是一项比较复杂的过程，因为每个和核磁共振等；疾病的诊断是一项比较复杂的过程，因为每个备检对象的基本特征均不相同。备检对象的基本特征均不相同。临床医师在进行疾病诊断的时候，都临床医师在进行疾病诊断的时候，都可能包含错误，如漏诊和误诊可能包含错误，如漏诊和误诊。。用于临床疾病诊断的试验方法很多，而且随着科学技术，特别是医用于临床疾病诊断的试验方法很多，而且随着科学技术，特别是医学、分子生物学、电子与计算机技术的发展，越来越多的新试验方法学、分子生物学、电子与计算机技术的发展，越来越多的新试验方法被应用于临床诊断。然而被应用于临床诊断。然而任何诊断试验都不是完美无缺的任何诊断试验都不是完美无缺的,,都会受到各都会受到各种条件的影响和限制，在临床实践应用中往往具有局限性和片面性。种条件的影响和限制，在临床实践应用中往往具有局限性和片面性。作为临床医师，都必须考虑下列问题：一个试验方法用于某种作为临床医师，都必须考虑下列问题：一个试验方法用于某种疾病诊断的真实性和可靠性如何？如试验结果异常对疾病的诊疾病诊断的真实性和可靠性如何？如试验结果异常对疾病的诊断价值有多高？试验结果正常对排除疾病的判断价值又如何？断价值有多高？试验结果正常对排除疾病的判断价值又如何？有哪些因素能影响此试验的结果？有哪些因素能影响此试验的结果？这不仅对推广一个新的诊断试验十分必要，而且对快速、准确这不仅对推广一个新的诊断试验十分必要，而且对快速、准确地诊治病人，提高临床医学科学水平都是非常重要的。地诊治病人，提高临床医学科学水平都是非常重要的。诊断试验评价的基本程序诊断试验评价的基本程序诊断试验的评价指标诊断试验的评价指标预测值预测值提高试验效率的方法提高试验效率的方法疾病筛检疾病筛检 2 诊断试验评价的基本程序确立金标准确立金标准选择研究对象选择研究对象样本大小样本大小同步评价同步评价根据试验检查的结果，评价其诊断价值根据试验检查的结果，评价其诊断价值金标准是指一种疾病标准诊断方法，是当前医学界公认的、诊断某病的可金标准是指一种疾病标准诊断方法，是当前医学界公认的、诊断某病的可靠的诊断方法，应用该标准能较正确区分某种疾病的人和不具有该病的靠的诊断方法，应用该标准能较正确区分某种疾病的人和不具有该病的人。人。不同的疾病有不同的金标准，常见的金标准有：病理学检查（组织活检和不同的疾病有不同的金标准，常见的金标准有：病理学检查（组织活检和尸体解剖）诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断尸体解剖）诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断如冠状动脉造影诊断冠心病。对于有些诊断困难的疾病可以采用现今公认如冠状动脉造影诊断冠心病。对于有些诊断困难的疾病可以采用现今公认的方法如综合诊断方法或长期随访病例观察所得到的结果。的方法如综合诊断方法或长期随访病例观察所得到的结果。要评价一个试验方法，金标准的选择是非常重要的。一项诊断试验的准确要评价一个试验方法，金标准的选择是非常重要的。一项诊断试验的准确程度只有在金标准诊断的病人组和非病人组中进行考核，才能得到正确地程度只有在金标准诊断的病人组和非病人组中进行考核，才能得到正确地评价。评价。 ¾¾ 确立金标准确立金标准在诊断试验方法评价中，研究对象包括两组，一是被金标准确诊的病例在诊断试验方法评价中，研究对象包括两组，一是被金标准确诊的病例组，另一组是金标准证实无该病的人群，即对照组。所有的研究对象都要组，另一组是金标准证实无该病的人群，即对照组。所有的研究对象都要有代表性有代表性病例应包括该病的各种临床类型（轻、中、重）、病期（早、中、晚）、病例应包括该病的各种临床类型（轻、中、重）、病期（早、中、晚）、典型和不典型病例以及并发症和肿瘤转移等病人。病例的代表性影响评价典型和不典型病例以及并发症和肿瘤转移等病人。病例的代表性影响评价结果的普遍性以及临床推广的意义结果的普遍性以及临床推广的意义对照组人群应是确实无该病的人群，不仅包括正常人群，也应包括来自非对照组人群应是确实无该病的人群，不仅包括正常人群，也应包括来自非研究疾病的其他病例，尤其是与该疾病易混淆而在临床上需要鉴别诊断的研究疾病的其他病例，尤其是与该疾病易混淆而在临床上需要鉴别诊断的疾病。在年龄、性别等因素上与病例有疾病。在年龄、性别等因素上与病例有可比性可比性 ¾¾ 选择研究对象选择研究对象评价诊断试验的样本含量可用下列公式估计评价诊断试验的样本含量可用下列公式估计 PP为试验的预期特异性或灵敏度，为试验的预期特异性或灵敏度，δδ为容许误差为容许误差，，αα为为第一类误差的第一类误差的概率，概率，UUαα值由值由UU界值表可查得。界值表可查得。 ¾¾ 样本大小样本大小 2 2 )1( δ α PPUN −= 3 用被评价的诊断试验方法对研究对象进行同步检查，采用盲法用被评价的诊断试验方法对研究对象进行同步检查，采用盲法 ((double blinddouble blind))观察。目的在于消除由于研究对象心理情绪上观察。目的在于消除由于研究对象心理情绪上的波动或异常影响试验结果，避免由于试验者主观意愿而影响的波动或异常影响试验结果，避免由于试验者主观意愿而影响试验结果试验结果在诊断试验评价时，研究者的愿望是新试验比旧试验好，如没在诊断试验评价时，研究者的愿望是新试验比旧试验好，如没有采用盲法观察，试验者就有可能自觉或不自觉地对病人或非有采用盲法观察，试验者就有可能自觉或不自觉地对病人或非病人的试验结果作出不同的判断病人的试验结果作出不同的判断例如对同样一个可疑阳性结果，对病人则易倾向于阳性，而对非例如对同样一个可疑阳性结果，对病人则易倾向于阳性，而对非病人则易判为阴性，从而导致对新试验评价过高病人则易判为阴性，从而导致对新试验评价过高 ¾¾ 同步评价同步评价诊断性试验方法评价诊断性试验方法评价 ¾¾ 根据试验检查的结果，评价其诊断价值根据试验检查的结果，评价其诊断价值诊断试验的评价指标可靠性的评价可靠性的评价试验方法的真实性评价试验方法的真实性评价真实性评价结果的统计学推断真实性评价结果的统计学推断临床参考值的确定临床参考值的确定可靠性可靠性也称为重复性或精确性，指一项试验在相同条件重也称为重复性或精确性，指一项试验在相同条件重复试验获得相同结果的稳定程度。复试验获得相同结果的稳定程度。 ¾¾ 可靠性评价可靠性评价 4 可靠性的影响因素可靠性的影响因素 99 试验方法和仪器设备以及试验条件试验方法和仪器设备以及试验条件试验方法设计原理、仪器设备试验方法设计原理、仪器设备以及所用试剂的稳定性以及试验条件如温度、湿度等可使检查结以及所用试剂的稳定性以及试验条件如温度、湿度等可使检查结果产生系统误差果产生系统误差 99 研究对象的生物学变异研究对象的生物学变异不同研究对象间由于性别、年龄等因素的不同研究对象间由于性别、年龄等因素的差异，观察结果往往不一定相同；同一个体在不同时间与条件下差异，观察结果往往不一定相同；同一个体在不同时间与条件下的测量结果也存在变异。如一个人一天的测量结果也存在变异。如一个人一天2424小时血压值不完全相小时血压值不完全相同。同。 99 观察者的测量变异观察者的测量变异观察者间变异观察者间变异不同观察者对同一批样品（或样本）进行检查，其不同观察者对同一批样品（或样本）进行检查，其测量结果可能有所差异，这种变异称为观察者间变异；测量结果可能有所差异，这种变异称为观察者间变异；观察者内变异观察者内变异同一观察者在不同时间测量相同的样品，其结果的同一观察者在不同时间测量相同的样品，其结果的差异称为观察者内变异。差异称为观察者内变异。提高可靠性的方法提高可靠性的方法 99 试验方法的标准化试验方法的标准化统一试验条件和观察方法统一试验条件和观察方法,,相同的判断相同的判断标准标准,,观察者的培训观察者的培训 99 研究对象的同质性研究对象的同质性观察时间如饭前或饭后观察时间如饭前或饭后,,是否空腹等以是否空腹等以减少个人体变异减少个人体变异可靠性的测量指标可靠性的测量指标 99 变异系数变异系数((计量数据计量数据)) 99 符合率或一致性符合率或一致性((计数数据计数数据)) 符合率指试验结果与金标准符合率指试验结果与金标准结果一致性（真阳性结果一致性（真阳性++真阴性）的人数占受试者总人数的百真阴性）的人数占受试者总人数的百分率，可以用分率，可以用符合率符合率和和KappaKappa值值来表示来表示 /CV =标准差算术均数符合率即粗一致率符合率即粗一致率调整符合率调整符合率 5 KappaKappa值表示两种试验结果的一致性程度值表示两种试验结果的一致性程度观察一致率观察一致率 kappakappa值的取值范围为值的取值范围为－－l~+1l~+1，该分析考虑了机遇因素对一致性的影响：，该分析考虑了机遇因素对一致性的影响：kappakappa值值＝－＝－11，表明两医生的判断完全不一致；，表明两医生的判断完全不一致；kappakappa值＝值＝00，表不观察一致率完全由机遇，表不观察一致率完全由机遇所致；所致；kappakappa值值>0>0，表示观察的一致程度大于因机遇一致的程度；，表示观察的一致程度大于因机遇一致的程度；kappakappa＝＝11，表明，表明两医生的判断完全一致。两医生的判断完全一致。机遇一致率机遇一致率 KappaKappa值值真实性是指测量值与实际值的符合程度。任何检查结果与金真实性是指测量值与实际值的符合程度。任何检查结果与金标准相比，有四种情况：标准相比，有四种情况：正确结果：正确结果：真正有病的人中试验结果阳性（真阳性真正有病的人中试验结果阳性（真阳性aa））无病的人中试验结果阴性（真阴性无病的人中试验结果阴性（真阴性dd））错误结果：错误结果：真正有病的人中试验结果阴性（假阴性真正有病的人中试验结果阴性（假阴性cc））无病的人中试验结果阳性（假阳性无病的人中试验结果阳性（假阳性bb）） ¾¾ 真实性评价真实性评价真实性测量指标真实性测量指标 99 灵敏度灵敏度 SeSe 99 漏诊率漏诊率 99 特异度特异度 SpSp 99 误诊率误诊率真实性测量指标真实性测量指标 99 似然比似然比 LRLR 99 约登指数约登指数 YIYI 6 评价甲胎蛋白诊断肝癌的价值，以肝穿刺作为金标评价甲胎蛋白诊断肝癌的价值，以肝穿刺作为金标准。试验结果如下表：准。试验结果如下表：实例可靠性指标计算可靠性指标计算实例 %13.80%100 302 37205 =×+=符合率 %24.71%100 66 37 236 205 68 37 234 205 4 1 =×+++= ）（调整符合率 %13.80%100 302 37205 =×+=观察一致率 %47.65302 302 6866 302 236234 =⎥⎦ ⎤⎢⎣ ⎡ ×+×=机遇一致率 42.0 6547.01 6547.08013.0 1 appa =− −=− −= 机遇一致率机遇一致率观察一致率K 真实性指标计算真实性指标计算实例 %61.87%100234205 =×= ）（灵敏度 %39.12%61.8711 =−=−= 灵敏度漏诊率 %41.54%1006837 =×= ）（特异度 %59.45%41.5411 =−=−= 特异度误诊率 92.1 4559.0 8761.0 1 ==−== 特异度灵敏度假阳性率真阳性率阳性似然比 23.0 5441.0 1239.01 ==−== 特异度灵敏度真阴性率假阴性率阴性似然比 4202.015441.08761.01 =−+=−+= 特异度灵敏度约登指数 ROC曲线受试者工作特征曲线（受试者工作特征曲线（receive operator characteristic curvereceive operator characteristic curve））是以灵敏度为纵坐标，假阳性率（是以灵敏度为纵坐标，假阳性率（11－特异度）为横坐标作图所得的曲线－特异度）为横坐标作图所得的曲线该曲线反映灵敏度与特异度之间相互关系的一种方法该曲线反映灵敏度与特异度之间相互关系的一种方法在对两种方法进行比较时，可用在对两种方法进行比较时，可用ROCROC曲线下面积的大小直观比较诊断方曲线下面积的大小直观比较诊断方法好坏。法好坏。ROCROC曲线下面积越大，说明该方法越好曲线下面积越大，说明该方法越好 7 不同诊断水平对灵敏度、特异度的影响同一试验方法的不同诊断标准有不同的灵敏度和特异度。某种指标在病人同一试验方法的不同诊断标准有不同的灵敏度和特异度。某种指标在病人和非病人中的分布在大多数情况下并不是完全分离，例如血糖水平的分布和非病人中的分布在大多数情况下并不是完全分离，例如血糖水平的分布理想和实际情况下正常人和糖尿病病人的血糖分布理想和实际情况下正常人和糖尿病病人的血糖分布理想情况（理想情况（AA曲线）曲线）糖尿病病人和非病人血糖水平的分布如糖尿病病人和非病人血糖水平的分布如AA曲线所曲线所示。在示。在aa→→bb 之间的任一点作为诊断标准，则不会发生漏诊和误诊。之间的任一点作为诊断标准，则不会发生漏诊和误诊。实际情况（实际情况（BB曲线）曲线）糖尿病病人和非病人之间的血糖水平在糖尿病病人和非病人之间的血糖水平在aa――bb间间有重叠，在此范围内，既可能是糖尿病病人，也可能是非病人。有重叠，在此范围内，既可能是糖尿病病人，也可能是非病人。如以如以aa虚线处血糖水平为标准，则灵敏度高，即漏诊少，但是特异度低，虚线处血糖水平为标准，则灵敏度高，即漏诊少，但是特异度低，误诊多。但以误诊多。但以bb虚线处的血糖水平为标准，则刚好相反，即特异度高，误虚线处的血糖水平为标准，则刚好相反，即特异度高，误诊少，而灵敏度低，漏诊多。下表说明不同诊断水平对灵敏度和特异度的诊少，而灵敏度低，漏诊多。下表说明不同诊断水平对灵敏度和特异度的影响，随着血糖诊断水平的提高，灵敏度下降，而特异度不断提高。影响，随着血糖诊断水平的提高，灵敏度下降，而特异度不断提高。因此，就同一诊断试验来说，灵敏度和特异度是矛盾的。要提高因此，就同一诊断试验来说，灵敏度和特异度是矛盾的。要提高试验的灵敏度，必然要损失部分的特异度，反之亦然。试验的灵敏度，必然要损失部分的特异度，反之亦然。 8 诊断试验研究为一个样本研究，所得灵敏度、特异度、诊断试验研究为一个样本研究，所得灵敏度、特异度、 YoudenYouden指数均为样本值，因此存在抽样误差。从样本值来推指数均为样本值，因此存在抽样误差。从样本值来推断总体值，须进行统计推断。不同方法的比较应排除抽样误断总体值，须进行统计推断。不同方法的比较应排除抽样误差，进行统计学检验。这些指标的统计学推断和统计学检验差，进行统计学检验。这些指标的统计学推断和统计学检验方法，见如下两表方法，见如下两表 ¾¾ 真实性评价结果的统计学推断真实性评价结果的统计学推断应用血清铁蛋白（应用血清铁蛋白（SFSF）和血清原卜啉（）和血清原卜啉（ZPPZPP）试验法进行铁缺乏）试验法进行铁缺乏症的临床诊断。以骨髓涂片铁染色检查作为诊断缺铁的金标准，症的临床诊断。以骨髓涂片铁染色检查作为诊断缺铁的金标准，确诊为缺铁性贫血确诊为缺铁性贫血5050例，非缺铁性贫血例，非缺铁性贫血7878例。结果如下表，试比例。结果如下表，试比较两试验的约登指数的优劣较两试验的约登指数的优劣实例 9 实例 SFSF法法灵敏度灵敏度=(47=(47／／50)50)××100%=94%100%=94% 特异度特异度=(75=(75／／78)78)××100%=96%100%=96% 约登指数约登指数=0.94+0.96=0.94+0.96－－1=0.901=0.90 实例 ZPPZPP法法灵敏度灵敏度=(28=(28／／50)50)××100%=56%100%=56% 特异度特异度=(68=(68／／78)78)××100%=87%100%=87% 约登指数约登指数=0.56+0.87=0.56+0.87－－1=0.431=0.43 仅从约登指数看，仅从约登指数看，SFSF法要高于法要高于ZPPZPP法。但这是两个样本值的差法。但这是两个样本值的差别，是由于两方法的总体约登指数不同，还是由于抽样误差所引别，是由于两方法的总体约登指数不同，还是由于抽样误差所引起？需进行假设检验。起？需进行假设检验。 HH00：：SFSF法的总体约登指数与法的总体约登指数与ZPPZPP法相同法相同 αα==0.050.05，，并根据公式计算如下：并根据公式计算如下： SFSF法的约登指数方差法的约登指数方差同理，同理，ZPPZPP法的方差法的方差实例查查zz 临界值表，临界值表，zz00.05.05=1.96=1.96，，zz＞＞zz0.050.05，，PP＜＜0.050.05，，按按αα＝＝0.050.05水准拒绝水准拒绝 HH00，即，即SFSF法与法与ZPPZPP法总体法总体YoudenYouden指数不同，指数不同，SFSF法较优。法较优。实例 10 参考值（参考值（reference valuereference value）是指正常人体在解剖、生理、生化）是指正常人体在解剖、生理、生化上的正常水平以及人体对各种试验的正常反应值。这里的正上的正常水平以及人体对各种试验的正常反应值。这里的正常人是指没有得所检查疾病的人。确定参考值的方法有很常人是指没有得所检查疾病的人。确定参考值的方法有很多，主要有以下几种。多，主要有以下几种。 ¾¾ 临床参考值的确定临床参考值的确定统计学方法统计学方法 99 灵敏度灵敏度 SeSe 99 漏诊率漏诊率 99 特异度特异度 SpSp 99 误诊率误诊率统计学方法统计学方法以一定样本量的正常人为研究对象，测定某项生理、生化指标，制以一定样本量的正常人为研究对象，测定某项生理、生化指标，制定频数分布表。若此分布符合或基本符合正态分布，则可按正态分布规定频数分布表。若此分布符合或基本符合正态分布，则可按正态分布规律确定参考值范围。（律确定参考值范围。（11－－αα））××100%100%参考值范围：参考值范围：为均数，为均数，SS为标准差，为标准差，zzαα为发生第一类错误为发生第一类错误αα的的zz临界限值。若参考值范围采用临界限值。若参考值范围采用双侧，取双侧，取zzαα值；若取单侧，则取值；若取单侧，则取zz22αα值。值。 SUx α± x 统计学方法统计学方法 99 若频数分布表呈明显偏态分布，则可用百分位数法确定参考值若频数分布表呈明显偏态分布，则可用百分位数法确定参考值范围。双侧时，（范围。双侧时，（11－－αα））××100%100%参考值范围为：参考值范围为：PPαα/2/2~P~P11--αα/2/2 99 若取单侧，大于某限值为异常，则（若取单侧，大于某限值为异常，则（11－－αα））××100%100%参考值范围参考值范围为：为：0~P0~P11--αα 99 若取单侧，小于某限值为异常，则（１－若取单侧，小于某限值为异常，则（１－αα））××100%100%参考值范参考值范围为：围为：＞＞PPαα 式中式中PPαα为第为第αα百分位数百分位数 SUx α± x 11 危险度决定法（临床界限）危险度决定法（临床界限） 99 按疾病各种危险因素的危险度决定参考值范围。由于一项指标（如血按疾病各种危险因素的危险度决定参考值范围。由于一项指标（如血清胆固醇水平）虽然在参考值范围内，但对于发生某种疾病的危险性清胆固醇水平）虽然在参考值范围内，但对于发生某种疾病的危险性仍有较大差别。因此可从仍有较大差别。因此可从预防预防角度，用危险度决定法确定参考值范围角度，用危险度决定法确定参考值范围 99 如根据调查发现，尿酸在如根据调查发现，尿酸在7mg/dl7mg/dl或以下不会发生痛风，超过这一数值或以下不会发生痛风，超过这一数值发生痛风的危险性上升，如超过发生痛风的危险性上升，如超过9.0mg/dl9.0mg/dl，，则无一幸免。因此最有意则无一幸免。因此最有意义的界限值应为义的界限值应为8.0~9.0mg/dl8.0~9.0mg/dl（（相当于相当于99%99%位数）位数） 99 危险度决定法在足够样本量的前瞻性队列研究基础上，能够较确切地危险度决定法在足够样本量的前瞻性队列研究基础上，能够较确切地反映该地区人群某种指标的参考值范围。反映该地区人群某种指标的参考值范围。预后界限预后界限 99 有些在统计学上或临床上都认为是正常值，但预后发现也有危险性有些在统计学上或临床上都认为是正常值，但预后发现也有危险性 99 如如5050岁男性收缩压岁男性收缩压150mmHg150mmHg是常见的，无临床症状不能认为是病是常见的，无临床症状不能认为是病人。但这种人出现冠心病发作的危险性比同龄低血压者约高人。但这种人出现冠心病发作的危险性比同龄低血压者约高22倍左右倍左右 99 从预后角度出发，从预后角度出发，5050岁男性正常血压值可能比岁男性正常血压值可能比150mmHg150mmHg还要低。但还要低。但该法由于病人反应性不同，较难得到一个统一的标准。该法由于病人反应性不同，较难得到一个统一的标准。实用界限实用界限根据研究的需要，人为地规定根据研究的需要，人为地规定““病例病例””和和““非病例非病例””或正或正常与异常的截断值。以灵敏度最大，特异度最高，约登指常与异常的截断值。以灵敏度最大，特异度最高，约登指数最大为理想。但是实际上对于同一试验方法，灵敏度和数最大为理想。但是实际上对于同一试验方法，灵敏度和特异度是相矛盾的。在实际工作中应综合考虑灵敏度、特特异度是相矛盾的。在实际工作中应综合考虑灵敏度、特异度对研究目的的重要程度来确定正常与异常的截断值，异度对研究目的的重要程度来确定正常与异常的截断值，或以约登指数最大时为截断值。或以约登指数最大时为截断值。确定诊断标准原则确定诊断标准原则 99 对于一些严重疾病，如果能及早诊断，治疗效果就好，否则后果对于一些严重疾病，如果能及早诊断，治疗效果就好，否则后果严重。在这种情况下，诊断标准应稍低，以提高试验的灵敏度，严重。在这种情况下，诊断标准应稍低，以提高试验的灵敏度，使病人能够尽可能地诊断出来，减少遗漏使病人能够尽可能地诊断出来，减少遗漏 99 对于疗效不理想，确诊和治疗费用较贵或假阳性结果会导致患者对于疗效不理想，确诊和治疗费用较贵或假阳性结果会导致患者精神和肉体上的痛苦或危害，如肿瘤病人实施放疗或化疗、精神和肉体上的痛苦或危害，如肿瘤病人实施放疗或化疗、 HBsAgHBsAg的筛查。此时可使诊断标准提高，以提高试验的特异度。的筛查。此时可使诊断标准提高，以提高试验的特异度。 99 当漏诊和误诊的重要性相等时，诊断标准可定在约登指数最大当漏诊和误诊的重要性相等时，诊断标准可定在约登指数最大处。处。 12 预测值在已知试验结果（阳性或阴性）的条件下，有无疾病的概率称为在已知试验结果（阳性或阴性）的条件下，有无疾病的概率称为试验的预测值试验的预测值阳性预测值阳性预测值是指试验阳性者患目标疾病的可能性是指试验阳性者患目标疾病的可能性阴性预测值阴性预测值是指试验阴性者患目标疾病的可能性是指试验阴性者患目标疾病的可能性 %100%100 ×+=×= ba a 试验结果阳性人数真阳性阳性预测值 %100%100 ×+=×= dc c 试验结果阴性人数真阴性阴性预测值影响因素影响因素 99 敏感度和特异度敏感度和特异度阳性预测值与灵敏度成正比；阴性预测值与阳性预测值与灵敏度成正比；阴性预测值与特异度成正比特异度成正比 99 患病率患病率患病率越低，试验阳性预测值越低，阴性预测值越患病率越低，试验阳性预测值越低，阴性预测值越高；患病率越高，阳性预测值越高，阴性预测值越低高；患病率越高，阳性预测值越高，阴性预测值越低下表显示，在患病率为下表显示，在患病率为2%2%时，当特异度为时，当特异度为95%95%时，灵敏度由时，灵敏度由50%50%升至升至99%99%，，阳性预测值由阳性预测值由17%17%升高到升高到28.8%28.8%；当灵敏度为；当灵敏度为95%95%时，特异度由时，特异度由50%50%升至升至 99%99%，阳性预测值由，阳性预测值由3.7%3.7%升高到升高到66%66%。即在患病率固定不变的条件下，特异。即在患病率固定不变的条件下，特异度的改变对阳性预测值的影响比灵敏度改变更大。度的改变对阳性预测值的影响比灵敏度改变更大。实例患病率对预测值的影响更大。受试人群的患病率越低，试验阳性预测值越患病率对预测值的影响更大。受试人群的患病率越低，试验阳性预测值越低，阴性预测值越高；反之，患病率越高，阳性预测值越高，阴性预测值越低，阴性预测值越高；反之，患病率越高，阳性预测值越高，阴性预测值越低。例如有一试验方法，特异度为低。例如有一试验方法，特异度为95%95%，灵敏度，灵敏度99%99%，分别对患病率，分别对患病率1%1%、、 2%2%和和10%10%的人群进行检查，人群的阳性预测值分别为的人群进行检查，人群的阳性预测值分别为1717％、％、2929％和％和68.868.8％％（见下表）。阳性预测值与被检人群的预期患病率呈正相关。（见下表）。阳性预测值与被检人群的预期患病率呈正相关。实例 13 阳性、阴性预测值与灵敏度、特异度及患病率的关系为阳性、阴性预测值与灵敏度、特异度及患病率的关系为阳性预测值阳性预测值 ==灵敏度灵敏度××患病率患病率/[/[灵敏度灵敏度××患病率患病率+(1+(1--患病率患病率) (1) (1--特异度特异度)])] 阴性预测值阴性预测值 ==特异度特异度(1(1－患病率－患病率)/[)/[特异度特异度(1(1－患病率－患病率)+(1)+(1--灵敏度灵敏度))患病率患病率]] 酸性磷酸酶试验诊断前列腺癌的灵敏度为酸性磷酸酶试验诊断前列腺癌的灵敏度为7070％，特异度为％，特异度为9090％，若用于不％，若用于不同患病率人群进行检查，阳性预测值差别很大。在对一般人群检查时，同患病率人群进行检查，阳性预测值差别很大。在对一般人群检查时，阳性预测值只有阳性预测值只有0.40.4％，但对临床触及前列腺结节者进行检查，阳性预测％，但对临床触及前列腺结节者进行检查，阳性预测值可达到值可达到93.093.0％，有非常高的诊断价值，见下表。％，有非常高的诊断价值，见下表。实例提高试验效率的方法选择合适的方法和指标选择合适的方法和指标选择患病率高的人群（高危人群）选择患病率高的人群（高危人群）采用联合试验采用联合试验选择合适的方法和指标选择合适的方法和指标尽量选择客观的指标，对指标的测量方法和条件应进行采用标准化，尽量选择客观的指标，对指标的测量方法和条件应进行采用标准化，对计量数据应选择恰当的截值点。如有多个指标可供选择时，应根据对计量数据应选择恰当的截值点。如有多个指标可供选择时，应根据灵敏度、特异度大小来决定。灵敏度、特异度大小来决定。 14 选择患病率较高的人群进行检查（高危人群筛检策略）选择患病率较高的人群进行检查（高危人群筛检策略） 99 设立专科门诊设立专科门诊专科门诊的设立，使患有同类疾病的病人集中就诊专科门诊的设立，使患有同类疾病的病人集中就诊于相应的科室。这样各专科门诊就诊人群的患病率就相对提高了。此于相应的科室。这样各专科门诊就诊人群的患病率就相对提高了。此外通过各级医院逐级转诊病人，也可使其患病率提高。外通过各级医院逐级转诊病人，也可使其患病率提高。 99 选择高危人群选择高危人群如有冠心病家族史，年龄大于如有冠心病家族史，年龄大于4545岁，肥胖者去检查冠岁，肥胖者去检查冠心病，则这些人群患病率必然比一般人群高。心病，则这些人群患病率必然比一般人群高。 99 选择有特殊临床表现的人群选择有特殊临床表现的人群特殊的临床症状、体症、病史特点的选特殊的临床症状、体症、病史特点的选择，必然会影响试验人群的患病率。例如有胸膜炎的女性，同时有小择，必然会影响试验人群的患病率。例如有胸膜炎的女性，同时有小腿肿痛，并有口服避孕药史，其患肺栓塞的可能性比没有上述特点的腿肿痛，并有口服避孕药史，其患肺栓塞的可能性比没有上述特点的妇女要高得多。妇女要高得多。联合试验联合试验一种方法的灵敏度或特异度不能满足要求时。在这种情况下可以一种方法的灵敏度或特异度不能满足要求时。在这种情况下可以采用联合试验，以提高试验方法的灵敏度或特异度。联合试验方式采用联合试验，以提高试验方法的灵敏度或特异度。联合试验方式用两种方式：串联（系列）试验和并联（平行）试验。用两种方式：串联（系列）试验和并联（平行）试验。 99 串联串联用两种以上试验，只有全部结果阳性才定为阳性。可提高用两种以上试验，只有全部结果阳性才定为阳性。可提高特异度特异度 99 并联并联同时进行多项试验，只要一项阳性就可定为阳性。可提高同时进行多项试验，只要一项阳性就可定为阳性。可提高灵敏度灵敏度尿糖和血糖试验用不同的联合方式对灵敏度和特异度的影响实例 15 疾病筛检通过快速的检验、检查或其它措施，将可能有病但表面上通过快速的检验、检查或其它措施，将可能有病但表面上健健康的人，同可能无病的人区别开来。筛检试验不同于疾病诊断，康的人，同可能无病的人区别开来。筛检试验不同于疾病诊断，主要用于社区人群的健康体检、普查普治或某些特殊意义的研主要用于社区人群的健康体检、普查普治或某些特殊意义的研究。究。筛检试验流程示意图筛检试验流程示意图筛检的策略（原则）筛检的策略（原则） 99 所要筛检的疾病应该是所在地重大的公共卫生问题，且经有效治疗所要筛检的疾病应该是所在地重大的公共卫生问题，且经有效治疗后能恢复健康，能有效延长寿命；后能恢复健康，能有效延长寿命； 99 该病具有简便、快速、经济、有效，而且易被群众所接受的的检测该病具有简便、快速、经济、有效，而且易被群众所接受的的检测方法；方法； 99 对筛检阳性的人群，应有进一步确诊的方法、有效的治疗和足够的对筛检阳性的人群，应有进一步确诊的方法、有效的治疗和足够的领先时间；领先时间； 99 该疾病的自然史明确。明确疾病的自然史，才能对筛检的效益进行该疾病的自然史明确。明确疾病的自然史，才能对筛检的效益进行评估；评估； 99 应考虑整个筛检、诊断、治疗的成本与收益的问题；应考虑整个筛检、诊断、治疗的成本与收益的问题； 99 疾病的筛检是一项连续过程，应进行定期检查。疾病的筛检是一项连续过程，应进行定期检查。筛检中的偏倚筛检中的偏倚 99 领先时间偏倚领先时间偏倚领先时间领先时间：从筛检发现到临床诊断发现所赢得的时间；：从筛检发现到临床诊断发现所赢得的时间；领领先时间偏倚先时间偏倚：筛检诊断时间和临床诊断时间之差被解释成为因筛检延长的：筛检诊断时间和临床诊断时间之差被解释成为因筛检延长的生存时间。生存时间。 99 病程长短偏倚病程长短偏倚一些恶性程度低的癌症病人常有较长的临床前期，而恶性一些恶性程度低的癌症病人常有较长的临床前期，而恶性程度高的同类癌症病人的临床前期较短，因此前者被筛检到的机会较大，程度高的同类癌症病人的临床前期较短，因此前者被筛检到的机会较大，而前者的生存期又比较长，从而产生一种筛检者比未筛检者生存时间长的而前者的生存期又比较长，从而产生一种筛检者比未筛检者生存时间长的假象。假象。 99 病人自我选择偏倚病人自我选择偏倚筛检参加者与不参加者之间，某些与生活有关的特征筛检参加者与不参加者之间，某些与生活有关的特征可能不同，如参加者可能因为文化水平、卫生保健知识水平较高，平时比可能不同，如参加者可能因为文化水平、卫生保健知识水平较高，平时比较关注健康，对吸烟饮酒等不良生活习惯较为注意，对身体出现的异常症较关注健康，对吸烟饮酒等不良生活习惯较为注意，对身体出现的异常症状较为警惕，有较好的依从性，这些都会对今后的生存率产生影响，从而状较为警惕，有较好的依从性，这些都会对今后的生存率产生影响，从而引起偏倚。引起偏倚。 Thanks for your attention！

                    本文档为【诊断试验方法的评价】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

诊断试验方法的评价

你可能还喜欢