首页 颜虹的医学统计学案例选

颜虹的医学统计学案例选

颜虹的医学统计学案例选医学统计学案例选第一章绪论部分案例1-1 着手撰写一份研究计划书，你所选的研究课题应该关系到人类健康。简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料，如何获得和分析资料，用什么方法表达与展示结果等，请保留你的这份作业，并在学习完本书后再重新翻阅。你发现了什么问题，应如何修改？你的收获是什么？第二章实验设计部分案例2-1 《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》（河南中医2004年第24卷第8期第62页）欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效，以某西药作为对...

医学统计学案例选第一章绪论部分案例1-1 着手撰写一份研究计划书，你所选的研究课题应该关系到人类健康。简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料，如何获得和分析资料，用什么方法表达与展示结果等，请保留你的这份作业，并在学习完本书后再重新翻阅。你发现了什么问题，应如何修改？你的收获是什么？第二章实验设计部分案例2-1 《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》（河南中医2004年第24卷第8期第62页）欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效，以某西药作为对照组。将64例符合纳入标准的病例按诊疗次序交替分组，即单号为中药组，双号为西药组。请讨论该分组方法是否随机？案例2-2 《单宫颈双子宫畸形28例人工流产分析》（中国实用妇科与产科杂志1999年3月第15卷第3期172页）通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果，发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全，减少病人痛苦并且可避免并发症的发生。而文中两组的分组方法为：所有病例按就诊先后顺序分组，1995年10月以后的为A组，1995年10月以前的为B组。A组（米索组）于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg，然后进行人工流产吸宫术，共14例；B组（对照字）单纯采用常规流产术机械扩张宫颈后吸宫。作者认为该法“符合随机分配法则”。请讨论对照组的设置是否合适？案例2-3 《用24小时食管pH监测法诊断食管原性胸痛》（中华外科杂志1995年33卷第2期第69页）一文中，作者对30例疑为食管原性胸痛患者的24小时食管pH监测，其中16例昼夜均异常，8例白天异常，2例夜里异常，18例胸痛与酸暴露有关。得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论，请讨论该文结果是否成立？案例2-4 《强骨胶囊治疗原发性骨质疏松症的临床试验》（中药新药与临床药理，2004年15卷第4期284页）目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。原文共收集骨质疏松症患者307例，其中试验组612例使用强骨胶囊，对照组93例使用骨松宝颗粒，其余开放组52例。但对开放组患者的特征、所用药物、用药方法、观察方法、是否设盲等没有交代。请讨论3组之间有无可比性？小结 1、一项研究设计的内容包括：提出假说，确定研究类型，确定研究对象的范围和数量，计划的实施与质量控制，数据管理，统计分析，结果与讨论。 2、实验设计包括3个基本要素：处理因素、实验对象和实验效应。 3、实验设计必须遵循：对照、随机、重复的基本原则。研究中所设立的对照组应尽可能达到对等、同步、专设的条件；随机包括3方面的内容，及随机抽样、随机分组和随机实验顺序；重复是指研究结果的重复、观察对象的重复和观察指标的重复。思考与练习简答题 1、研究设计的作用是什么？ 2、研究设计的基本内容是什么？ 3、实验设计应该遵循的基本原则是什么？ 4、实验设计为什么要设立对照？设立对照要注意些什么？ 5、随机化的含义是什么？目的是什么？ 6、区组化的目的是什么？第三章观察性研究设计概述案例3-1 某地（100万人口）拟开展当地中老年人非胰岛素依赖型糖尿病的现况调查，目的是了解当地糖尿病的流行状况，以及与糖尿病患病相关的危险因素。调查对象是当地居住超过5年、40岁以上的常住居民。该研究采取分层、整群随机的抽样方法，将该地区15个镇按城镇或乡村，经济发展水平分成3个层，每层随机抽取2个镇或街道，再从被抽中的镇或街道中随机抽取两个村或居委。被抽中村或居委的全部40岁以上居民包括原糖尿病患者均参加调查。调查结果男女两性比例为0.94:1，并划分为5个年龄组，性别和各年龄组构成比与当地人口性别和年龄的分布情况相符。调查内容包括：①问卷调查：被调查者的一般情况、糖尿病及其他病史、家族史、糖尿病临床表现、饮食调查、吸烟、饮酒情况及体力活动等；②体格检查：包括身高、体重、腰围、臀围及血压等；③血糖测定。 ⑴ 该研究采用的是全面调查还是抽样调查？各有何优缺点？ ⑵ 该研究采用的抽样方法有何优点？是否有更好的抽样方法？ ⑶ 该研究的设计方案是否合理？请你设计一个研究的方案。 ⑷ 该研究采用的调查表应该包括哪些项目？请你设计该调查表。小结 1、观察性研究是有目的地观察或测量自然接触不同因素人群的结果事件发生状况，通过对比分析发现事件的分布特点与差异，从而获得有关因果假设的启示，为进一步研究提供线索。 2、观察性研究包括描述性研究和分析性研究两大类。 3、横断面研究是按照事先制定的计划，调查特定人群特定时点某种疾病的患病情况，以及与患病有关的因素。横断面研究的设计要考虑研究目的、对象、调查方法、调查表设计、样本量、组织计划、质量控制和分析计划等。 4、问卷是调查研究中用来收集资料的一种工具，它的形式是一份精心设计好的问题表格，它的用途在于测量人们的行为、态度和特征。问卷设计的好坏是保证调查质量的关键，本章介绍问卷设计的基本原则和步骤。 5、随机抽样是抽样调查中样本具有代表性和能进行总体参数估计的保证，常用的抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。简答题 1、观察性研究与实验性研究有何异同？二者能否同时使用或结合使用？ 2、观察性研究主要有哪些方法？各有何优缺点？ 3、为什么大多数的观察性研究是抽样调查研究？ 4、根据对全国出生缺陷监测资料的统计分析，发现神经管缺陷的发生具有明显的季节性，表现为1～3月份出生的孩子的发生率比较高。今欲调查其原因，应采取什么调查方法？请做出完整的调查设计并制定出调查表。 5、欲了解某市乙型病毒性肝炎患病情况及其影响因素，请做一个调查设计。 6、现拟在大学生中进行一项吸烟习惯调查，请你考虑调查问卷应包括哪些项目，并设计出调查问卷。第四章统计描述案例4-1 表4-24是某研究者在一项回顾性调查中收集的部分资料，其目的是研究抗生素的使用效果。表4-24 某医院内、外科25例住院病人使用抗生素的情况病人编号性别年龄(岁) 入院体温(℃) 入院时白细胞计数(×103) 抗生素使用细菌培养所在科室住院时间 1 2 30 37.2 8 2 2 1 5 2 2 73 36.7 5 2 1 1 10 3 2 40 37.2 12 2 2 2 6 4 2 47 36.8 4 2 2 2 11 5 2 25 36.9 11 2 2 2 5 6 1 82 36.0 6 1 2 2 14 7 1 60 37.5 8 1 1 1 30 8 2 56 37.0 7 2 2 1 11 9 2 43 36.7 7 2 2 1 17 10 1 50 36.7 12 2 1 2 3 11 2 59 36.4 7 2 1 1 9 12 1 4 36.6 3 2 2 2 3 13 2 22 37.5 11 1 2 2 8 14 2 33 36.9 14 1 1 2 8 15 2 20 36.9 11 2 1 2 5 16 1 32 37.2 9 2 2 2 5 17 1 36 37.3 6 1 2 2 7 18 1 69 36.7 6 2 2 2 4 19 1 47 36.1 5 1 2 1 3 20 1 22 36.8 6 2 2 2 7 21 1 11 36.8 10 2 2 2 9 22 2 19 37.0 14 1 2 2 11 23 2 67 36.4 4 2 2 1 11 24 2 43 37.0 5 2 2 2 9 25 2 41 36.7 5 2 2 1 4 注：性别：1=男，2=女；抗生素使用：1=是，2=否；细菌培养：1=是，2=否；所在科室：1=内科，2=外科。试分析： ⑴ 构造性别的频数分布表，并绘制性别的频数分布条图； ⑵ 以20岁为组距，构造年龄的频数分布表，并绘制年龄的频数分布直方图； ⑶ 以5天为组距，构造住院时间的频数分布表，并绘制住院时间的频数分布直方图，观察其分布特征； ⑷ 计算住院时间的算术均数、几何均数、中位数； ⑸ 计算住院时间的最大值、最小值、四分位数与四分位数间距； ⑹ 计算住院时间的全距、方差、标准差和变异系数； ⑺ 构造内、外科使用抗生素情况的统计表、条图和圆图； ⑻ 构造内、外科采用细菌培养情况的统计表、条图和圆图； ⑼ 构造内、外科使用抗生素和采用细菌培养情况的统计表、条图和圆图； ⑽ 绘制箱图，比较用与不用抗生素的住院患者住院天数的差异； ⑾ 以住院天数为纵坐标，以年龄为横坐标，绘制散点图；小结 1、计量资料的统计描述，主要了解数据的分布范围、集中位置以及分布形态等特征。大样本数据，需要编制频数分布表，通过频数分布表观察数据的分布特征。 2、频数分布表的主要作用是揭示资料的分布特征；描述其集中趋势和离散趋势，有助于发现数据中远离数据群体的离群值。 3、数据的分布形状分为对称分布与偏态分布。偏态又分为右偏态和左偏态。 4、描述计量资料集中趋势的平均指标有：算术均数、几何均数、中位数等。算术均数适合于对称分布资料，几何均数、中位数等。算术均数适合于对称分布资料，几何均数适用于2右偏态和呈现比例递增的资料，中位数适合于任意分布的资料。 5、描述计量资料离散趋势的变异指标有：全距、方差、标准差和变异系数、四分位数间距等。其中标准差是最常用的变异指标，适合于对称资料特别是正态分布资料；四分位数间距适合任意分布资料，尤其适合于大样本偏态分布资料。变异系数主要用于比较几个量纲不同的变量之间的离散程度的差异，也可以用来比较量纲相同但均数相差悬殊的几个变量之间离散程度的差异。 6、描述计数资料基本特征的指标有：比、比例和率。比可以是任意两个数值之比，包括比和比率。当分子是分母的一部分时，称为比例；当比例与观察时限有关时，称为率。比例又分为构成比和频率。而率与时间单位有关，即率有速率和强度的含义，它表示单位时间某事件发生的可能性大小。流行病学研究中常用的两个比是相对危险度和优势比（比数比）。 7、内部构成不同的两个率比较时，应计算标准化率。 8、动态数列用来描述一组按照时间顺序排列起来的统计指标，如绝对数、相对数、平均数等，在时间的变化和发展趋势。 9、医学常用统计指标有：人口统计指标、出生与死亡统计指标、生育统计指标、疾病统计指标、期望寿命等。 10、表达统计结果的数表称为统计表。统计表由标题、标目、线条、数字4部分组成，必要时增加注释。 11、常用统计图有：条图、百分条图、园图、线图、半对数线图、箱图、散点图等，这些统计图所适用的数据类型，绘图目的和有关说明列在表4-25中。第五章概率分布案例5-1 一般人群先天性心脏病的发病率为8‰，某研究者为探讨母亲吸烟是否会增大其子女的先天性心脏病发病的危险，对一群20～35岁有吸烟嗜好的孕妇进行了生育考察，在他们生育的320名子女中，经筛查有4人患先天性心脏病。试讨论： ⑴ 若以X表示观察中患先天性心脏病的小孩数，X的分布是什么分布？ ⑵ 若按人群先天性心脏病的发病率为8‰，计算320名子女中，至少有4名小孩患先天性心脏病的概率。 ⑶ 这一研究过程是否有可改进的地方？案例5-2 根据对青少年生长发育大样本的调查资料，计算得7岁男童的身高均数 =119.95cm，标准差=4.72，按身高范围统计结果见表5-4. 表5-4 青少年生长发育调查资料统计结果身高范围(cm) 实际人数百分比身高范围(cm) 实际人数百分比 115.32～124.56 81 67.5 111.47～130.14 113 94.17 106.49～133.87 118 98.33 （1）试计算所给身高范围的理论人数和百分比。（2）实际人数和理论人数（百分数）有何不同与联系。小结 1、随机事件、概率与随机变量是研究随机现象的基本概念。通过随机变量可用数学手段对随机现象进行更深入的研究，随机变量分为两类，一类是连续型随机变量，另一类是离散型随机变量。 2、二项分布和Poisson分布是离散型随机变量最为常见的分布类型。在医疗卫生领域，若研究结果只可能是两个对立结果中的一个，例如阳性、阴性，这样的观察独立、重复n次出现阳性的次数X服从二项分布。X取值为0，1，2，…，n，X=k的概率按下式计算：其中π为每次试验出现阳性的概率，且。 Poisson分布主要用于描述在单位时间、面积、空间上某事件的发生数。医学和卫生领域中有些指标例如：单位时间接收到放射性物质的放射线数、某单位容积中的细菌数、野外单位空间的某种昆虫数等。服从Poisson分布随机变量X取值为非负整数0，1，…，其相应概率为当n大，π小时，二项分布近似Poisson分布。此时计算而项分布概率的工作量很大，可用Poisson分布公式作近似计算。 3、正态分布是连续随机变量最重要的而基本的分布。其重要性体现在：（1）正态分布具有优良的性质和规律。（2）在解决实际问题时，许多研究指标服从（或近似服从）正态分布。（3）理论上，正态分布是许多统计方法的理论基础，一方面许多统计方法是在正态分布的基础上建立起来的；另一方面许多统计方法在一定条件下，有正态近似的方法。 4、随机现象的规律只有在大量重复观察的情况下才能够出现，对随机现象的研究答多是采用抽样研究的方法。3个基于正态分布的抽样分布入分布、t分布、F分布是统计推断的基础，具有重要的理论价值。第六章参数估计案例6-1 某地随机抽样调查了部分健康成人的血红蛋白含量（g/L），结果见表6-16. 性别例数均数标准差标准值男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 *《实用内科学》（1976年）所载均数（转为法定单位）（1）有人认为该地男女性血红蛋白含量均低于上表的标准值（若测定方法相同）且男性血红蛋白含量低于女性，你是否同意该结论？（2）如何估计男女性血红蛋白含量的总体均数和参考值范围，两者有何区别？小结 1、抽样分布是通过大量重复抽样和计算各样本统计量并作样本统计量的频数分布图来揭示样本统计量的分布规律。从同一总体反复抽取若干样本，各样本统计量之间及与总体参数之间存在差异，此差异称为抽样误差。由于总体中个体变异的客观存在，抽样误差不可避免。 2、标准误是反映抽样误差大小的指标。均数标准误的理论值是 ,样本估计值为；率的标准误理论值为，样本估计值为。注意均数标准误与原变量的标准差之间的区别，不能混淆其含义。 3、参数估计是指用样本统计量推断总体参数。有点估计和区间估计两种方法。第七章假设检验案例7-1 某医院检验科测定了30-40岁不同职业、不同性别人群的血清甘油三脂含量（见表7-2）。试分析比较工人和干部，男女的该项血脂水平有无差异？表7-2 正常成人按不同职业、性别分类的血清甘油三脂含量人数均数标准差工人 112 1.20 0.33 干部 106 1.08 0.30 男 116 1.17 0.32 女 102 1.11 0.32 试分析： 1、用什么方法比较工人和干部、男和女血清甘油三脂含量的差异？ 2、血清甘油三脂含量是常用的高血脂症筛查指标，血清甘油三脂含量升高常见于动脉粥样硬化、糖尿病、脂肪肝等的病人，男略高于女，参考值范围分别是男：0.45-1.81mmol/L、女：0.40-1.53 mmol/L。如何解释男女血清甘油三脂的差异？ 3、如果工人组血清甘油三脂高于干部组，并且有统计学差异，能否说工人职业导致该人群血清甘油三脂的升高？推论因果关联？ 4、本研究工人组的血清甘油三脂平均高于干部组0.12mmol/L，是否有实际意义？ 5、本研究工人组的血清甘油三脂高于干部组，男女血清甘油三脂未见有统计学差异，是否是混杂因素影响？在比较均数之间差别时，如何根据现有资料分组计算均数，最大限度地减少性别对工人组和干部组血清甘油三脂的影响？小结 1、假设检验采用的是反证法思想，根据“小概率事件在一次试验中不可能发生”原理，用一次试验（观察）结果发生的概率决定是否拒绝原假设。假设检验的常用方法有u、t、F、χ2检验与秩和检验。 2、假设检验的三个步骤：①建立检验假设：H0、H1 ，确定检验水准α。②计算检验统计量；③确定P值并作出推断结论。 3、已知总体方差并且样本量比较大时，推断样本所代表的未知总体均数μ与已知总体均数μ0是否有差别，可采用Z检验。已知总体方差并且两组的样本量n1和 n2比较大时，用推断两总体均数之差是否为零，可采用两均数比较的Z检验。 4、大样本率的Z检验，要求n比较大，对统计量要求可简单概括为：① 如果样本率p介于0.1-0.9之间，每组例数大于60例；② 如果样本率p介于0.1-0.9之外，np或n(1-p)的最小值大于5。 5、假设检验的两类错误：当H0为真时，由于抽样的偶然性而得到P≤α的检验结果，假设检验结论拒绝H0，接受了H1，称为第一类错误或Ⅰ类错误，犯一类错误的概率记为α。当真实情况不成立而H1成立时，得到P＞α的检验结果，拒绝H1，接受了H0。这类错误称为第二类错误或Ⅱ类错误，其概率大小用β表示。 6、单侧检验与双侧检验：单侧检验不仅关心差别，同时关心差别的方向，备择假设为H1：μ1＜μ2或H1：μ1＞μ2。双侧检验只关心差别，不关心差别的方向，备择假设为H1：μ1≠μ2。两个均数或两个率的比较一般用双侧检验。采用单侧检验应该在研究设计阶段作出规定，不应当在计算出统计量后再主观决定。 7、假设检验在拒绝H0的时候可以下“有差别”的结论，在不拒绝H0的时候不能下“无差别”的结论。假设检验的的P值大小只能够说明统计学意义的“显著”，不一定有实际意义。对假设检验结果的实际意义或临床意义的判定，一定要结合专业知识。 8、检验效能1－β表示H1为真，假设检验结果拒绝H0，接受H1的概率。检验效能越高，通过样本发现总体差别的把握越大。影响检验效能的4个因素分别是总体参数的差异|δ|、个体差异的总体标准差σ，样本量n和检验水准α。 9、在同一个研究中多次重复检验，即使总体参数没有差别，重复检验100次，平均有5次是假阳性错误，或重复检验20次，平均有一次是假阳性错误。因此，在试验设计时就应该确定主要分析指标，不能事后通过大量重复检验寻找阳性指标。 10、要使假设检验的P值成为因果联系的证据，前提是要求研究设计符合“重复、对照、随机化”的3个实验设计基本原则，并且是前瞻性的研究，即试验对象随机分组后再施加干预。第九章多个样本均数比较的方差分析案例9-1 某篇论文，研究4组病人某基因表达率的差异，结果见表9-16。表9-16 4组病人某基因的表达率比较组别 n t P 喉癌 19 23.0±8.7 5.38 ＜0.01 喉息肉 18 16.0±10.2 6.24 ＜0.01 转移癌 15 9.0±4.7 2.20 ＞0.05 对照组 22 7.0±5.0 问：（1）该资料分析是否恰当？理由是哪几方面？（2）若该资料交给你统计分析，你的分析计划怎样？案例9-2 某医生A，B，C3种营养素喂养小白鼠，用6窝小白鼠，每窝3只，随机安排喂养这3种营养素中的一种；6周后观察小白鼠增加体重情况(g)，得表9-17的资料：表9-17 3种营养素喂养小白鼠所增加体重窝别 A B C 均数 1 50 57 69 58.7 2 48 59 66 57.5 3 55 61 67 61.0 4 66 54 76 65.2 5 76 81 83 80.1 6 37 46 68 50.2 7 63 50 54 55.7 8 45 43 48 45.3 均数 55.1 56.2 66.4 59.2 经过随机区组设计的方差分析得3种营养素间的F=6.319，P=0.011；窝别的F=6.670，P=0.001。认为营养素及窝别间两个因素均可影响增加体重，但营养素的作用不如窝别因素大。窝别常反映遗传因素，证明遗传因素对增加体重影响明显。问：（1）所用统计方法是否正确，为什么？（2）作者结论是否正确，表现在什么方面？小结 1、方差分析常用于3个或3个以上均数的比较，当用于两个均数的比较时，同一资料所得结果与t检验等价，即有如下关系：t2=F。 2、方差分析的基础是分解变异，统计量是两个均方之比。完全随机设计方差分析的基本思想是：在多个总体均数相等的假设条件下，样本总变异及自由度可分解为处理和组内两部分，由此估计出处理均方和组内均方，前者反映处理作用及随机误差，后者仅为随机误差；进一步将处理均方与组内均方之比值构成F统计量，查F检验界值表便可确定界值，最后做出是否拒绝检验假设的抉择。 3、方差分析由多种设计类型，但基本思想和计算方法是一样的，只是因素的个数不同。 4、均数的多重比较方法有多种，应用时应事先决定采用那一种方法。 5、方差分析的前提条件是正态性和方差齐性，可通过假设检验来判断，但通常情况下样本比较小，由专业知识判断显的很重要。 6、如果数据不满足方差分析的条件，可考虑采用数据转换的方法改善数据，或者采用非参数检验。第十章检验案例10-1 某研究者欲比较甲、乙两城市空气质量状况，在甲、乙两城市个测定300个采样点，得表10-17数据，试比较两城市空气质量有无差别。表10-17 甲、乙两城市空气质量状况比较组别空气质量类别合计优良轻度污染中度污染重度污染甲城市乙城市合计 193 67 28 7 5 300 154 94 28 18 6 300 347 161 56 25 11 600 检验步骤：（1）建立检验假设，确定检验水准 H0:甲乙两城市空气质量无差别 H1:甲乙两城市空气质量有差别 α=0.05 (2) 计算检验统计量 (3)确定P值，作出推断结论查界值表， =9.49， =13.28，，P<0.01。按α=0.05的检验水准，拒绝H0，接受H1，可认为甲乙两城市空气质量有差别。请讨论如下问题：（1）该资料结论是否正确？（2）你认为应该如何分析资料？小结 1、使用卡方检验要注意理论频数T不能够太小，样本要求各格子理论频数不小于1，并且T<5的格子数不宜多于总格子数的五分之一，如果理论频数太小，最好的办法是增加观察例数以增大理论频数，或考虑使用确切概率法。 2、完全随机设计的两个理论频数分布是互相独立的，而配对设计的两个频数分布却不是互相独立的。设计方法不同，资料性质不同，分析方法也不同。 3、对反映两个属性的分类变量，若有一份随机样本，可作交叉分类的频数表，利用关于独立性的卡方检验和列联系数来描述关联性。关联性分析卡方检验所用公式与两个或多个频数分布比较的卡方检验所用公式是一样的，但它的设计和意义有根本区别，作关联性分析的资料是一份随机样本，同时按两种属性分类，而两个或多个频数分布是两分份或多份样本，谈不上关联性问题。 4、列联系数可以描述两个分类变量之间在数量上的联系，但数量上的联系并不一定意味着因果关系。第十一章非参数检验-基于秩次的假设检验方法案例11-1 某医生为评价甲乙两种药物对皮肤廯菌的杀菌作用，以咪康唑散为对照药物，将315例浅部真菌病患者随机分为甲乙两治疗组和对照组，分别为104例、105例和106例。治疗三周之后，结果见表11-9，试比较甲乙两药物治疗浅部真菌的疗效如何？表11-1 某药物治疗某病的疗效疗效甲组乙组对照组合计痊愈 56 40 38 134 显效 36 50 56 142 好转 10 12 11 33 无效 2 3 1 6 合计 104 105 106 315 对于该资料，研究者进行了列联表卡方检验： =9.997，df=6，P<0.125,考虑到理论数小于5的格子数太多，用 Fisher精确概率法得P=0.107,在α=0.05的检验水准上，不能够认为甲乙两药与对照组的疗效不同。请讨论：（1）该资料的分析方法是否合适？为什么？（2）应该如何分析资料？小结 1、注意非参数方法不涉及特定的总体分布，又称为任意分布检验或称为分布无关检验，是因为其推断方法与总体分布无关，不应理解为与所有分布（例如有关秩的分布）无关。 2、秩和检验的应用范围很广① 样本所代表的总体分布不容易确定；②分布呈现非正态而又五适当的数据转换，或者无法进行数据转换；③ 等级资料，均可采用非参数检验。 3、非参数检验方法内容丰富，尚又许多检验方法，可参考有关文献。第十二章简单线性回归案例12-1 某地卫生防疫站根据10年乙脑发病率（1/10万，预报量Y），与相应前一年7月份日照时间（小时，预报因子X）建立回归方程，将乙脑发病率作平方根反正弦变换，即：，计算得回归方程为：。 EMBED Equation.3 ，，n=10。1990年7月份日照时间X0=260小时。试估计该地1991年的乙脑发病率？（设α=0.05）。解得： 0.0233 按α=0.05，df=10-2=8，查t界值表，得 =2.306，又 =-1.97+0.0068×260=0.571，按公式计算得95%的容许区间为：（0.571-2.306×0.0243，0.571+2.306×0.0243）=（0.5150，0.6270）取原函数得，Y=(sin )2，得95%容许区间为（0.0000808，0.0001197）。故可预测该地1991年乙脑发病率又95%可能在：0.08～11.97/10万之间。利用回归方程进行控制，是利用回归方程进行逆估计，例如要求应变量Y在一定范围内波动，可以通过自变量X的取值来实现。这是回归应用的另乙方面。案例12-2 根据某缺碘地区10例产妇在妊娠15-17周时母血TSH水平（X），与足月分娩时新生儿脐血TSH水平（Y）数据建立的直线回归方程为 =2.993+0.9973X., =0.3285若新生儿脐带血TSH水平超过5mU/L，可认为新生儿缺乏碘，应该对妊娠产妇采取补碘干预措施，问母血TSH水平应该控制在什么水平可使得新生儿脐带血TSH水平不超过5mU/L？（设α=0.05）。在扣除X对Y的影响之后，Y本身对回归直线的离散程度为 (双侧)或（单侧），本例自由度df=10-2=8,查t界值表，单侧 =1.860，单侧95%上限为：。当 =5时，解得X=1.3985mU/L，即只有将母血TSH水平控制在1.3985mU/L水平以上，才有95%的可能使得新生儿脐带血TSH水平不超过5mU/L。小结 1、简单线性回归分析时研究两个变量之间线性关系的数量表示，例如身高与体重、血糖与胰岛素之间关系。回归方程为，可根据最小二乘法计算，最小二乘法使得实际应变量与回归方程预测值之差的平方和达到最小。 2、进行简单线性回归分析需要满足线性（linear）、独立（indenpdence）、正态（normal）与等方差（equal variance）4个条件。通过绘制残差图可简单直接地评价是否满足这4个条件。 3、在进行简单线性回归分析前，一般先绘制散点图，以判断其是否存在线性关系。若干不存在线性关系，仅当对X进行变换之后，如果呈现线性关系，可进行回归分析；如果需要对Y进行线性变换后才满足线性，则需要进行非线性回归分析。第十三章线性相关案例13-1 某医生对某感冒患者进行连续观察60小时，每6小时观察测量该患者的体温和呼吸次数，资料见表13-3。观察序号 1 2 3 4 5 6 7 8 9 10 体温（℃） 39.8 40.2 39.6 38.8 38.3 38.1 38.2 38.0 37.8 37.5 呼吸次数（次/分钟） 28 29 26 25 24 24 21 22 20 21 该医生对上述资料进行双变量正态性检验，α=0.2，正态性检验的P值大于0.2，不能拒绝资料服从正态分布，计算Pearson相关系数得r=0.9373，相应的P=0.0001，相关系数ρ的95%的可信区间为（0.7507，0.9854）。因此该医生判断：体温与呼吸次数呈现线性相关。请问：你对该医生作上述相关分析和所下结论有何异议？案例13-2 某研究者欲研究年龄与地方甲状腺肿患者之间的关系，将219例资料整理乘表13-4，问：年龄与地方甲状腺肿患者之间是否存在某种相关性？表13-2 年龄与地方甲状腺肿患者疗效的关系年龄（岁）（X）疗效（Y）合计痊愈显效好转无效 <30 67 9 10 5 91 30～ 17 13 12 2 44 40～ 15 10 8 2 35 ≥ 10 11 23 5 49 合计 109 43 53 14 219 小结 1、相关系数ρ>0表示正相关，ρ=0表示不相关，ρ<0表示负相关。 2、相关系数的大小与样本量有关，不能够仅凭相关系数大小判断两变量是否存在相关，而应该根据假设检验的结果做出判断。 3、作Pearson相关或Spearman相关，都要求观察单位之间是独立的。 4、 Pearson相关系数为线性相关系数，要求变量X和Y服从双变量正态分布，并且在作相关分析时，一般先作散点图，考察是否存在直线相关。 5、若变量X和Y服从双变量正态分布，则tr=tb，两个检验等价。 6、若干变量X和Y不服从双变量正态分布，可用Spearson等级相关进行分析。 7、若变量X和Y均为多分类有序资料，可以采用Spearson秩相关进行相关分析。 8、两变量之间相关性并不表示一个变量的改变是由于另外一个变量所引起的，也可能是受第三变量影响而出生的伴随现象，所以相关分析只是刻画了一种伴随现象，因此在作相关分析时，还应该考虑两变量相关是否具有实际意义。 9、由于通常的相关系数无效假设H0：ρ=0，但P<α时，是判断ρ≠0。仅能说明两个变量之间存在相关关系，但相关关系的强弱应该根据相关系数大小确定，与P的大小无关。第十四章临床测量误差评价与诊断试验案例14-1 某研究者比较3种尿干化学分析仪进行平行测定结果的符合程度，同时观察不同仪器在阳性标本检出率方面是否存在显著性差异。采用3种不同厂家不同型号的尿干化学分析仪及配套试纸条对60例门诊和病房送检的新鲜阳性尿液标本（葡萄糖GLU、蛋白PRO、隐血BLD、白细胞LEU这四种至少有1项试阳性）进行平行检测，并对检验结果进行比较，统计4处理将各项指标分别计算阳性检出率并计算值，同时将每一例标本各项检测结果进行两两比较，计算出完全符合率P1和一般符合率P2（即两种检出结果不超过一各等级的比率），然后用Kappa检验值评价两种尿干分析仪测定结果之间的符合程度。分析结果列在表14-1和14-2中。根据研究结果，作者认为3种尿干分析仪测定结果的符合率都在80%以上，各检测项目的Kappa值>0.4，3台仪器葡萄糖（GLU），、蛋白（PRO）、白细胞（LEU）3项检测没有显著性差别。最后的结论：由于仪器本身的灵敏度、试纸条所规定的量级和检测原理以及稳定性的差异，造成部分项目的检出率和检测结果不完全一致，但是这三种仪器在尿液检查主要项目(GLU,PRO,LEU)的检出率和检出结果方面的一致性还是良好的，完全能够满足临床医生对病人诊断、观察的需要。试分析下列问题：（1）你是否认同作者的数据分析方法和所做出的结论？（2）你认为应如何做这一试验和进行数据分析？表14-1 3种仪器的阳性检出率项目 GLU PRO BLD LEU 中国FA 16.7 63.3 81.7 33.3 日本US 16.7 58.3 78.3 31.7 匈牙利DO 18.3 48.3 51.7 28.3 值 0.078 2.85 15.6 0.363 P值 >0.05 >0.05 <0.005 >0.05 表14-2 不同仪器测定结果的符合率及检验的一致性检查指标中国FA与日本US 中国FA与匈牙利DO 日本US与匈牙利DO P1 P2 Kappa P1 P2 Kappa P1 P2 Kappa GLU PRO BLD LEU 71.7 93.3 0.694 44.0 96.7 0.786 71.7 96.7 0.707 31.7 88.3 0.754 35.0 90.0 0.436 45.5 90.0 0.568 40.0 88.3 0.952 43.3 83.3 0.593 43.3 83.3 0.635 50.0 96.7 0.536 45.0 90.0 0.401 66.7 93.3 0.702 小结 1、临床测量结果中可能含有多个误差成分，它主要包括生物变异、随机测量误差和系统误差。正确认识不同误差的性质和来源，有助于医生临床诊断和对临床试验做出客观的评价。临床测量误差评估方法有多种，常用方法有方差分量法和SN比值法，对定性资料给出Kpaap一致性评价方法。 2、方差分量法的基本思想是：将试验结果的变异分解为受试者个体变异和重复测量误差的等方差分量，比较不同方差分量的比值，如果重复测量误差的方差分量在总变异中所占比例小，则说明测量的可信度高；同时可以对重复测量的误差范围进行估计。 3、S/N比值是指测量信号与影响测量信号识别的噪声的比值，用于已知真值的条件下对测量误差进行度量。基本方法是：根据标准样品和实测值利用直线回归分析方法进行校正，然后根据回归系数和方差分析中误差均方估计出SNR值及测量误差范围。 4、Kappa值是评价临床定性测量结果的一致度和信度的一种重要指标，常常用于评价不同医生对同一患者的判断结果，或者同一医生先后两次判断结果是否一致。Kappa值低。说明临床测定结果的一致性差，试验结果缺乏信度，分析结果不可靠。 5、评价诊断试验最基本的指标是灵敏度（Se）和特异度（Sp）。灵敏度为实际患病检测结果正确判为有病的概率，1-Se是假阴性率；特异度是实际未患病且检测结果正确判为没病的概率，1-Sp是假阳性率。此外，Youden指数综合了灵敏度和特异度两个指标的值，预测值除与灵敏度和特异度有关外，还与检测人群的患病率有关。 6、ROC曲线称为接收者工作特性曲线，它是以1-Sp为横坐标，Se为纵坐标按照连续变化的诊断阈值，由不同灵敏度和特异度绘制的曲线。ROC曲线绘制可以采用原始数据分组和利用模型拟合两种不同的方法。 7、使用ROC分析是对诊断试验数据进行分析与评价，其优点是评价结果比较客观和一致，它适合定量和等级资料分析。ROC分析的结果主要包括ROC曲线的图形和综合评价统计两量。前者可以直观描述诊断效果及灵敏度特异度之间的变化关系，后者可理解为在所有特异度下的平均灵敏度，也可以理解为患病组测量值高于非患病组测量值的概率。 8、计算ROC曲线下面积，可以采用双正态参数法和Hanley-McNeil非参数法。前者适用于定量资料的分析，后者适合等级资料分析。ROC曲线下面积比较，有成组设计和同源配对设计两种不同的数据分析方法，前者计算简单，后者可以采用Delong给出的非参数计算方法。第十五章研究设计方法案例15-1 《利多卡因手控定量雾化吸入治疗激素抵抗型哮喘的研究》（临床内科杂志2004年6月第21卷第6期415页）目的是观察手控定量雾化吸入利多卡因治疗激素抵抗型（SR）哮喘的疗效。受试者吸入利多卡因3个月，观察临床疗效和口服激素减停剂量的情况。原文没有设立平行对照，而采用单盲、自身前后对照。15例患者治疗3个月后，咳嗽、喘息症状改善（P<0.001），肺部哮鸣音明显减少（P<0.001）,外周血、痰中EOS数目减少（P <0.02），FEV1%明显提高(P<0.01),无一例出现严重的毒副作用。因而，原文认为：利多卡因入治疗激素抵抗型哮喘安全有效，可以提高FEVI的水平，并能成功地减少口服激素。案例15-4 多糖是冬虫夏草的主要活性成分之一，具有抗肿瘤、增强机体免疫力和降低血糖等多方面的药理作用。虫草多糖的提取过程是：取100克虫草菌粉，加水若干，浸泡1小时，加热至微沸，维持一段时间，冷却，离心，残渣重复提取。为进一步确定虫草多糖的最佳提取工艺，拟考虑3个主要因素，A：加水量，B：煎煮时间，C：煎煮次数。每个因素个2考虑3个水平。加水量考虑分别为原药量的8、10、12倍；煎煮时间分别考虑微0.5、1和1.5小时；煎煮次数分别考虑1、2、3次。请讨论：（1）单独考虑一个因素时，采用何种设计方法？（2）同时考虑三个因素时，不考虑交互作用，采用何种设计？（3）同时考虑三个因素时，考虑所有的交互作用，采用何种设计？（4）同时考虑三个因素时，只是考虑一级交互作用，采用何种设计？小结 1、常用的单因素设计方法有完全随机设计，完全随机区组设计、拉丁方设计、交叉设计。完全随机设计是将研究对象按完全随机分组的方法进行分组，通过各组间的比较找出处理因素各水平间的差异。完全随机设计是将研究对象按区组分层进行随机分组的方法，控制了一个已知来源的的变异，从而提高设计效率。拉丁方是3因素（不考虑交互作用）的设计方法，要求各因素水平数相同；可以安排两个区组因素一个处理因素的实验，达到控制两个已知来源的变异的目的，也是提高设计效率的方法之一。交叉设计是将自身对照和成组对照结合起来的一种设计方法，常常用于临床上尚无特殊治疗而病情缓慢的慢性病患者的对症治疗，不适用有自愈倾向，或病程短的疾病治疗研究。 2、常用的多因素设计有析因设计和正交设计。析因设计是多因素各水平组合的完全随机设计，可以分析处理因素的主效应和处理因素间的交互作用。正交设计是多因素各水平组合的完全设计或部分组合的平衡不完全设计，主要用于试验方案的优选。 3、临床试验和临床治疗不同，需要按照统一的临床试验方案进行。临床试验中除了要遵循对照、随机、重复的原则，还要符合伦理，并且尽可能地进行盲法试验，以避免主观偏性的影响。新药或新医疗器械的临床试验需要按照药品临床试验规范（GDP）及相应的知道原则进行。 4、观察性研究包括横断面调查，回顾性病例-对照研究和前瞻性队列研究。横断面研究主要用于了解当前人群中的有关健康、疾病状况，得到患病率，为进一步研究提供基础资料。病例-对照研究通过回顾性调查过去某段时间内各种可能的危险因素的暴露史，测量并比较病例组和对照组各因素的暴露史之差异，判断研究因素与疾病存在的统计学联系程度，得到OR值。队列研究通过对研究对象随访观察，比较暴露组与非暴露组在观察期内某疾病的发生率，判断研究因素与疾病间存在的统计学联系及联系程度，从而进一步推断暴露因素与疾病的联系，得到RR值。第十六章样本量的估算案例16-1 新药临床试验研究是典型的实验研究，在复方甘露醇注射液、甘露醇注射液治疗颅内高压症有效性和安全性的随机、双盲多中心试验研究中，按《新药审批办法》中对各类新药的各期临床试验规定，确定每组个100例，考虑不合格病例的淘汰，每组几乎撒完成120例，请回答下面问题：（1）《新药审批办法》规定的样本量是如何确定的？（2）在新药临床试验中是否不需要对样本量进行估算？（3）新药临床试验研究中如何确定样本量？案例16-2 在胸腔积液良恶性（癌性与结核性胸腔积液）鉴别诊断研究中，发现胸水中的乳酸脱氢酶和溶菌酶有比较好的鉴别诊断意义。现需要制定结核性这两酶的正常值范围，考虑这两种酶的发布不服从正态发布，确定研究对象为120例。请讨论下列问题：（1）医学参考值范围制定是否属于总体参数估计的抽样研究？（2）这种规定的统计学依据是什么？怎样确定样本量？（3）在医学参考值范围研究中，是否样本量不得少于100例？100多例是否就足够了？小结 1、样本量估算是依据统计方法在保证研究一定可靠性前提下确定的最少样本观察单位数，实际研究应结合研究推论的总体、研究中对象的失效和人力、物力和财力综合考虑。足够的样本量能够保证研究中误差的估计，减少抽样误差，发现事物应有的差别。同时，也是保证组间均衡性的基础。 2、样本量估算的影响因素是容许误差δ、第一类错误α、第二类错误β、总体标准差σ和单双侧检验以及研究设计类型。 3、样本量估算的方法很多，可以用公式估计，也可以用查表法。应根据研究设计实验或调查设计）类型、效应指标（观察指标）类型和研究目的选用相应的估算方法。 4、率的估计和假设检验的样本容量估算。常见有以总体率估计为目的的单纯随机抽样调查、单个总体率的假设检验、两个总体率与多个总体率的检验的完全随机设计以及总体率检验的配对设计时的样本含量估算公式和相应的查表方法。 5、在均数估计和假设检验的样本量估算中，常见的有以总体均数估计为目的的单纯随机抽样调查、单个总体均数的假设检验或均数的配对设计、两总体和多总体比较的完全随机设计、多个总体均数检验的配伍组设计、实验效应指标为计量资料的重复测量研究设计和直线相关与回归分析中的样本量估算公式和相应的查表法。 6、系统抽样可按照单纯随机抽样的估算公式进行估计，有限总体时需要进行调整；分层随机抽样在无限总体时可对各层参数估计值进行加权后按照单纯随机抽样的估算公式进行估计，有限总体时有专门估计公式，总样本量估计后需要按照比例或最优分配方法分到各层；整群抽样是按照单纯随机抽样检查样本量再乘以整群抽样的设计效率进行样本量估算。 7、病例-对照研究设计和队列研究设计中的OR和RR在单因素条件下的估计和假设检验时的样本容量估计参考有关章节。生存分析中以指数分布为基础，针对有无截尾数据两种情况给出了生存率估计和假设检验时样本量的估算的公式；并介绍了作L og-rank检验时样本量的估算公式。第十七章多因素实验的方差分析案例17-1 某研究探讨锌对热应激大鼠β内啡肽的影响，取锌饲料和热暴露时间两个因素，其中饲料中的锌含量有高中低三个水平；热暴露时间有：无人暴露（对照组）、暴露组5分钟、30分钟、60分钟4个水平。研究对象为SD雄性大鼠72只，每种组合6只大鼠，文中给出的实验结果见表17-1，结论概括为：“大鼠血浆中β-内啡肽含量的变化趋势是一致的，受热5分钟后即上升，至30分钟时继续升高，至60分钟时有所下降，单含量仍然比5分钟时高，饲料锌水平对热暴露大鼠β-内啡肽含量的影响：无论哪一个时间点上，高锌、中锌组含量均比低锌高，统计学有显著性差异”。表17-1 锌和热暴露对大鼠血浆β-内啡肽含量（pg.mg-1）的影响（）组别对照组 5min 30min 60min 高锌组 60.82±6.22 60.14±6.76 90.48±6.98 83.20±5.79 中锌组 57.13±6.13 65.41±6.55 83.20±7.11 82.28±6.35 低锌组 28.04±5.28 43.76±4.62 49.14±6.02 57.13±4.81 案例分析：此研究采用的时3×4*6的析因设计，但所用方法仅仅时单独效应的方差分析，而没有通过析因分析来分析主效应和交互效应。如果能够给出主效应和交互效应的分析并配合轮廓图，会使研究结论更丰富和全面一些。本案例在公开发表的文献中具有一定代表性。小结 1、所有方差分析的计算可依据离均差平方和分解实现。 2、析因分析可分析各因素的主效应，因素间的的交互效应以及因素的单独效应。交互效应分析有助于最佳因素组合方案的筛选，交互效应轮廓图可以

                    本文档为【颜虹的医学统计学案例选】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

颜虹的医学统计学案例选

你可能还喜欢