购买

¥25.0

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 医学统计学总体均数估计和假设检验课件

医学统计学总体均数估计和假设检验课件.ppt

医学统计学总体均数估计和假设检验课件

教育文库
2018-11-13 0人阅读 举报 0 0 0 暂无简介

简介:本文档为《医学统计学总体均数估计和假设检验课件ppt》,可适用于考试题库领域

总体均数估计与假设检验尹家祥大理学院公共卫生学院总体均数的估计普查(overallsurvey)是了解总体特征的最好方法。抽样研究(samplingstudy)的目的就是要用样本信息来推断相应总体的特征这一过程称为统计推断(statisticalinference)。统计推断包括两方面的内容:总体参数的估计和假设检验(显著性检验)。三类误差系统误差(systematicerror):由于受试对象、研究者、仪器设备、研究方法、非实验因素影响等确定性原因造成有一定倾向性或规律性的误差。可以避免。随机误差(randomerror):由于多种无法控制的偶然因素引起对同一样品多次测量数据的不一致。无倾向性不可避免。抽样误差(samplingerror):由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差。抽样误差的概念总体样本统计推断抽样抽样误差抽样误差产生的根本原因是个体变异、产生的直接原因是抽样。只要有抽样抽样误差就不可避免。抽样抽样误差样本均数的分布特点各样本均数未必等于总体均数各样本均数间存在差异。样本均数分布很有规律在正态总体中随机抽取例数为n的样本样本均数服从正态分布。样本均数间相差较小其变异范围较原变量值的变异范围缩小。在偏态总体中随机抽样当n足够大时(n>)也近似正态分布。该资料是一个正偏峰的分布用电脑从中随机抽取样本含量分别为和的样本各次计算样本均数并绘制个直方图。原始数据(b)n=(c)n=(d)n=(e)n=)从正态总体N(µ,σ)中随机抽取例数为n的多个样本样本均数服从正态分布即使是从偏态总体中随机抽样当n足够大时(如n>)也近似正态分布。数理统计推理和中心极限定理表明:)从均数为µ标准差为σ的正态或偏态总体中抽取例数为n的样本样本均数的标准差即标准误为。标准误的概念用于表示均数抽样误差的指标叫样本均数的标准差根据其实际意义常称作样本均数的标准误(standarderror)。随着nS稳定Sx均数的标准误与标准差成正比与样本例数n的平方根成反比。因此减少抽样误差最有效的办法:增加样本例数例年某研究所随机调查某地健康成年男子人得到血红蛋白的均数为gL标准差为gL。试估计该样本均数的抽样误差。标准误的应用反映抽样误差大小:标准误越大抽样误差越大反映均数的可靠性:越大样本均数的抽样误差越大(用样本均数推算总体均数的)可靠性差反之越小均数抽样误差越小(用样本均数推算总体均数的)可靠性好。用于进行假设检验。标准差和标准误的区别和联系区别:概念不同:标准差是描述观察值(个体值)之间的变异程度S越小均数的代表性越好标准误是描述样本均数的抽样误差Sx越小均数的可靠性越高用途不同:标准差与均数结合估计参考值范围计算变异系数计算标准误等。标准误用于估计参数的可信区间进行假设检验等。与样本含量的关系不同:当样本含量n足够大时标准差趋向稳定而标准误随n的增大而减小甚至趋于。联系:标准差、标准误均为变异指标当样本含量不变时标准误与标准差成正比。t分布在统计应用中可以把任何一个均数为µ标准差为σ的正态分布N(µ,σ)转变为µ=,σ=的标准正态分布即将正态变量值X用来代替。由于服从正态分布故服从标准正态分布N(,)。实际资料的分析中由于σ往往未知故标准化转换演变为:服从ν=n的t分布即:t分布ν(f)>degreeoffreedom自由度ν=nt分布曲线下面积规律:t分布曲线下总面积仍为或t分布曲线下面积以为中心左右对称。t分布是一簇曲线故t分布曲线下固定面积(如或)的界值不是一个常量而是随自由度的大小而变化。总体参数估计统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。参数估计:点估计(pointestimation):用相应样本统计量直接作为其总体参数的估计值。如用估计µ、S估计σ等。其方法虽简单但未考虑抽样误差的大小。区间估计(intervalestimation):按一定的概率(-α)估计总体均数所在范围(置信区间)。即认为年该地所有健康成年男性血红蛋白量的总体均数为gL。点估计:用样本统计量直接作为总体参数的估计值。例年某研究所测得某地例健康成年男性血红蛋白量的样本均数为gL试估计其总体均数。区间估计:按预先给定的置信水平(-α)估计总体参数的可能位置该范围就称为总体参数的-α置信区间(confidenceintervalCI)。预先给定的概率(-α)称为置信度常取或。如无特别说明一般取双侧。置信区间由两个数值即置信限(下限和上限)构成。总体均数可信区间的计算通式:(双侧)()σ已知按标准正态分布原理计算由z分布标准正态曲线下有的z值在±之间。的双侧置信区间:的双侧置信区间:通式:(双侧)()σ未知但样本例数n足够大(n>)时由t分布可知自由度越大t分布越逼近标准正态分布此时t曲线下约有的t值在±之间即的双侧置信区间:的双侧置信区间:例某市年随机测量了名岁健康男大学生的身高其均数为cm标准差为cm,试估计该地岁健康男大学生的身高的置信区间。()σ未知且样本例数n较小时按t分布原理此时某自由度的t曲线下约有的t值在±t(ν)之间通式:的双侧置信区间:的双侧置信区间:tа,ν是按自由度ν=n由附表查得的t值。例已知某地例健康成年男性血红蛋白量的均数为标准差S=gL,试问该地健康成年男性血红蛋白量的和置信区间。本例n=S=CI:CI:可信区间的确切涵义从总体中作随机抽样进行重复抽样的试验中平均有-a的可信区间包含了总体参数有a的可信区间不包括总体均数。即犯错误的概率为a而a是小概率事件对一次试验的可能性小因此实际应用中就认为总体均数在算得的可信区间内。的可信区间的理解()所要估计的总体参数有的可能在我们所估计的可信区间内。()从正态总体中随机抽取个样本可算得个样本均数和标准差也可算得个均数的可信区间平均约有个可信区间包含了总体均数。()但在实际工作中只能根据一次试验结果估计可信区间我们就认为该区间包含了总体均数。可信区间的两个要素准确度(accuracy):反映在可信度(-α)的大小。-α越接近就越准确。如可信度比准确。精确度(precision):反映在区间的长度。长度越小越好,在例数n确定的情况下二者呈反比关系:准确度↑,精确度↓(范围变宽)。要兼顾准确度和精确度一般取可信区间。可信区间与参考值范围区别意义不同正常值范围是指绝大多数观察值在某个范围可信区间是指按一定的可信度估计总体均数(参数)的所在范围计算公式不同可信区间参考值范围应用不同可信区间:估计总体均数参考值范围:判断某项指标是否正常**假设检验**假设检验(hypothesistest)也称显著性检验(significancetest)是用来判断样本与样本样本与总体的差异是由抽样误差引起的?还是本质差别造成的?由于存在抽样误差从总体中随机抽样所得的样本均数与总体均数之间存在误差从同一总体中抽取的样本均数之间也有误差。假设检验原理**例某医生测量了名从事铅作业的血红蛋白含量算得其均数为gL标准差为gL。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值gL?**例μ=gL已知总体μX=gLS=gL未知总体=**①完全由抽样误差引起比较的均数来源于同一总体假设检验计算①②的概率判断。②来自于不同的总体均数之间存在本质差别。**********假设检验的基本思想小概率思想:小概率事件:在一次试验中认为基本上不可能发生。小概率事件的概率是相对的统计分析时就是预先规定检验水准(sizeofatest)用表示反证法思想:当检验假设H成立时用合适的统计方法获得现在样本的概率大小(P值)。如果是小概率事件则推断假设是假的因此拒绝它如果不是小概率事件则不能认为假设是假的也因此不能拒绝它。**假设检验的基本步骤、建立假设和确定检验水准、选定检验方法和计算检验统计量、确定P值和作出推断结论**、建立假设和确定检验水准()两个假设无效假设:H:u=u备择假设:H:u≠u**对于假设检验须注意:①检验的假设是针对总体而言而不是针对样本②H和H是相互联系、对立的假设后面的结论是根据H和H作出的因此两者不是可有可无而是缺一不可③H是无效假设其假设通常是:某两个总体参数相等或两个总体参数之差等于等等。④H的内容反映了检验的单双侧。**单侧检验:在比较两种药物的疗效时根据专业知识可认为新药不会比旧药差只关心新药是否比旧药好(至多相同绝对排除出现相反的可能性)可用单侧检验。()确定单侧或双侧检验根据专业知识和研究目的而定**双侧检验:在比较两种药物的疗效时事先不能确定哪种药的疗效较好只关心两药的疗效有无差别要用双侧检验。双侧检验若有差别单侧检验肯定有差别反之单侧检验若有差别双侧检验不一定有差别。**H:μ>μμ<μμ>μμ<μ****()确定检验水准(显著性水准)α一般α=发生第一类错误的概率即H实际成立但拒绝H的概率。**、选定检验方法和计算检验统计量不同设计、不同的资料类型和不同的推断目的选用不同的检验方法。**、确定P值P值是指由所规定的总体作随机抽样获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。手工计算:一般是通过查界值表获得。统计软件:直接给出精确的P值**、作出推断结论(含统计结论和专业结论)统计结论:拒绝H接受H差异有统计学意义。专业结论:可认为…不同或不等。当P≤α时将获得的事后概率P与事先规定的概率α进行比较。**当P>α时统计结论:不拒绝H差异无统计学意义专业结论:还不能认为…不同或不等。**假设检验的特点:、统计检验的假设是关于总体特征的假设、用于检验的方法是以检验统计量的抽样分布为理论根据的、作出的结论是概率性的不是绝对的肯定或绝对的否定。(无论是拒绝H或不拒绝H,都有可能发生错误)**假设检验中α值与P值的区别:、假设检验中α值是检验水准是拒绝或不拒绝H的概率标准。α的大小是人为选定的一般取。、P值是指在H所规定的总体中作随机抽样,获得等于或大于(等于或小于)现有样本统计量的概率。通过P值与α值的比较来确定拒绝或不拒绝H。**①未知σ②两样本较小(n与n<)③两样本均数比较时两样本的总体方差相等(即方差齐)④上述都要求:资料服从对称或正态分布。t检验适用条件**①已知σx与μ比较②两大样本(n与n≥)均数比较③上述两种情况都要求:资料服从对称或正态分布。u检验适用条件**t检验和u检验类型、样本均数与总体均数的比较t检验、配对设计差值均数与总体均数的比较t检验、两样本均数的比较t检验、两样本几何均数的比较t检验、两大样本均数比较u检验**、单样本t检验样本均数代表的未知总体均数μ和已知总体均数μ的比较μμ=理论值、标准值、稳定值X**样本均数与已知总体均数(一般为理论值、标准值或大量观测所得的稳定值)的比较目的是推断样本所代表的总体与已知总体是否相等。根据σ是否已知和样本含量n的大小,选用u检验或t检验。**t检验计算公式为:**例某医生测量了名从事铅作业的血红蛋白含量算得其均数为=gL标准差为gL。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值gL?**例μ=gL已知总体μ=gLS=gL未知总体==**检验步骤:例①建立假设和确定检验水准H:μ=μ=gLH:μ≠μ=gL双侧α=**②选定检验方法和计算检验统计量本例n==gLS=gLμ=gL按下式v=n==**例③确定P值以v=查附表t界值表得:(v一定时t值越大P值越小)**查t值表时先查P=时的界值。当P<时需继续往P更小的一侧查直到最小的P值为止。当P>时需继续往P更大的一侧查直到最大的P值为止。如使用统计软件会给出确切的概率值。注意**今<P<按α=水准拒绝H接受H差异有统计学意义(统计结论)可认为从事铅作业的男性工人平均血红蛋白量低于正常成年男性(专业结论)。④作出推断结论(统计结论和专业结论)****例根据大量调查已知健康成年男子的脉搏均数为次分。某医生在某山区随机调查了名健康男子求得脉搏均数为次分标准差为次分。能否认为该山区的成年男子的脉搏均数与一般男子的脉搏均数相等?**例μ=次分已知总体μ=次分S=次分未知总体==**检验步骤:例①建立假设和确定检验水准H:μ=μ=次分H:μ≠μ=次分双侧α=**②选定检验方法和计算检验统计量本例n==S=μ=按下式v=n==**④作出推断结论今P>按α=水准不拒绝H差异无统计学意义(统计结论)尚不能认为该山区的成年男子的脉搏均数高于一般男子的脉搏均数(专业结论)。**、配对t检验(pairedttest)()同质的两个受试对象配成对子分别接受两种不同的处理。()同一样品用两种方法(或仪器等)检验的结果或同一受试对象分别接受两种不同处理。()同一受试对象接受(一种)处理前后。(这是难点也是重点易和成组设计的两样本t检验相混淆)**例随机选择窝中年大鼠每窝中取两只雌性大鼠随机地分入甲、乙两组甲组大鼠不接受任何处理(即空白对照)乙组中的每只大鼠接受mgKg的内毒素。分别测得两组大鼠的肌酐(mgL)测定结果如下。**例检验血磷含量有甲、乙两种方法其中乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品所得结果如下表。问:检验甲乙两法检出血磷是否相同用何统计方法?**例某脑电图室观察家兔注射AT前后脑电图波形的变化观测结果如下。试分析注射AT前后脑电图波形是否发生了显著性变化。注射AT前后脑电图波形的变化率()家兔编号注射前注射后**医学研究中将配对计量资料也可分为:①同源配对:同一对象处理前后的数据同一样品用两种方法测定的结果。②异源配对:将实验对象配成对子对每一对子中的两个实验对象给予两种不同的处理以推断两种处理的效果有无差别。****同源配对**AaAaAa: :::nAnan编号甲乙甲指标乙指标异源配对**注意:配对t检验的实质同于单样本的t检验以上述第一种情况两同质受试对象配对分别接受两种不同的处理为例。若两种处理效应相同即μ=μ则μ-μ=(当成已知总体均数μ)。因此可将此类资料看成是差值的样本均数所代表的未知总体均数μd与已知总体均数μ=的比较。**配对t检验计算公式:为差数的总体均数d为成对数据之差(差数)的均数Sd为差数均数的标准差**、两个独立样本t检验应用条件:()两样本均数来自正态总体()两样本的方差齐在正式的统计分析中先要看方差是否齐如果不齐要选方差不齐的结果!注:在一般的统计软件中都会同时给出方差齐性检验的结果**完全随机设计资料的两种类型:、选择一定数量的观察对象将它们随机分成两组或多组分别给予不同处理、从两组或多组具有不同特征的人群中分别随机抽取一定数量的样本比较某一指标在不同特征人群中是否相等。**两小样本均数比较t检验t’检验方差不齐方差齐变量变换秩和检验t检验两个小样本均数的比较**()总体方差相等时的检验当两总体方差相等即时可将两总体方差合并求两者的共同方差合并方差。**两样本t检验计算公式即:**例为研究国产四类新药阿卡波糖胶囊的降血糖效果某医院用名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊)分别测得试验开始前和周后的空腹血糖算得空腹血糖下降值见下表能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?****()建立检验假设确定检验水准H:(=(H:(((=unknown**()计算检验统计量mmolL标准差mmolLmmolL标准差mmolL。(=nn(=(n()=(()=unknownunknownunknownunknownunknown**()确定P值作出推断结论以(=、查附表的t界值表得P>。按(=水准不拒绝H无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。unknown**U检验两个大样本均数的比较当两个大样本含量较大(均>)时可用u检验。**两种职业的血清胆固醇水平(mmolL)例某医生研究血清胆固醇水平与职业的关系得调查资料如下表问两种职业的血清胆固醇水平是否不同?**①假设:H:μ=μH:μ≠μα=②计算u值**③确定P值u>P<④统计推断结论P<在α=水准上拒绝H接受H,差异有统计学意义。可认为教师的血清胆固醇水平高于工人。***为双侧单侧u界值为、。**两个样本几何均数比较、应用条件:a两样本的对数值均来自正态总体b两样本的对数值的方差齐、检验公式与两样本均数的t检验和u检验公式相同只是原始数据要作对数变换用对数值的均数和标准差代公式。**、检验步骤在使用统计软件进行分析时先将原始数据取对数然后用对数值作一般的t检验。注意啦!检验步骤同两样本均数比较的t检验**可信区间与假设检验的关系()可信区间亦可用于回答假设检验问题。()可信区间比假设检验还可提供更多的信息。但这并不意味着可以完全用可信区间代替假设检验。假设检验得到的P值可以较精确地说明结论的概率保证而可信区间只能告诉我们在α水准上有无统计意义却不能象P值那样提供精确的概率。**例某医生测量了名从事铅作业的血红蛋白含量算得其均数为gL标准差为gL。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值gL?CI为(,)gL<gL**有实际意义有统计意义可能有实际意义有统计意义无实际意义无统计意义样本例数太少确实无差别有实际意义值H**变量变换实际资料若不满足正态性或和方差齐性的假定尤其当是小样本资料时这时如用一般的t检验可能会导致偏离真实结果较远。对于明显偏离上述应用条件的资料可通过变量变换的方法加以改善。**变量变换是将原始数据作某种函数转换如转换为对数值以达到某种分析的目的。(一)变量变换的定义**适当的函数转换可使①②目的同时达到。(二)变量变换的目的①使各组达到方差齐性②使资料转换为正态分布以满足方差分析和t检验的应用条件。③直线化。通过变换后,使曲线关系变成直线关系常用于曲线拟合。**(三)常用的变量变换对数变换平方根变换倒数变换平方根反正弦变换轻度偏态、方差不齐Poisson分布资料两端波动较大的资料二项分布资料**假设检验的两类错误第Ⅰ类错误:如果实际情况与H一致仅仅由于抽样的原因使得统计量的观察值落到拒绝域拒绝原本正确的H导致推断结论错误。这样的错误称为第Ⅰ类错误。犯第Ⅰ类错误的概率大小为α。第Ⅱ类错误:如果实际情况与H不一致也仅仅由于抽样的原因使得统计量的观察值落到非拒绝域不能拒绝原本错误的H导致了另一种推断错误。这样的错误称为第Ⅱ类错误。犯第Ⅱ类错误的概率为β。**实际情况检验结果拒绝H不拒绝HH为真第Ⅰ类错误(α)假阳性(误诊)结论正确(α)置信度H不真结论正确(β)检验效能第Ⅱ类错误(β)假阴性(漏诊)**当样本含量n一定时α越小β越大若想同时减少α和β只有增大样本含量。**β称为假设检验的效能当所研究的总体与H确有差别时按检验水准α能够发现它(拒绝H)的概率。一般情况下对同一检验水准α效能大的检验方法更可取。在医学科研设计中检验效能(β)不宜低于否则检验结果很可能反映不出总体的真实差异出现非真实的阴性结果。假设检验的检验效能**要有严密的研究设计在抽样研究中研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的。应用检验方法必需符合其适用条件如一般t检验要求样本取自正态总体而且各总体方差齐同。适当选择检验水准α当样本量一定时α越小β越大反之亦然。若想同时减少α和β只有增大样本含量。应用假设检验需要注意的问题**正确理解P值的意义P值很小时“拒绝H接受H”但是不要把很小的P值误解为总体参数间差异很大。如果P<α,宜说差异“有统计学意义”同时写出P的数值或相应的不等式。统计“显著性”与专业“显著性”假设检验是为各专业服务的统计结论必须和专业结论有机的相结合才能得出恰如其分、符合客观实际的最终结论。**小结总体均数的估计标准误(SE)和标准差(SD)t分布的特点总体参数估计可信区间和参考值范围假设检验基本思想和基本步骤几种t检验类型假设检验的两型错误及应注意的问题****尹家祥博士联系方式:Email:chinayjxgmailcom手机:

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

评分:

/120

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利