首页 总体均数的估计与假设检验综述

总体均数的估计与假设检验综述

总体均数的估计与假设检验综述1总体均数的估计与假设检验综述第三章总体均数的估计和假设检验第一节均数的抽样误差与标准误1.均数的抽样误差与样本均数的分布：（1）均数的抽样误差是指样本均数与总体均数之间的差异以及来自同一总体的样本均数之间的差异。例3-1若某市1999年18岁男生身高服从均数为167.7cm，标准差为5.3cm的正态分布。从该正态分布N(167.7,5.32)cm总体中随机抽样100次即共抽取样本g=100个，，每次样本含量=10人，得到每个样本均数及标准差如图3-1和表3-1所示。167.412.74165.566.57168....

1总体均数的估计与假设检验综述第三章总体均数的估计和假设检验第一节均数的抽样误差与标准误1.均数的抽样误差与样本均数的分布：（1）均数的抽样误差是指样本均数与总体均数之间的差异以及来自同一总体的样本均数之间的差异。例3-1若某市1999年18岁男生身高服从均数为167.7cm，标准差为5.3cm的正态分布。从该正态分布N(167.7,5.32)cm总体中随机抽样100次即共抽取样本g=100个，，每次样本含量=10人，得到每个样本均数及标准差如图3-1和表3-1所示。167.412.74165.566.57168.205.36165.695.09……100个n＝10图3－11999年某市18岁男生身高X～N(167.7,5.32)抽样示意图－表3-1资料组段频数频率（％）累计频数累计频率（％）163～1111164～3344165～13131717166～19193636167～22225858168～20207878169～14149292170～449696172～339999172～17311100100合计100100————随机抽样所得100个样本均数的频数分布图3－2从正态分布总体X～N(167.7,5.32)随机抽样所得样本均数分布平均身高（cm)16316416516616716816917017117217325–20–15–10–5–0样本数（2）样本均数的分布：如果总体中的观察值的分布为正态分布，则样本均数的分布也是正态分布。如果总体中的观察值的分布为非正态分布，只要样本例数足够大（n>60），则均数的分布仍近似正态分布。2.均数的标准误（standarderrorofmean）:(1)意义:均数的标准误简称标准误,是指样本均数的标准差，衡量样本均数的离散程度。(2)标准误的计算：或(3)标准误与标准差及n的关系:n大小；S小小。思考：如何降低均数的抽样误差？(4)标准误的应用：①衡量均数的抽样误差②衡量样本均数的可靠性③估计总体均数的可信区间④均数的假设检验。思考：如何区别标准差和标准误？3.标准误与标准差之间的区别与联系：标准误标准差说明的离散度，说明x的离散度，衡量抽样误差，衡量个体差异，表示的可靠性，表示的代表性，n大，小，n大，s趋于稳定，估计μ的可信区间，估计参考值范围，均数的假设检验。计算CV和。联系n不变时，s越大，越大。区别第二节t分布一、t分布的概念t值的公式为:从同一总体中抽取若干n相同的样本，并求出样本均数，再代入t值公式求得若干个t值,将t值看成观察值，其分布称为t分布。u分布:t分布：t值为样本均数与总体均数之差与样本标准误的比值重要概念：自由度用υ表示，指计算某一统计量时变量取值不受限制的个数。一般情况下：υ＝n–mn为计算某一统计量时用到的数据个数，m为计算该统计量时用到的其他独立统计量个数，或者计算该统计量时受到限制的条件数。“υ”为小写希腊字母读作［nju:］自由度t分布的用途1.小样本时总体均数的估计，2.均数比较时的假设检验，3.相关系数的假设检验。二、t分布的特征：(1)单峰；(2)t值有正有负，均数为0；(3)以0为中心左右对称；(4)一簇曲线，每个自由度为一条曲线；(5)自由度越小，峰越矮，尾越翘，随着自由度增加，t分布曲线逐渐逼近标准正态分布曲线；(6)当自由度为无穷大时，t分布曲线和标准正态分布曲线完全吻合。f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3自由度分别为1、5、∞时的t分布三、t分布的图形(四、t分布曲线下的面积分布t界值表：见附表2（804页）。左侧为自由度，从1～∞；上方为概率，指曲线下尾部面积，分为单侧和双侧（单尾和双尾）；中间为t值的绝对值，即图形中横坐标的位置。单侧t界值的表示方法：双侧t界值的表示方法：－t0tt值表示意图同一自由度时，P值越小t值越大；同一P值时，自由度越大t值越小；自由度＝∞时，t值＝u值；当自由度＝10，单侧曲线下面积概率为0.05时，t值在横坐标上的位置是1.812。或者理解为：在上述条件下进行抽样研究，95％的t值应小于1.812，大于和等于1.812者仅有5％。的含义为：的含义？01.8125％02.2282.5％－1.812－2.22812第三节总体均数(μ)的估计一、可信区间的概念用样本指标估计总体指标称为参数估计，方法有点值估计和区间估计两种。μ的点值估计：将样本均数作为μ的估计值，由于抽样误差的存在，所以μ的点值估计准确度较低。μ的区间估计：考虑抽样误差并按一定的可信度计算包含μ在内的一个范围，称为区间估计，该范围称为可信区间，常用双侧95％。可信限是指两个界值二、总体均数可信区间的计算1.单一总体均数的可信区间（1）σ未知，n≤60，按t分布。双侧1－α可信区间(95%,)单侧1－α可信区间或例3-2在例3-1中抽得第15号样本的均数(cm)，标准差(cm)，试求其总体均数的95%可信区间。故该地18岁男生身高均数的95％可信区间为（164.35，169.55）(cm)。例：随机检查了20名慢性胃炎脾虚男病人，其脉搏均数为74.3次/分,标准差为6.4次/分，试估计该类病人脉搏总体均数的95％可信区间。本例n=20,ν=19,t0.05/2,19=2.093,95%可信区为：（74.3-2.093×6.4/，74.3＋2.093×6.4/）即(71.3次/分,77.3次/分)。(2)σ未知，n>60，按u分布。双侧1－α可信区间单侧1－α可信区间或例:随机检查140例成年男子的红细胞数得：试估计该地成年男子红细胞数95％可信区间。（4.79－1.96×0.42/,4.79+1.96×0.42/）=(4.72×,4.86×)例3-3某地抽得正常成人200名，测得其血清胆固醇的均数为3.64mmol/L，标准差为1.20mmol/L，试估计该地正常成人血清胆固醇均数的95%可信区间。故该地正常成人血清胆固醇均数的95%可信区间为（3.47，3.91）mmol/L。(3)σ已知，按u分布双侧1－α可信区间单侧1－α可信区间或2.两总体均数之差的可信区间双侧1－α可信区间单侧1－α可信区间或为两均数之差标准误，计算公式：为合并方差当两样本含量均大于60，可用u值代替t值进行估计，也可用以下公式计算：例3-4为了解甲氨蝶呤(MTX)对外周血IL-2水平的影响，某医生将61名哮喘患者随机分为两组。其中对照组29例()，采用安慰剂；试验组32例()，采用小剂量甲氨蝶呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10IU/ml()，标准差为7.02IU/ml()；试验组治疗前IL-2的均数为16.89IU/ml()，标准差为8.46IU/ml()。问两组治疗前基线的IL-2总体均数相差有多大？故两组治疗前基线的IL-2总体均数之差的95％可信区间为（－0.79，7.21）IU/ml。三、可信区间的确切含义和两个要素如果能够进行重复抽样试验，平均有1－α的可信区间包含了总体参数，而不是总体参数落在该范围的可能性为1－α。可信区间的两个要素：(1)准确度：包含总体参数的概率大小；(2)精密度：可信区间的长度。注意准确度和精密度的关系增加样本含量可提高精密度四、总体均数可信区间与参考值范围的区别；可信区间参考值范围含义计算用途（双侧大样本）（95％）估计总体均数判断个体指标正常与否是指包含μ在内的范围，或样本均数的分布范围。是指正常人某指标（观察值）的波动范围。第四节假设检验(hypothesistest)例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？已知总体未知总体≠？图3－4例3－5示意图一、假设检验的概念：先对总体参数或分布作出某种假设，然后用适当的方法计算检验统计量，根据该检验统计量的分布理论，推断假设是否拒绝。二、假设检验的种类：根据检验目的分为：差别性检验、方差齐性检验、拟合优度检验、正态性检验、均衡性检验等。根据检验统计量命名分为：三、假设检验的意义:通过对事物数量差异的比较分析，判断事物间有无质量区别。四、假设检验的基本思想：小概率反证法思想。五、假设检验的一般步骤以例3-5为例，说明假设检验的一般步骤：建立假设，确定检验检验水准：（1）检验假设H0：μ=μ0，（2）备择假设H1：μ≠μ0，双侧检验。注意：①针对总体；②相互联系、相互对立，缺一不可；③情况不同假设不同；④单、双侧检验时H1不同。单、双侧检验两个指标比较时,从专业角度考虑：如果甲指标大于乙指标或甲指标小于乙指标都可能发生则为双侧检验；如果甲指标不可能大于（或小于）乙指标,只需检验是否小于（或大于）乙指标则为单侧检验。表3－3样本均数（代表未知）与已知总体均数比较的t检验目的双侧检验是否单侧检验是否是否检验水准符号为α，它是人为规定的小概率事件的判断标准，即H0拒绝与否的概率界限，或犯第一类错误的概率，一般取0.05。2.选定检验方法，计算检验统计量：检验方法的选择依据有：资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。本例选择单样本t检验：（为什么？）（3）检验水准3.确定P值，作出推断和结论：P值的大小根据检验统计量的理论界值表查得。本例自由度ν＝35，查t值表得t0.05/2,35=2.030，t0.02/2,35=2.438，2.030<2.138<2.438，故0.02<P<0.05。当P>α时，无统计学意义，不拒绝H0；P≤α时，有统计学意义，拒绝H0，接受H1。本例P<0.05,即P<α，故拒绝H0,接受H1。结论：可以认为从事铅作业的男性工人平均血红蛋白含量低于正常男性。第五节t检验一、单样本t检验（样本均数与总体均数比较）二、配对样本t检验（配对设计比较）三、两样本t检验（成组比较）四、几何均数比较的t检验先将观察值进行对数变换，再用上述均数比较的方法进行检验。（52页）五、t检验的条件：1.小样本资料；2.正态分布资料；3.组间比较时要求总体方差相等。六、u检验（48页）：当n>60，t分布接近u分布，或者已知总体标准差（σ）时均可采用u检验。一、样本均数与总体均数比较1.总体标准差已知：2.总体标准差未知，样本较大（n>60）：3.总体标准差未知，样本较小（例3－5）二、配对设计资料的t检验配对设计包括异体配对和同体配对两种。异体配对是将两个条件相近的对象配成一对，然后随机化地接受两种处理；模式：甲组……乙组……随机同体配对是对同一观察对象分别接受两种处理后的结果进行比较，又称自身配对，包括：①在两个部位用两种不同方法处理后进行比较；②先后用两种方法处理后进行比较；③同一对象的检测标本用两种方法检测；④同一对象接受一种处理前后比较等。关于一种处理前后的比较是一种特殊的同体配对设计，又可称为前后测量设计，见第十二章，262页。配对t检验步骤如下:(设定d为正态分布)补充例子：1：H0:=0;H1:>0，单侧检验，α=0.05，单侧。2：计算t值：三棱莪术液抑瘤实验的结果对子数对照组注射药液组差值（）13.63.00.60.3624.52.32.24.8434.22.41.83.2444.41.13.310.8953.74.0-0.30.0965.63.71.93.6177.02.74.318.4984.11.92.24.8495.02.62.45.75104.51.33.210.24合计------21.662.363.确定P值，作出判断和结论：计算自由度=10－1=9，查t值表得单侧因5.167>1.833，故P<0.05。按=0.05水准，拒绝H0，接受H1。可以认为三棱莪术液有抑瘤作用。例3-6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同，随机抽取了10份乳酸饮料制品，分别用脂肪酸水解法和哥特里－罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同？编号哥特里－罗紫法脂肪酸水解法差值d(1)(2)(3)(4)=(2)(3)10.8400.5800.26020.5910.5090.08230.6740.5000.17440.6320.3160.31650.6870.3370.35060.9780.5170.46170.7500.4540.29680.7300.5120.21891.2000.9970.203100.8700.5060.3642.724表3-5两种方法对乳酸饮料中脂肪含量测定结果（1）建立检验假设，确定检验水准H0:=0;H1:≠0，α=0.05，双侧检验。（2）计算检验统计量：（3）确定P值，作出判断和结论：查t值表得：按α=0.05水准拒绝H0，接受H1，可以认为两种方法对脂肪含量的测定结果不同，哥特里-罗紫法的测定结果高于脂肪酸水解法。100例随机化甲组乙组…………分为两组的简化模式完全随机设计：三、完全随机设计两小样本均数比较本设计是单因素两水平或多水平的实验设计类型。它是将受试对象完全按随机原则分配到各处理组，试验结束后比较各组均数（或率）之间的差别有无统计学意义，推论处理因素的效应。因素视为分组，水平即为组数。1.总体方差相等（且呈正态分布）两小样本均数比较表3－6试验组和对照组空腹血糖下降值（mmol/L）试验组X1－0.70－5.602.002.800.703.504.005.857.10－0.50n1=202.50－1.601.703.000.404.504.602.506.00－1.40对照组X23.706.505.005.200.800.200.603.406.60－1.10n2=206.003.802.001.602.002.201.203.101.70－2.00例3-7为研究国产四类新药阿卡波糖胶囊的降血糖效果，某医院用40名2型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜糖平胶囊)，分别测得试验开始前和8周后的空腹血糖，算得空腹血糖下降值见表3-6，能否认为该国产四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同？(1)H0:μ1=μ2;H1:μ1≠μ2,α=0.05，双侧检验。(2)求t值：本例n1=20，，S1=3.0601;n2=20,，S2=2.4205。代入公式，最终求得t=0.642(3)确定P值,判断结论：本例自由度为38，查t值表双侧得t0.5/2,38=0.681。0.642<0.681，P>0.50。按α=0.05水准不拒绝H0，无统计学意义，还不能认为两组降血糖效果不同。两大样本均数比较：当两样本较大，如均大于60，可按正态分布原理采用u检验。2.方差不齐时的Cochran&Cox近似t检验统计量界值说明：（1）检验是在方差不齐时需对t值的界值作校正的检验方法，（2）当n1=n2时，可用t检验代替检验，但是查t值表时自由度应改用（n-1）。（3）当n1=n2都较大时，可直接用t检验或u检验。当n1=n2时，公式变为：当n1=n2时，例3-8在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中，测得用拜糖平胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人，其8周时糖化血红蛋白HbA1c(%)下降值如表3-7。问用两种不同药物的病人其HbA1c下降值是否不同？分组n对照组201.461.36试验组201.130.70表3-7对照组和试验组HbA1c下降值(%)（1）建立检验假设，确定检验水准H0:μ1=μ2;H1:μ1≠μ2,α=0.05，双侧检验。（2）计算检验统计量：(3)确定P值,判断结论：本例n1=n2，故直接取自由度为19，查t值表双侧得t0.05/2,19=2.093。0.965<2.093，P>0.05。按α=0.05水准不拒绝H0，无统计学意义，还不能认为两组病人的HbA1c下降值不同。3.方差不齐时的Satterthwaite近似t检验（略）4.方差不齐时的Welch近似t检验（略）以上两种方法是对自由度进行校正的近似t检验。第六节假设检验的注意事项一、Ⅰ型错误和Ⅱ型错误由于假设检验结果的判断是采用小概率原理，在某个α水准上作出的，具有概率性质，因此结果的判断不可能绝对准确。将拒绝假设时所犯错误称为Ⅰ型错误，用α表示；将接受假设时所犯错误称为Ⅱ型错误，用β表示。两类错误的关系：α小β大；α大β小。两类错误的控制：差别性检验:减少α控制Ⅰ型错误。方差齐性检验、拟合优度检验、正态性检验、均衡性检验等需要控制Ⅱ型错误，应加大α，一般取0.10或0.20。增大样本含量可同时减少两型错误。（1－β）称为检验效能，其意义为，如果两总体确有差异，按α水准所能发现该差异的能力。αβ成立1－α1－β图3－6Ⅰ型错误和Ⅱ型错误示意图(以单侧u检验为例)界值成立表3－8可能发生的两类错误假设检验的结果拒绝“接受”成立Ⅰ型错误（α）推断正确（1－α）成立推断正确（1－β）Ⅱ型错误（β）客观实际二、假设检验中应注意的问题注意假设检验的前提：可比性。注意正确选择检验方法检验方法的选择依据有：资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。3.注意合理确定单、双侧检验：单、双侧的确定完全取决于专业知识，用于两个指标比较的t检验u检验。单侧检验更容易拒绝H0。4.注意科学地解释假设检验的结论：(1)假设检验的结论并非绝对正确。(2)P值大小不代表差别大小。(3)注意差别大小有无专业上的实际意义。6.影响假设检验结论的因素：（1）差别大小、（2）个体差异大小、（3）n大小、（4）单、双侧检验、（5）检验水准等。7.注意可信区间与假设检验的区别和联系（1）可信区间是推断包含总体均数的范围，假设检验是推断两总体均数是否不等。（2）可信区间与假设检验的结论一致例3－5资料从事铅作业工人血红蛋白总体均数的95％可信区间为（122.12，139.54）不包括正常成年男性血红蛋白总体均数140g/L,故可认为，从事铅作业工人血红蛋白平均含量低于正常成年男性血红蛋白。（3）可信区间计算应预先规定概率，假设检验则可获得较为确切的概率。（4）可信区间比与假设检验能提供更多的信息H01图3－7可信区间在统计推断上提供的信息有实际专业意义的值65432第七节正态性检验检验与方差齐性检验一、正态性检验1.图示法（1）概率图（P-P图）图3－8（1）分位数图（Q-Q图）图3－92.计算法（1）矩法（2）W检验法（3）W’检验法（3）D检验法偏度系数（coefficientofskewness）偏度是指分布不对称的程度和方向。矩法检验峰度系数（coefficientofkurtosis）峰度是指与正态分布相比峰的冒尖或扁平程度。在理想状态下，对称分布，大于0为正偏态，小于0为负偏态；对称分布，大于0为尖峭峰，小于0为平阔峰。－u检验偏度系数标准误峰度系数标准误例3－9对模拟随机抽样所得100个样本均数进行正态性检验：本例求得：经查表，两者u值均小于0.684，故P大于0.50，不拒绝H0,还不能认为该资料不服从正态分布。二、两组方差齐性检验采用F检验，F值计算公式如下：如果经检验方差齐性，则可采用t检验，否则应采用检验、秩和检验或采用变量变换的法。F分布:（1）定义公式：、分别为两个相互独立的随机变量，、分别为它们的自由度。分母自由度为10，分子自由度(m)分别为4、10、50、时Ｆ分布密度函数图形f(F)F（2）分布曲线：F分布为一簇单峰正偏态分布曲线，取决于分子和分母两个自由度。分子自由度为10，分母自由度(n)分别为4、10、50、时Ｆ分布密度函数的图形f(F)F（3）实际分析时F值的计算：（4）F分布与t分布、u分布的关系为：（5）F分布曲线下的面积分布附表3F界值表（806页）等。、MS为平均方差例3－10对例3－7资料作方差齐性检验，，查F界值表得，1.598<2.15,故P大于0.10，不拒绝H0,还不能认为两组总体方差不等。（故该资料可采用t检验）注意：例3－11对例3－8资料作方差齐性检验查F界值表得，3.775>2.15,故P小于0.10，拒绝H0,接受H1可以认为两组总体方差不等。（故该资料应采用检验），，，,三、变量变换1.变量变换的意义：变量变换是指将原变量（原始数据）变换成某种函数值，达到正态分布、方差齐性、曲线的直线化等目的，以满足分析方法对资料的要求。常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等。2.变量变换的方法：（1）对数变换：用于：正态化变换－对数正态分布资料。方差齐性变换－标准差与均数成比例或变异系数接近某常数时的方差不齐资料。直线化变换－曲线关系资料。（2）平方根变换：或用于：正态化变换－泊松分布资料、轻度偏态资料。方差齐性变换－方差与均数呈正比关系时的方差不齐资料。（3）平方根反正弦变换：（1）用角度表示：（2）用弧度表示：用于观察值为百分数且分布较偏的资料，特别是百分数离散度大的资料，可使资料接近正态分布，并达到方差齐性要求。

                    本文档为【总体均数的估计与假设检验综述】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：￥10.0 已有0 人下载

立即下载

总体均数的估计与假设检验综述

你可能还喜欢