首页 4 总体均数的估计和假设检验

4 总体均数的估计和假设检验

举报
开通vip

4 总体均数的估计和假设检验李亚超公共卫生系流行病与卫生统计学教研室2018年7月26日星期四总体均数的估计复习【1-3题共用题干】成都市50岁及以上妇女骨质疏松抽样调查中,研究对象的年龄直方图如下:1.研究对象年龄的分布形式为:A对称分布B正偏态分布C负偏态分布D正态分布E分布形式未知2.根据上图,描述年龄集中位置应选择:ABXCGDMEMo3.根据上图,描述年龄离散程度应选择:ARBIQRCSDECV复习4.设正态分布X~N(,2),则正态分布曲线下[1.96,+1.65]之间的面积为:A90% B92.5% C...

4 总体均数的估计和假设检验
李亚超公共卫生系流行病与卫生统计学教研室2018年7月26日星期四总体均数的估计复习【1-3题共用题干】成都市50岁及以上妇女骨质疏松抽样调查中,研究对象的年龄直方图如下:1.研究对象年龄的分布形式为:A对称分布B正偏态分布C负偏态分布D正态分布E分布形式未知2.根据上图,描述年龄集中位置应选择:ABXCGDMEMo3.根据上图,描述年龄离散程度应选择:ARBIQRCSDECV复习4.设正态分布X~N(,2),则正态分布曲线下[1.96,+1.65]之间的面积为:A90% B92.5% C95%D97.5%E99%5.利用抽样研究制定男性血红蛋白95%医学参考值范围,下列说法错误的是:A该范围为95%的“正常”男性血红蛋白测量值的波动范围B理论上有95%的“正常”男性血红蛋白测量值在该范围内C应同时制定该区间的上限和下限D若男性HB服从正态分布,可用计算E男性血红蛋白总体均数有95%可能性在该范围内内容提要抽样误差(samplingerror)由于个体变异引起的,在抽样过程中发生的,总体参数与样本统计量之间的差异产生原因:个体变异产生条件:抽样研究表现形式:样本统计量与总体参数之间的差异度量指标:标准误(standarderrorofmean,SEM)统计符号:从总体N(6.0,1.52)中进行随机抽样样本例数n分别为10、30、50、100每种样本含量下进行100次抽样计算样本均数和标准差S数学模拟——样本均数的抽样分布从总体N(6.0,1.52)中抽出100个样本的均数、标准差SampleIDn=10n=30n=50n=100SSSS16.321.186.081.465.771.766.271.5425.691.185.771.376.201.285.961.5836.411.316.031.256.491.506.071.6246.831.346.471.475.781.015.941.3856.281.505.821.806.291.575.941.56………………………995.661.745.671.265.991.366.041.401005.521.385.871.545.891.485.991.52均数6.0126.0236.0406.036标准差0.5150.2500.2000.136不同抽样例数100次抽样中样本均数和总体均数之间的关系样本统计量和总体参数间的关系样本统计量总是围绕着总体参数上下波动,不会离开总体参数太远样本统计量是个变量总体参数和样本统计量之间总是存在一定差异当样本量n时,样本统计量无限的逼近于总体参数抽样误差(samplingerror)由于个体变异引起的,在抽样过程中发生的,总体参数与样本统计量之间的差异产生原因:个体变异产生条件:抽样研究表现形式:总体参数与样本统计量之间的差异度量指标:标准误总体参数的估计点估计:直接用样本统计量的值估计总体参数的值样本均数估计总体均数来自有代表性的样本样本量越大,估计的精度越高抽样误差客观存在——总体参数和样本统计量之间总是存在一定差异抽样误差(samplingerror)由于个体变异引起的,在抽样过程中发生的,总体参数与样本统计量之间的差异产生原因:个体变异产生条件:抽样研究表现形式:样本统计量与总体参数之间的差异度量指标:标准误(standarderrorofmean,SEM)统计符号:内容提要样本均数直方图样本均数直方图频数样本统计量的标准差(SE)刻画样本统计量的变异性说明样本统计量抽样误差大小的指标,该值越大说明抽样误差越大:样本均数的标准差:抽样研究中未知时的估计s估计:Bootstrap法标准误(standarderror)样本均数的抽样分布引例设大学生早餐前血糖水平X~N(6.0,1.52),随机抽取100名大学生进行血糖测量。大学生早餐前血糖的分布大学生早餐前血糖样本均数的分布样本均数的抽样分布已知未知X不服从正态分布n足够大中心极限定理内容提要t分布为高斯特(WilliamSealyGosset)于1908年所推导,并以笔名Student发表,故又名学生氏t分布(Student’st-distribution)总体标准差未知,尤其当样本量较小时,说明样本均数与总体均数关系的概率分布形式t分布曲线tf(t)不同自由度下的t分布曲线t分布曲线的特征钟形曲线以0为中心,左右对称,均匀下降单峰曲线以x轴为其渐近线与自由度有关的一簇曲线自由度越小,则t值越分散,曲线越低平自由度逐渐增大时,t分布曲线逐渐逼近标准正态分布曲线当=时,t分布即为标准正态分布t分布曲线的特征t分布曲线为的概率密度曲线相应区间的曲线下面积为该区间t值的发生概率曲线下总面积仍为1或100%tt分布曲线总体标准差未知,尤其当样本量较小时,说明样本均数与总体均数关系的概率分布形式总体均数的估计t检验t分布的用途tt分布曲线t界值自由度概率,P单侧0.2500.2000.1000.1500.0500.0250.0100.0050.00250.0010.0005双侧0.5000.4000.2000.3000.1000.0500.0200.0100.0050.0020.00111.0001.3763.0781.9636.31412.70631.82163.657127.321318.309636.61920.8161.0611.8861.3862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6381.2502.3533.1824.5415.8417.45310.21512.92440.7410.9411.5331.1902.1322.7763.7474.6045.5987.1738.61050.7270.9201.4761.1562.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.1341.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.1191.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.1081.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.1001.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.0931.8122.2282.7643.1693.5814.1444.587………………………………∞0.6740.8421.2821.0361.6451.9602.3262.5762.8073.0903.291|t|界值表(P439)P(|t|>t#)P(t<-t#)orP(t>t#)t界值t0.05/2,10=2.228t0.025,10=2.228双侧:P(t≤-t/2,)+P(t≥t/2,)=单侧:P(t≤-t/2,)=/2或P(t≥t/2,)=/2中间:P(-t/2,≤t≤t/2,)=1-总体参数的估计点估计:直接用样本统计量的值估计总体参数的值样本均数估计总体均数来自有代表性的样本样本量越大,估计的精度越高抽样误差客观存在——总体参数和样本统计量之间总是存在一定差异总体均数的估计总体均数估计的两种方法点估计:是直接用样本均数估计总体参数.区间估计:由于抽样误差的客观存在,因而按一定的概率1-,在一定分布基础上,估计总体均数所在的区间,并使得该区间包含总体均数的概率为1-该区间称为可信区间或置信区间(confidenceinterval)1-称为置信水平或置信度(confidencelevel)双侧:P(t≤-t/2,)+P(t≥t/2,)=单侧:P(t≤-t/2,)=/2或P(t≥t/2,)=/2中间:P(-t/2,≤t≤t/2,)=1-样本均数的抽样分布样本均数的抽样分布经过转换已知未知未知,n足够大未知未知,但n足够大已知1-可信区间的计算已知条件分布形式公式已知Z分布未知t分布未知,n足够大近似Z分布1-可信区间的计算公式例6.2在某地成年男子中随机抽取25人,测得其脉搏均数为72次/min,标准差为8次/min。试估计该地成年男性脉搏总体均数。根据样本信息,可推断该地成年男性脉搏总体均数:点估计值为72次/分95%可信区间为(68.7,75.3)次/分可信区间的两个要素可信区间的两个要素准确度:可信区间包含总体均数的可能性大小反映在置信度1-的大小上从准确度的角度看,愈接近1愈好如可信度99%比95%好精密度反映在可信区间的长度上长度愈小愈好可信区间的两个要素在抽样误差确定的情况下,二者是相互矛盾的若提高准确度,即提高可信度,可信区间势必增大,精密度下降若提高精密度,可信区间势必减小,即可信度下降,准确度下降一般情况下,同时兼顾准确度与精密度,常用95%可信区间 总结 初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf 样本统计量与总体参数的差异抽样研究中难以避免的误差可用标准误度量其大小说明样本均数与总体均数间关系的概率分布形式未知时,说明样本均数与总体均数关系的概率分布形式2014国家医师资格考试大纲要求课后习题抽样研究的目的:利用获得样本信息,推断总体特征为了解大学生早餐前血糖水平,共对100名大学生进行了调查如何估计=6.0mmol/L李亚超公共卫生系流行病与卫生统计学教研室2018年7月26日星期四假设检验假设检验在抽样前先对未知的总体作出一些假定;例如假定并且正态总体的均数为某已知数。我们把这类关于总体分布的假定称为假设抽样前所作的假设是否与实际相符合,可以用样本所提供的信息来检验,检验的方法与过程称为检验例7.3设血红蛋白服从正态分布已知一般成年男子血红蛋白的均数为140g/L研究假设:随机抽取60名高原地区健康成年男性进行检查测得血红蛋白均数为155g/L,标准差为24g/L比较高原地区成年男性居民的平均血红蛋白是否高于一般正常成年男子引例引例=?g/L0=140g/L0=140g/L假设检验x=155g/L内容提要抽样研究中,利用已知的样本信息,完成未知的总体分布间比较的过程首先对未知的总体做出某种假设参数检验:已知总体分布形式,对总体参数提出假设非参数检验:对总体分布提出假设利用样本信息判断(检验)假设是否成立假设检验(Hypothesistesting)内容提要小概率反证法在一次研究或观察中,如果出现了假设成立情况下的小概率事件,由于推理过程是严密的,就只能认为假设不成立,应予拒绝或否定,并接受它的对立面假设检验的基本思想H0:A成立小概率事件在H0成立基础上推出有利于H1成立的小概率事件发生未发生小概率事件,不等于H0成立一般期望出现的结论应置于H1小概率事件不可能事件,假设检验可能犯错误统计学只是决策的参考假设检验的基本思想内容提要建立检验假设,确定检验水准选定检验方法,计算检验统计量确定P值,作出统计推断假设检验的步骤①②③假设的分类H0:无效假设(nullhypothesis)H1:备择假设(alternativehypothesis)假设的提出根据统计推断的目的:研究假设总体分布特征提出的一对相互对立的假设1.建立检验假设,确定检验水准H0:=140g/L,高原地区成年男子平均Hb量与一般人群相等H1:>140,高原地区成年男子平均Hb量高于一般人群=0.051.建立检验假设,确定检验水准H10>0<0H0=0=0=0建立检验假设,确定检验水准样本均数所代表的未知总体均数与已知总体均数0的比较中,单侧检验和双侧检验假设的形式检验形式目的研究假设双侧检验是否00单侧检验是否>0>0是否<0<0检验假设的形式检验水准(significancelevel),以表示是小概率事件在本次假设检验中发生概率水平在进行假设检验前设定习惯上取=0.05或0.011.建立检验假设,确定检验水准建立检验假设,确定检验水准选定检验方法,计算检验统计量确定P值,作出统计推断假设检验的步骤利用一次抽样获得的样本均数155g/L,完成量总体均数的比较2.选定检验方法,计算检验统计量H0:=0=140g/L未知n=60,x=155g/L,s=24g/L建立检验假设,确定检验水准选定检验方法,计算检验统计量确定P值,作出统计推断假设检验的步骤3.确定P值,作出统计推断自由度为59时的t分布曲线自由度概率,P单侧0.2500.2000.1000.1500.0500.0250.0100.0050.00250.0010.0005双侧0.5000.4000.2000.3000.1000.0500.0200.0100.0050.0020.00111.0001.3763.0781.9636.31412.70631.82163.657127.321318.309636.61920.8161.0611.8861.3862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6381.2502.3533.1824.5415.8417.45310.21512.92440.7410.9411.5331.1902.1322.7763.7474.6045.5987.1738.610………………………………300.6830.8541.3101.0551.6972.0422.4572.7503.0303.3853.646400.6810.8511.3031.0501.6842.0212.4232.7042.9713.3073.551500.6790.8491.2991.0471.6762.0092.4032.6782.9373.2613.496600.6790.8481.2961.0451.6712.0002.3902.6602.9153.2323.460700.6780.8471.2941.0441.6671.9942.3812.6482.8993.2113.435………………………………∞0.6740.8421.2821.0361.6451.9602.3262.5762.8073.0903.291|t|界值表(P316)3.确定P值,作出统计推断P=P(t4.84)自由度为59时的t分布曲线1.6714.84P:在H0所成立的条件下,获得现有样本统计量及比之更极端的概率<0.0005若P,在H0成立条件下发生了小概率事件按=0.05水准拒绝H0,接受H1,差异有统计学意义可以认为高原地区成年男子平均Hb量高于一般人群若P>,在H0成立的条件下,未发生小概率事件,现有样本信息还不足以拒绝H0按=0.05水准,不拒绝H0,差异无统计学意义尚不能认为高原地区成年男子平均Hb量高于一般人群确定P值,作出统计推断确定P值,作出统计推断须说明水准,水准不同结论不同差异是否有统计学意义差异本身大小P,按=0.05水准,拒绝H0,接受H1,差异有统计学意义P>,按=0.05水准,不拒绝H0,差异无统计学意义确定P值,作出统计推断结论不能绝对化应针对分析目的作出结论P,可以认为+高原地区成年男子平均Hb量高于一般人群P>,尚不能认为+高原地区成年男子平均Hb量高于一般人群1.建立检验假设,确定检验水准H0:=0=140g/LH1:>0单侧=0.052.选定检验方法,计算检验统计量3.确定P值,作出统计推断查附表3,得P<0.0005,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为高原地区成年男子平均Hb量高于一般人群引例完整步骤复习:假设检验①②③抽样研究中,利用已知的样本信息,完成未知的总体分布间比较的过程小概率反证法:建立在概率基础上的反证法属于统计推断:利用样本信息推断总体特征比较高原地区成年男性居民的血红蛋白均数是否高于一般正常成年男子设血红蛋白服从正态分布引例内容提要错误:假设检验结果与客观事实相违背推断结果与实际情况的关系客观实际假设检验结果Ⅱ型错误(typeⅡerror):没有拒绝实际不成立的H0,即“存伪”Ⅰ型错误(typeⅠerror):拒绝了实际成立的H0,即“弃真”推断正确推断错误推断错误推断正确检验效能H0:=0=140g/L●●●●错误:假设检验结果与客观事实相违背假设检验中犯错误的概率客观实际假设检验结果犯错误的概率为,一般未知犯错误的概率为推断正确Ⅰ型错误Ⅱ型错误推断正确推断正确的概率为1-推断正确的概率为1-(检验效能,Power)结论不能绝对化P,拒绝H0,接受H1,可能犯Ⅰ型错误差异有统计学意义,可以认为不同总体间存在差异差异有统计学意义,避免使用差异具有显著性统计学意义和专业意义的区别P>,不拒绝H0差异无统计学意义,尚不能认为不同总体间存在差异接受H0,可能犯Ⅱ型错误两类错误与结论内容提要调整水准多重假设检验(multiplehypothesistesting):m个单次假设检验作为一个整体,只要有一次检验有统计学意义即可接受全局备择假设常见于多组检验、多指标检验累积Ⅰ型错误概率Bonferroni校正Ⅰ型错误的控制的影响因素1.,的影响因素1.,2.,的影响因素1.,2.,3.X,X=n,,错误:假设检验结果与客观事实相违背假设检验中犯错误的概率1.,2.,3.,4.n,客观实际假设检验结果犯错误的概率为,一般未知犯错误的概率为推断正确Ⅰ型错误Ⅱ型错误推断正确推断正确的概率为1-推断正确的概率为1-(检验效能,Power)调整水准:提高到0.1或0.2主要针对需要接受H0的情况正态性检验方差齐性检验增大样本例数Ⅱ型错误的控制假设检验需要注意的问题数据应来自设计科学的实验或调查样本的代表性可比性/均衡性:比较的基础数据应该满足假设检验方法的前提条件正确理解假设检验中概率值的含义差异有统计学意义与差异大小的区别结论不能绝对化统计学意义和专业意义的区别总结抽样研究中,利用已知的样本信息,完成未知的总体分布间比较的过程小概率反证法1.建立检验假设,确定检验水准2.选定检验方法,计算检验统计量3.确定P值,作出统计推断假设检验推断结果与事实不符P≤时可能发生Ⅰ型错误,概率为P>时可能发生Ⅱ型错误,概率为某人对成都市正常成年人的血糖进行了抽样调查,假设检验发现男性与女性血糖的差异有统计学意义(P≤),而专业上认为性别对正常成年人的血糖没有影响。应如何理解该结果?有人认为与其样本含量过大有关,你是否认同?思考:为何本例H0:=0=140g/L可以省略小于号?课后思考题课后作业为说明A、B两药治疗缺铁性贫血的效果,将18名某病患者随机分成两组,分别用药物A或药物B治疗,同步观察治疗前后血色素变化,结果见表7-1若定义差值>11g/L为有效,试说明A药是否有效 A药患者编号123456789治疗前364453566258454326治疗后476268877358694950 B药患者编号123456789治疗前564967587340483629治疗后818670628476584960表7-1贫血患者经A、B两药治疗前后血色素的变化结果(g/L)
本文档为【4 总体均数的估计和假设检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
罗微
暂无简介~
格式:ppt
大小:4MB
软件:PowerPoint
页数:0
分类:
上传时间:2018-07-26
浏览量:47