首页 假设检验

假设检验

举报
开通vip

假设检验第七章假设检验一、教材说明本章主要讲假设检验的基本思想与概念、正态总体参数的假设检验这2节的内容.1、本章的教学目的与要求(1)使学生了解假设检验的基本概念;(2)使学生了解假设检验的基本思想;(3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题.2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定...

假设检验
第七章假设检验一、教材说明本章主要讲假设检验的基本思想与概念、正态总体参数的假设检验这2节的内容.1、本章的教学目的与要求(1)使学生了解假设检验的基本概念;(2)使学生了解假设检验的基本思想;(3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题.2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定.二、教学内容下面主要分2节来讲解本章的主要内容.§7.1假设检验的基本思想与概念教学目的:要求学生了解假设检验的基本思想,理解假设检验的基本概念,认识假设检验问题,熟悉假设检验的基本步骤.教学重点:基本概念,假设检验的基本步骤.教学难点:基本概念的理解.教学内容:本节内容包括假设检验的基本概念,假设检验的基本步骤.7.1.1假设检验的基本概念1.统计假设、原假设、备择假设把任意一个有关未知分布的假设统称为统计假设,简称假设.例7.1.1某厂生产的合金强度服从正态分布N(,16),其中的 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 值为不低于110(Pa),为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa),某天从生产中随机抽取25块合金,测得强度值为x,x,,x,其均值为x108(Pa),问当时生产是否正常?1225如果生产是正常进行的,则合金平均强度不低于110(Pa),而合金强度服从N(,16),故平均强度110,如果生产不正常,则110.现在的问题是据样本得到的信息来判断110还是110,此问题不是参数估计问题,而是一假设检验问题.这样对未知参数,提出两个对立的假设:称H:110为原假设,H:110为备01择假设.通常将不应轻易加以否定的假设做为原假设,以H记,当H被拒绝时而接受的假00设称为备择假设,用H 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示.12.参数假设、非参数假设参数假设:总体分布类型已知,对分布中的未知参数的假设.非参数假设:不同于参数假设的其他假设(包括对母体分布函数的类型及分布的某些特征的假设).我们的任务就是根据样本得到的信息,在原假设H与备择假设H两者中做出一个判01断:拒绝还是接受H.07.1.2假设检验的基本步骤1、建立假设依据实际问题建立一对假设,例7.1.1的假设为H:110vsH:110012、选择检验统计量,给出拒绝域形式在H与H两者中做出一个选择,也即完成一次判断,必须建立一个检验法则,而由01样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量.一般而言,检验统计量的选择应该使在H、H分别成立时,统计量的值有较大差异,从而能够做出01判断.在例7.1.1中,样本均值x就是一个很好的检验统计量,它是总体参数的无偏估计.样本均值x愈大,意味着总体均值也大;样本均值愈小,意味着总体均值也小.由于样本的随机性,只有当x小到一定程度,则应认为原假设H不正确.故在样本均值x的取值0中有一个临界值C(待定),使得当xC时,认为H不正确,也即拒绝H,此时称00W{x:xC}为该检验的拒绝域,当xC时,认为H正确,则接受H,对应的00W{x:xC}为该检验的接受域.一般地,使原假设H被拒绝的样本观测值所在区域称为拒绝域,记为W,从而规定:0当(x,,x)W时,拒绝H;当(x,,x)W时,接受H.从而一个拒绝域W唯1n01n0一确定一个法则.3、选择显著性水平通常0.05,0.01,0.1.4、给出拒绝域W利用统计量T(x,,x),使得1nP(T(x,,x)WH为真)1n05、做判断将样本观测值代入检验统计量,看该统计量的值是否落入拒绝域W,当T(x,,x)W时,拒绝H,当T(x,,x)W时,接受H.1n01n0三、假设检验的两类错误与势函数1、两类错误对给出的拒绝域W,由于样本的随机性,我们做出的判断不可能100%正确,它可能会犯两类错误:第一:H为真时,(x,,x)W,从而拒绝H.这种错误称为第一类错误,其发生01n0的概率称为犯第一类错误的概率或拒真概率,通常记为,即=P(拒绝HH为真)=P(T(x,,x)WH为真)001n0=P[(x,,x)W],1n0第二:在H不真时,(x,,x)W,从而接受H.这种错误称为第二类错误,其01n0发生的概率称为犯第二类错误的概率或受伪概率,通常记为,即=P(接受HH不真)=P(T(x,,x)WH不真)001n0=P[(x,,x)W]1P[(x,,x)W],1n1n12、势函数定义7.1.1设检验问题H:vsH:的拒绝域为W,则样本观测值0011(x,,x)落入拒绝域W内的概率称为该检验的势函数,即1ng()P[(x,,x)W],1n01其中,是参数空间两个互不相交的子集.01注由以上、及势函数的定义知(),g()01(),13、两类错误的关系xccc对例7.1.1,W{x:xc},故g()P[xc]P()(),454545从而犯两类错误的概率(),()分别为:c()(),450c()1(),451从而当减少时,c也减少,而c的减少必导致的增大;当减少时,c会增大,而c的增大必导致的增大,故得到两类错误的关系:(1)在样本容量n一定时,、不能同时小,的增大必导致的减少;的减少必导致的增大;(2)要使、同时小,则必须n充分大,但这又是不现实的.为此,采用折中的方法:控制,使尽量小,但有时这样的检验也不存在,从而我们只控制,而不管,此时求拒绝域W只涉及原假设H,而不管备择假设H.014、水平为的显著性检验定义7.1.2对检验问题H:vsH:,如果一个检验满足对任意的0011,都有0g()则称该检验是显著性水平为的显著性检验,简称水平为的检验.c在例7.1.1取0.05,则110有g()()0.05,由于g()是的减函45c1105数,故只须g(110)()0.05,即[(c110)]0.0545455从而[(110c)]0.95(110c)1.645c1100.81.645108.68444拒绝域为W{x:x108.684},又因为x108108.684,所以拒绝H,认为该日生产不正常.0§7.2正态总体参数假设检验教学目的:理解和掌握单个以及两个正态总体均值的假设检验的方法与思想,掌握正态总体方差检验的方法.教学重点:检验方法的掌握,检验方法思想的理解.教学难点:检验方法的掌握.教学内容:本节内容包括单个正态总体均值的假设检验,两个正态总体均值差的检验,正态总体方差的检验.参数假设检验常见的有三种基本形式(1)H:vsH:0010(2)H:vsH:<0010(3)H:=vsH:0010一般来说,对这三种假设采取的检验统计量是相同的,差别在拒绝域上.当备择假设H1在原假设H一侧时的检验称为单侧检验,当备择假设H分散在原假设H两侧时的检验称010为双侧检验.(1),(2)是单侧检验,(3)是双侧检验.7.2.1单个正态总体均值的假设检验设x,x,,x是来自正态总体N(,2)的样本,对均值考虑如下的检验:12nH:vsH:(1)0010H:vsH:(2)0010H:vsH:(3)0010一2已知时的u检验x对单侧检验(1),由于x是的无偏估计,选取统计量un故当样本均值x不超过设定均值时,应接受H,而当样本均值x超过设定均值000时,应拒绝H,但由于样本的随机性,x比大一点就拒绝H似乎不当,只有当x比0000大到一定程度时拒绝H才是恰当的.故存在临界值c,拒绝域W{(x,x,,x);uc},012n常简记为{uc}.若要求水平为,则c应满足P(uc)=,01x因为x~N(,2),故时u0~N(0,1)n0n知cu,所以拒绝域W{u;uu}.11该检验用的检验统计量是u统计量,一般称为u检验.易验证W{u;uu}是检验H:vsH:的显著性水平为的10010检验.类似地对H:vsH:的显著性水平为的拒绝域0010W{u;uu};H:vsH:的显著性水平为的拒绝域0010W{u;uu.}12例7.2.1从甲地发送一个讯号到乙地,设乙地接受到的讯号值是一个服从正态分布N(,0.22)的随机变量,其中为甲地发送的真实讯号值.现甲地重复发送同一讯号5次,乙地接受到的讯号值为8.058.158.28.18.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受该猜测?0.05 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 此时正态分布的方差已知,对均值进行检验,利用U—检验.解总体X~N(,0.22),待检验的原假设H与备择假设分别为H:01H:8vsH:8.这是一个双侧检验问题,检验的拒绝域为{u;uu},0112取=0.05,u=1.96,计算得x=8.15,u=5(8.15-8)/0.2=1.68,u值未落入拒绝域内,故0.975不能拒绝原假设,及接受原假设,可认为猜测成立.2、未知时的t检验x2u02若未知,则上述的随机变量不再是统计量,自然我们要用的无偏估n1nn(x)计s2(xx)2代替2,此时有t0,且时n1is0i1n(x)t0~t(n1),类似于2已知时均值的检验问题的讨论得到:sH:vsH:的水平为的拒绝域为W{t;tt(n1)}00101H:vsH:的水平为的拒绝域为W{t;tt(n1)}0010H:vsH:的水平为的拒绝域为W{t;tt(n1)}001012例7.2.2某厂生产的某种铝材的长度服从正态分布,其均值设定为240cm,现从该厂抽取5件产品,测得其长度为(单位:cm)239.7239.6239240239.2试判断该厂此类铝材的长度是否满足设定要求?0.05分析此时正态分布的方差未知,对均值进行检验,利用T—检验.解略.综上,关于单个正态总体均值的假设检验问题可汇总成如下的表:条检验统计量原假设H备择假设H件01及其分布拒绝域uu0012x已u0~N(0,1)uu00/n知uu0012tt(n1)0012x未t0~t(n1)s/ntt(n1)知00tt(n1)00127.2.2两个正态总体均值差的检验设x,x,,x是来自总体X服从N(,2)的样本,y,y,,y是来自总体Y服12m1112n从N(,2)的样本,且两样本相互独立,考虑如下的三种检验:22H:0vsH:0(1)012112H:0vsH:0(2)012112H:0vsH:0(3)012112主要分两种情况讨论.,已知时的两样本u检验1222此时的估计xy的分布完全已知,xy~N(,12),由此可1212mn采用u检验法,检验统计量为xyu2212mnxy在时,u~N(0,1).检验的拒绝域取决于备择假设的形式.上述三对122212mn假设检验的拒绝域分布为:W{u;uu}1W{u;uu}W{u;uu}12但未知时的两样本t检验12在222未知时,类似于单个正态总体方差未知时均值的检验,我们仍用212的无偏估计代替2,而此时可以证明2的无偏估计为:1mn(m1)s2(n1)s2s2[(xx)2(yy)2]xywmn2iimn2i1i1于是有(xy)()t12~t(mn2)11swmn从而检验统计量为xyt11swmnxy在0时,T~t(mn2).上述三对假设检验的拒绝域分布为:1211SwmnW{t;tt(mn2)}1W{t;tt(mn2)}W{t;tt(mn2)}12例7.2.3某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,从两种铸件中各抽取一个容量分别为8和9的样本,测得其硬度(一种耐磨性指标)为:镍合金76.4376.2173.5869.6965.2970.8382.7572.34铜合金73.6664.2769.3471.3769.7768.1267.2768.0762.61根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平0.05下判断镍合金的硬度是否有明显提高?解略.综上,关于两个正态总体均值差的假设检验问题可汇总成如下的表:条原假设备择假设检验统计量件及其分布拒绝域HH01uu121211xy2u~N(0,1)22uu121212mn已知uu0012tt(mn2)1212121xyt~t(mn2)11未swmntt(mn2)知1212tt(mn2)1212127.2.3正态总体方差的检验一、单个正态总体方差的2检验2设总体X~N(,2),x,x,,x是来自该总体的样本,对方差考虑如下的三12n种检验:H:22vsH:22(1)0010H:22vsH:22(2)0010H:22vsH:22(3)00101、均值未知时方差的检验1n2由于未知,s2(xx)2是的无偏估计,且22有n1i0i1(n1)S22~2(n1)20对于显著性水平,对应上述三种假设检验的拒绝域分布为:W{2;22(n1)}1W{2;22(n1)}W{2;22(n1)或22(n1)}122例7.2.4某类钢板每块的重量X服从正态分布,其一项质量指标是钢板重量的方差不得超过0.016kg2.现从某天生产的钢板中随机抽取25块,得其样本方差S2=0.025kg2.问该天生产的钢板重量的方差是否满足要求?0.05.解略.2、均值已知时方差的检验n2(x)i此时,检验统计量取为2i1,且22时200n2(x)i2i1~2(n)20故对均值已知时方差的三种检验,我们只需将均值未知时方差的三种检验中2—分布的自由度变一下就可得到检验的拒绝域.综上,关于单个正态总体方差的假设检验问题可汇总成如下的表:条原假设备择假设检验统计量件及其分布拒绝域HH01222222(n)001n2已(x)2222i22(n)知002i1~2(n)2022(n)12222200或22(n)2222222(n1)001(n1)S22~2(n1)20未222222(n1)知0022(n1)12222200或22(n1)2二两个正态总体方差比的F检验设x,x,,x是来自总体X服从N(,2)的样本,y,y,,y是来自总体Y服12m1112n从N(,2)的样本,且两样本相互独立,考虑如下的三种检验:22H:22vsH:22(1)012112H:22vsH:22(2)012112H:22vsH:22(3)012112此处,均未知,s2,s2分别表示总体X、Y的样本方差,易知12xyE(s2)2,E(s2)2x1y2从而建立检验统计量s2Fxs2ys2当22时,Fx~F(m1,n1),此时,上述三个检验的拒绝域分别为:12s2yW{F;FF(m1,n1)}1W{F:FF(m1,n1)}W{F:FF(m1,n1)或FF(m1,n1)}122例7.2.5甲、乙两台机床加工零件,零件的直径服从正态分布,总体方差反映了加工的精度,为比较两台机床的加工精度有无区别,现从各自加工的零件中分别抽取7件产品和8件产品,测得直径为:X(机床甲)16.216.415.815.516.715.615.8Y(机床乙)15.916.016.416.116.515.815.715.0取0.05.解略.综上,关于两个正态总体方差比的假设检验问题可汇总成如下的表:条原假设备择假设检验统计量件及其分布拒绝域HH012222FF(m1,n1)1121212222S2FF(m1,n1)1012Fx~F(m1,n1)S22yFF(m1,n1)未122222知1212或FF(m1,n1)2§7.3其他分布参数的假设检验教学目的:了解指数分布参数的假设检验,比例的检验,大样本检验,会解决简单的实际问题.教学重点:对于检验方法的理解.教学难点:解决简单的实际问题.教学内容:本节内容包括指数分布参数的假设检验,比例p的检验,大样本检验,检验的p值.7.3.1指数分布参数的假设检验设x,x,,x是来自指数分布Exp(1)的样本,现考虑关于的如下检验问题:12nH:vsH:,拒绝域的自然形式是W={xc},下面讨论x的分布.0010x=n考虑的充分统计量,在0时,nx=x~Ga(n,1),由咖玛分布的性质可知i0i=12nx2=~2(2n),于是可用2作为检验统计量并利用2(2n)的分位数建立检验的0拒绝域W={22(2n)}.1-类似可得,对关于的另两种检验问题:H:vsH:<,0010H:=vsH:0010检验统计量仍是2,拒绝域分别是W={22(2n)},W={22(2n)或22(2n)}.1-22例7.3.1设我们要检验某种元件的平均寿命不小于6000h,假定元件寿命为指数分布,现取5个元件投入试验,观测到如下5个失效时间(h)3954094119115726133解:这是一个假设检验问题,检验的假设为H:6000vsH:<60000110x44626经计算x=4462.6,故检验的统计量为2===7.4377,60000若取=0.05,查表得2(10)=3.94,由于2>2(10),故接受原假设,可以认0.050.05为平均寿命不低于6000h.7.3.2比例p的检验比例p可看做某时间发生的概率,即看作二点分布b(1,p)中的参数.作n次独立重复试验,以x记该事件发生的次数,则x~b(n,p).现考虑如下单边假设检验问题H:ppvsH:pp,0010nnnn找一个c,使得pi(1-p)n-i>>pi(1-p)n-i,c=c+1可得水平为的检0i00i000i=ci=c+100验.对检验问题H:ppvsH:p0.025>P(x12)=0.0210,故取c=12,拒绝域为W={x3或x12}2由于观测值没有落入拒绝域,故接受原假设.7.3.2大样本检验设x,x,,x是来自某总体的样本,该总体均值为,方差为的函数,记为12n(2),则对下列三类假设检验问题:(1)H:vsH:;0010(2)H:vsH:<,0010(3)H:=vsH:.0010在样本容量n充分大时,利用中心极限定理x~N(,2()/n)故在=时.可采用检验统计量0n(x-)u=0~N(0,1),对应上述三类假设检验问题的拒绝域分别为2()0W={uu},W={uu},W={uu}.1-1-2例7.3.3例7.3.47.3.4检验的p值例7.3.5略从例7.3.5可以看到,对同一个假设检验问题,若取不同的显著水平,会得到不同的结论,0.0179是能用观测值2.10做出“拒绝H”的最小的显著性水平,这就是p值.0定义7.3.1在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p值.引进检验的p值的概念有如下好处:(1)它比较客观,避免了事先确定显著水平.(2)由检验的p知与人们心目中的显著性水平进行比较可以很容易做出检验的结论:如果p,则在显著性水平下拒绝H;0如果1p,9应拒17绝原假设.例7.3.7略§7.4分布拟合检验教学目的:了解有限离散总体分布的拟合检验、列联表的独立性检验和正态性检验.教学重点:列联表的独立性检验和正态性检验.教学难点:解决简单的实际问题.教学内容:本节内容包括总体分布只取有限个值的情况,列联表的独立性检验.正态性检验.前面讨论的检验问题都是在总体分布形式已知的前提下对分布的参数建立假设并进行检验,它们都属于参数假设检验问题.这一节我们对总体分布的形式建立假设并进行检验,这一类检验问题统称为分布的拟合检验,属于非参数假设检验.7.4.1总体分布只取有限个值的情况设总体X可以分成k类,记为A,A,,A,现对该总体做了n次观12kk测,k个类出现的频数分别为n,n,,n,且n=n,要检验的假设为12kii=1H:P(A)=p,i=1,2,,k.(7.4.1)0iikp=1,p0.其备择假设是(7.4.1)诸等式不全成立.下面我们分两种情况讨论iii=17.4.1的检验问题.一诸p均已知in如果H成立,则对每一类A,其频率i与概率p应较接近.据此,选用检验统计量0inin(n-np)22=ii,可证明在H成立时,对充分大的n,2近似服从自由度为n-1的2分np0i=1i布.因此,对给定的显著性水平(0<<1),该检验的拒绝域为W={22(k-1)}.1-例7.4.1二诸p不完全已知i诸pi=1,2,,k.可由r(r 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 正态分布换算出来的,即在普u2t1通的直角坐标xot的纵坐标轴(t轴)上原坐标为t的点刻度为(t)e2du,例2如纵轴上,原坐标为1处的刻度为(1)0.8413,原坐标为2处的刻度为(2)0.9772,原坐标为-1处的刻度为(1)0.1587,但习惯上,在正态概率纸上的纵坐标轴上标明的数字是换算出的刻度的100倍,又由于x是在~取值,概率不可能为0,也不可能为1,故一般概率纸的纵轴的刻度都是从0.01~99.99.例7.4.4随机选取10个零件,测得其直径与标准尺寸的偏差如下:9.48.89.610.210.17.211.18.28.69.6利用正态概率纸作正态性检验的步骤如下:1.首先把样本观察值按从小到大的次序排列:xxx9.69.8(1)(2)(n)10.110.211.1具体数据为7.28.28.68.89.42.对每一个i,计算修正的频率F(i0.375)/(n0.25),i1,2,,ni结果为F=0.061,F=0.159,F=0.256,F=0.354,F=0.451,12345F=0.549,F=0.646,F=0.743,F=0.841,F=0.9396789103.将点(x,F),i1,2,,n逐一点在正态概率纸上(i)i4.判断若诸点在一条直线附近,则认为该样本来自正态总体;若诸点明显不在一条直线附近,则认为该样本不是来自正态分布总体.如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可认为变换后的数据来自正态分布,这样的变换称为正态性变换.常用的正态性变换有:对数变换,倒数变换和根号变换.例7.4.5利用对数变换二夏皮洛-威尔克检验夏皮洛-威尔克检验也简称W检验,这个检验当8n50时可以使用,过小样本对偏离正态分布的检验不太有效.W检验是建立在次序统计量的基础上,将n个独立观测值按非降次序排列,记为nn[(a-a)(x-x)]2iix,x,,x,检验统计量为W=i=1i=1,系数a,a,,a在(1)(2)(n)nn12n(a-a)2(x-x)2iii=1i=1样本容量为n时有特定的值,可查附表.系数a,a,,a还具有性质:12na=-a,i=1,2,,[n]in+1-i2nna=0,a2=1iii=1i=1[n]2[a(x-x)]2i(n+1-i)(i)故可将统计量简化为W=i=1,可以证明,在原假设成立,即总体分布为正n(x-x)2(i)i=1态分布时,W的值应该接近1,因此在显著性水平下,如果统计量W的值小于其分位数,则拒绝原假设,即拒绝域为{WW}.例7.4.6略
本文档为【假设检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
白学芝
热爱爱问
格式:pdf
大小:950KB
软件:PDF阅读器
页数:18
分类:
上传时间:2023-03-26
浏览量:0