首页 3.2 独立性检验

3.2 独立性检验

举报
开通vip

3.2 独立性检验null3. 1 独立性检验 3. 1 独立性检验 null问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包份量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包份量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。null一:假设检验问题的原理 假设检验问题由两个互斥的假设构成,其...

3.2 独立性检验
null3. 1 独立性检验 3. 1 独立性检验 null问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包份量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包份量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。null一:假设检验问题的原理 假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。例如,在前面的例子中, 原假设为: H0:面包份量足, 备择假设为: H1:面包份量不足。 这个假设检验问题可以表达为: H0:面包份量足 ←→ H1:面包份量不足null二:求解假设检验问题考虑假设检验问题: H0:面包分量足 ←→ H1:面包分量不足在H0成立的条件下,构造与H0矛盾的小概率事件; 如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。求解思路分析:null本节研究的是两个分类变量的独立性检验问题。独立性检验在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。null1.某医疗机构为了了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查,共调查了339名50岁以上的人,其中吸烟者205人,不吸烟者134人.调查结果是:吸烟的205人中有43人患呼吸道疾病(简称患病),162人未患呼吸道疾病(简称未患病);不吸烟的134人中有13人患病,121人未患病.问题:根据这些数据能否断定“患慢性支气管炎与吸烟有关”?null(1)为了研究这个问题,将上述数据用下表来表示: (2)估计吸烟者与不吸烟者患病的可能性差异:在吸烟的人中,有 的人患病, null在不吸烟的人中,有 的人患病. 问题:由上述结论能否得出患病与吸烟有关?把握有多大? (1)假设:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下列2×2列联表:不吸烟(null 即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,|n11n22-n21n12|越小,患病与吸烟之间的关系越弱,否则,关系越强.近似的判断方法: 设n=n11+n21+n12+n22,如果H0成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得,null 上面的话的意思是指事件A与B独立,这时应该有P(AB)=P(A)P(B)成立, 我们用H0表示上式,即H0:P(AB)=P(A) P(B). 并称之为统计假设,当H0成立时,下面的三个式子也成立:null根据概率的统计定义,上面提到的众多事件的概率都可以用相应的频率来估计。 例如 P(AB)的估计为P(A)的估计为 ,P(B)的估计为 ,……于是 与 应该很接近,……。 或者说应该比较小 .null从而 也应该比较小。 (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ2 )来进行估计.null卡方χ2统计量公式: 用它的大小可以决定是否拒绝原来的统计假设H0,如果算出的χ2值较大,就拒绝H0,也就是拒绝“事件A与事件B无关”,从而就认为它们是有关的了 null(3)两个临界值:3.841与6.635. 经过对χ2统计量分布的研究,已经得到了两个临界值:3.841与6.635。 当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A与事件B有关; 当χ2>6.635时,有99%的把握说事件A与事件B有关; 当χ2<3.841时,认为事件A与事件B无关;null 象以上这种用χ2统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 对于例1,最理想的解决办法是向所有的50岁以上的人作调查,然后对所得的数据进行统计处理,但这花费的代价太大,实际上也是行不通的。339个人相对于全体50岁以上的人,只是一小部分回忆一下数学必修3中学过的总体与样本的关系,null当用样本平均数,样本标准差去估计总体的相应的数字特征时,由于抽样的随机性,结果并不惟一。现在的情况类似,我们用部分对全体作推断,推断可能正确,也可能错误,例如我们知道,不少的中老年烟民的身体很好,没有患慢性支气管炎;而又有很多的从不吸烟的中老年人体质很差,患有慢性支气管炎。如果抽取的339个调查对象中很多人来自上述两个群体,null试想会得出什么结论吧。我们说有95%(或99%)的把握说事件A与事件B有关,是指推断犯错误的可能性为5%(或1%),这也是常常说成是“有95%(或99%)的概率”,其含义是一样的。 解:由公式 因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性支气管炎与吸烟有关。null独立性检验的一般步骤: 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟与不吸烟),Ⅱ也有两类取值:类1和类2(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:类类 类类null推断“Ⅰ和Ⅱ有关系”的步骤为: 第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系; 第二步,根据2×2列联表和公式计算χ2统计量; 第三步,比对两个临界值,作出判断.null2: 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。null解:这是一个2×2列联表的独立性检验问题,由公式 因为1.780<3.841,我们没有理由说“心脏搭桥手术”与“又发生过心脏病”有关,可以认为病人又发作心脏病与否跟他做过何种手术无关。 null3.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得的数据如下表所示: 对于人力资源部的研究项目,根据上述数据能得出什么结论?null解:这是一个2×2列联表的独立性检验问题,由公式 因为10.759>6.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的。可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的。 null4.在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此 资料 新概念英语资料下载李居明饿命改运学pdf成本会计期末资料社会工作导论资料工程结算所需资料清单 你是否认为在恶劣气候飞行中男性比女性更任意晕机?null解:这是一个2×2列联表的独立性检验问题,由公式 因为3.689<3.841,我们没有理由说晕机与否跟男女性别有关。尽管这次航班中男性晕机的比例比女性晕机的比例高,但我们不能认为在恶劣气候飞行中男性比女性更任意晕机。
本文档为【3.2 独立性检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_608851
暂无简介~
格式:ppt
大小:258KB
软件:PowerPoint
页数:0
分类:高中数学
上传时间:2013-01-19
浏览量:138