首页 独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用

举报
开通vip

独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用编稿:赵雷审稿:李霞【学习目标】1.了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用2.通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。...

独立性检验的基本思想及其初步应用
独立性检验的基本思想及其初步应用编稿:赵雷审稿:李霞【学习目标】1.了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用2.通过典型 案例 全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例 的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。(2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。要点二、2×2列联表1.列联表用 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 列出的分类变量的频数表,叫做列联表。2.2×2列联表对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:事件B事件合计事件Aaba+b事件cdc+d合计a+cb+da+b+c+d这样的表格称为2×2列联表。要点三:卡方统计量公式为了研究分类变量X与Y的关系,经调查得到一张2×2列联表,如下表所示Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是:(为样本容量)。要点四、独立性检验独立性检验通过2×2列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。变量独立性的判断通过对统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:①如果≤3.841时,认为事件A与B是无关的。②如果>3.841时,有95%的把握说事件A与事件B有关;③如果>6.635时,有99%的把握说事件A与事件B有关;要点诠释:(1)独立性检验一般是指通过计算统计量的大小对两个事件是否有关进行判断;(2)独立性检验的基本思想类似于反证法。即在H0:事件A与B无关的统计假设下,利用统计量的大小来决定在多大程度上拒绝原来的统计假设H0,即拒绝“事件A与B无关”,从而认为事件A与B有关。独立性检验为假设检验的特例。(3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。3.独立性检验的基本步骤及简单应用独立性检验的步骤:要推断“A与B是否有关”,可按下面步骤进行:(1)提出统计假设H0:事件A与B无关(相互独立);(2)抽取样本(样本容量不要太小,每个数据都要大于5);(3)列出2×2列联表;(4)根据2×2列联表,利用公式:,计算出的值;(5)统计推断:当>3.841时,有95%的把握说事件A与B有关;当>6.635时,有99%的把握说事件A与B有关;当>10.828时,有99.9%的把握说事件A与B有关;当≤3.841时,认为事件A与B是无关的.要点诠释:使用统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.一定要弄清的表达式中各个量的含义.独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量应该很小,如果由观测数据计算得到的的观测值很大,则在一定程度上说明假设不合理.根据随机变量的含义,由实际计算的>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当≤3.841时,认为两个分类变量是无关的.【典型例题】类型一、利用2×2列联表计算卡方例1.为了考察中学生的性别与是否喜欢 数学 数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划 课程之间的关系,在某校学生中随机地抽取了50名学生,得到如下列联表:喜欢数学不喜欢数学合计男131023女72027合计203050根据表中的数据,计算【思路点拨】利用公式计算【解析】得到【思路点拨】在利用列联表计算统计量作独立性检验时,要求表中的4个数据大于等于5,为此,在选取样本的容量时一定要注意这一点。举一反三:【变式1】研究两个事件A,B之间的关系时,根据数据信息列出如下的2×2列联表:B合计An11n12n1+n21n22n2+合计n+1n+2n则以下计算公式正确的是()A.B.C.D.【 答案 八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案 】A【变式2】由列联表合计4316220513121134合计56283339则随机变量。(精确到0.001)【答案】由公式计算得:7.469类型二、独立性检验例2.近年来,随着我国经济的飞速发展,在生产车间中,由于保护不当,对生产工人造成伤害的事件也越来越多.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎(注:检查为阳性则为患皮肤炎),在生产季节开始时,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数的结果如下:阳性例数阴性例数合计新57075旧101828合计1588103问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由.【思路点拨】这是一个列联表的独立性检验问题,根据列联表的数据求解判断。【解析】提出假设H0:新防护服对预防工人患职业性皮肤炎无效.将表中数据代入,得,查表可知:P(≥10.828)≈0.001,而13.826>10.828,故有99.9%的把握认为新防护服对预防这种职业性皮肤炎有效.【 总结 初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf 升华】在掌握了独立性检验的基本思想后我们一般通过计算的值,然后比较的值与临界值的大小来精确地给出“两个分类变量”的相关程度.举一反三:【变式1】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析。其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件。根据上面的数据,你能得出什么结论?【答案】由已知数据得到下表合格品不合格品合计设备改造后653095设备改造前364985合计10179180根据公式得≈12.38。由于12.38>6.635,可以得出产品是否合格与设备改造是有关的。【变式2】考察黄烟经过培养液处理与否跟发生青花病的关系。调查了457株黄烟,得到下表中数据,请根据数据作统计分析。培养液处理未处理合计青花病25210235无青花病80142222合计105352457分析:计算的值与临界值的大小关系。【答案】根据公式=≈41.61。由于41.61>6.635,说明经过培养液处理的黄烟跟发生青花病是有关的。【变式3】为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:男女正常442514色盲386根据上述数据试问色盲与性别是否是相互独立的?【答案】由已知条件可得下表男女合计正常442514956色盲38644合计4805201000依据公式得==27.139。由于27.139>6.635,所以有99%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立的。【高清课堂:独立性检验的基本思想及其初步应用406875例题1】例3.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.【思路点拨】先提出假设,然后根据的大小做出准确估计判断。【解析】假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,所以。因为≈1.779<<2.706,所以不能作出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论.即这两种手术对病人又发作过心脏病的影响没有差别.【总结升华】此类问题的一般解法是利用,求出的值,再利用与临界值的大小关系来判断假设是否成立.在解题时应注意准确代数与计算.举一反三:【变式1】对男女大学生在购买食品时是否看营养说明进行了调查,得到的数据如下表所示:看营养说明不看营养说明合计男大学生233255女大学生92534合计325789利用2×2列联表的独立性检验估计看营养说明与性别的关系中准确的是()A.二者一定无关B.有95%的把握说二者有关C.有99%的把握说二者有关D.没有理由说二者有关【答案】D;由公式得:,因为2.149<3.841,所以我们没有理由说看营养说明与性别有关。故选D。【变式2】在大连—烟台的某次航运中,出现了恶劣气候。随机调查男、女乘客在船上晕船的情况如下表所示:晕船不晕船合计男人325183女人82432合计4075115据此资料,你能否认为在恶劣气候中航行时,男人比女人更容易晕船?【答案】由卡方公式得:。因为1.870<3.841,所以我们没有理由说晕船跟性别有关。因此不能认为在恶劣气候中航行时,男人比女人更容易晕船。注意:解决本题主要运用卡方公式来判断,尽管这次航行中男人晕船比例比女人晕船比例高,但我们不能就此认为在恶劣气候中航行时男人比女人更容易晕船。类型三、独立性检验的应用例4.甲乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表  优秀不优秀总计甲班103545乙班73845总计177390  画出列联表的条形图,并通过图形判断成绩与班级是否有关;利用列联表的独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少。 【解析】列联表的条形图如图所示:  由图及表直观判断,好像“成绩优秀与班级有关系”;由表中数据计算得K2的观察值为K2≈0.653>0.455。  由下表中数据P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828  得:P(K2≥0.455)≈0.50,  从而有50%的把握认为“成绩与班级有关系”,即断言“成绩优秀与班级有关系”犯错误的概率为0.5。 【总结升华】  (1)画出条形图后,从图形上判断两个分类变量之间是否有关系。这里通过图形的直观感觉的结果可能会出错。  (2)计算得到K2的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”。这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立。在独立性检验中,在假设“成绩优秀与班级没有关系”的情况下,计算得到的K2的值比较小,且P(K2≥0.653)≈0.42,说明事件(K2≥0.653)不是一个小概率事件,这个事件的发生不足以说明“成绩优秀与班级没有关系”,即没有理由说明“成绩优秀与班级有关系”。这里没有推出小概率事件发生类似于反证法中没有推出矛盾。举一反三:【变式1】在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关.你所得到的结论在什么范围内有效?【答案】根据题目所给的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561000作出相应的二维条形图,如图所示.由二维条形图可知在男人中患色盲的比例要比在女人中患色盲的比例大,其差值比较大,因而我们可以认为性别与患色盲是有关的;根据列联表中所给的数据可知:a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式得,因为≈27.1>10.828,所以我们有99.9%的把握认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.【变式2】某年高考后,某市教育主管部门对该市一重点中学高考上线情况进行统计,随机抽查244名学生,得到如下表格:语文数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617总计20440201432004420143试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?【答案】对于上述四个科目,分别构造四个随机变量,,,,由表中数据可以得到:语文:,数学:,英语:,综合科目:.所以,有99%的把握认为语文上线与总分上线有关系,有99.9%的把握认为数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.【变式3】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.优秀非优秀合计甲班10乙班30合计105已知在全部105人中随机抽取1人为优秀的概率为.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号,试求抽到6或10号的概率.【答案】(1)优秀非优秀合计甲班104555乙班203050合计3075105(2)根据列联表中的数据,得到,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y).所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A包含的基本事件有:(1,5)、(2,4)、(3,3)、(4,2)、(5,1)、(4,6)、(5,5)、(6,4),共8个,∴P(A)==.
本文档为【独立性检验的基本思想及其初步应用】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
is_294897
暂无简介~
格式:doc
大小:252KB
软件:Word
页数:9
分类:
上传时间:2021-11-27
浏览量:14