10.3 相关性、最小二乘估计
与统计案例
考纲要求
-*-
考纲要求:1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数
公式
小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载
建立线性回归方程(线性回归方程系数公式不要求记忆). 3.通过典例案例了解回归分析的思想、方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题. 4.通过典型案例了解独立性检验的思想、方法,并能初步应用独立性检验的思想、方法解决一些简单的实际问题.
*
知识梳理
-*-
1.相关性
(1)散点图:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
(2)线性相关:若两个变量x和y的散点图中,所有点看上去都在 一条直线附近波动,则称变量间是线性相关的,此时,我们可以用 一条直线来近似.
(3)非线性相关:在两个变量x和y的散点图中,若所有点看上去都在某条曲线附近波动,则称此相关为非线性相关的.此时,可以用一条曲线来拟合.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
知识梳理
-*-
2.最小二乘法与线性回归方程
(1) 最小二乘法:如果有n个点:(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
知识梳理
-*-
3.独立性检验
(1)2×2列联表
知识梳理
-*-
(2)独立性检验
利用随机变量来判断“两个变量有关联”的方法称为独立性检验.
(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
②当χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.
双击自测
-*-
2
3
4
1
5
1.下列结论正确的打“√”,错误的打“×”.
(1)相关关系的两个变量是非确定性关系. ( √ )
(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示. ( √ )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值. ( √ )
(4)对于分类变量X与Y,统计量χ2的值越小,“X与Y有关联”的把握程度越大. ( × )
(5)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势. ( √ )
双击自测
-*-
2
3
4
1
5
2. 2015湖北,文4)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
答案
八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案
解析
双击自测
-*-
2
3
4
1
5
答案
解析
双击自测
-*-
2
3
4
1
5
4. (2015北京,文14) 高三
年级
六年级体育公开课教案九年级家长会课件PPT下载六年级家长会PPT课件一年级上册汉语拼音练习题六年级上册道德与法治课件
267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.
从这次考试成绩看,
(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;
(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .
答案
解析
双击自测
-*-
2
3
4
1
5
答案
解析
5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(填“有关”或“无关”).
双击自测
-*-
2
3
4
1
5
自测点评
1.散点图上的点大致分布在某条直线附近,整体上呈线性分布时,两个变量相关关系越强.
2. χ2越大,“X与Y有关联”的把握程度越大.
3.注意回归分析时对应的结果均是估计值,不要误认为是真实值;对于独立性检验的结论需要在概率意义下来理解,避免在现实生活中错误应用.
4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距离的大小,这样使用求平方和也避免了讨论绝对值和正负问题.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
考点1相关关系的判断
例1(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②,由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
答案
解析
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
答案
解析
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
思考:如何判断两个变量有无相关关系?
解题心得:判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
对点训练1 (1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r2
记录
混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载
的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
解:(1)由题意,作散点图如图.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
(2)由对照数据,计算得
所以回归方程为y=0.7x+0.35.
(3)当x=100时,y=100×0.7+0.35=70.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
考点3独立性检验
例3为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%以上的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
由于9.967>6.635,所以有99%以上的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
思考:独立性检验得出的结论是什么?它对我们日常生活有什么帮助?
解题心得:独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度;具体做法是根据公式 ,计算χ2,χ2值越大,说明“两个变量有关系”的可能性越大.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
对点训练3 某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的 ,女生喜欢看NBA的人数占女生人数的
(1)若被调查的男生人数为n,根据题意建立一个2×2列联表;
(2)若有95%以上的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人?
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
解:(1)由已知得:
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同.)
2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.
3.根据χ2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际.
核心考点
-*-
考点1
考点2
考点3
知识方法
易错易混
1.相关关系与函数关系的区别
相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.
2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
*