2015届高考数学(理)一轮复习配套文档:12.3 变量间的相关关系与线性回归方程
?12.3 变量间的相关关系与线性回归方程
1(会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系(
2(了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)(
在高考中,本节以考查相关关系、线性回归方程的相关概念和简单应用为主(在学习时,应明确各概念的含义及其联系,并能在此基础上进行简单应用(
1(变量间的相关关系
常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关系不同,相关关系是一种________关系,带有随机性(
2(两个变量的线性相关
(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有____________,这条直线叫________(
(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________.
※ (3)相关系数 n
(x,x)(y,y),ii,1ir,,当r,0时,表示两个变量正相关;当r,0时,表示两nn22
(x,x)(y,y),,ij,1,1ij
个变量负相关(r的绝对值越接近________,表示两个变量的线性相关性越强;r的绝
对值越接近________,表示两个变量的线性相关性越弱(通常当r的绝对值大于0.75
时,认为两个变量具有很强的线性相关关系(
3(回归直线方程
n2
(1)通过求Q,的最小值而得出回归直线的
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
,即使得样本数据的(y,,,,x),ii,1i
点到回归直线的距离的平方和最小的方法叫做____________(该式取最小值时的α,β的
ˆˆab值即分别为,.
(2)两个具有线性相关关系的变量的一组数据:(x,y),(x,y),„,(x,y),其1122nn
ˆˆˆ回归方程为,则 y,bx,a,nn(xx)(yy)xynxy,,,,,,ˆiiii,b,,,,1,1,ii2,nn22(xx)xnx,, ,,,ii,1,1,iiˆˆ,aybx.,,,
【自查自纠】
1(相关关系 非确定性
2((1)线性相关关系 回归直线 (2)正相关 负相关
(3)1 0
3(最小二乘法
在下列量与量的关系中,是相关关系的是( )
?正方体的体积与棱长间的关系; ?一块农田的水稻产量与施肥量的关系; ?人的身高与年龄的关系;
?家庭的支出与收入的关系(
A(??? B(??? C(??? D(???
解:?是函数关系,???皆为相关关系( 故选D.
观察下列各图形:
其中两个变量x,y具有很强相关关系的图是( )
A(?? B(?? C(?? D(??
解:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关(?的相关性较弱,?中两变量几乎没有什么关系(而??相关性很强(故选C.
2012?湖南 (设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关)
ˆ系,根据一组样本数据(x,y)(i,1,2,„,n),用最小二乘法建立的回归方程为,0.85xyii
,85.71,则下列结论中不正确的是( ) (((
A(y与x具有正的线性相关关系
B(回归直线过样本点的中心(x,) y
C(若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D(若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
ˆ解:由回归方程为,0.85x,85.71知y随x的增大而增大,所以y与x具有正的线y
ˆx性相关关系,由最小二乘法建立的回归方程的过程知,bx,a,bx,,b (a,,yyyxxb),所以回归直线过样本点的中心(,),利用回归方程可以预测估计总体,但不能为y
准确值,所以D不正确 .故选D.
下列命题:
?线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;
?利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
ˆˆˆ?通过回归直线,可以估计和预测变量的取值和变化趋势( y,bx,a
其中正确命题的序号是________(
解:易知???均正确,故填???.
某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
^^^^根据上表可得回归方程y,bx,a中的b为9.4,据此模型预报广告费用为6万元时销售额为_________万元(
^^解:由统计数据计算得,3.5,,42,代入,9.4,a,得a,9.1.?当x,6时,xxyy
^y,9.4×6,9.1,65.5(万元)(故填65.5.
类型一 相关关系的判断
下列变量之间的关系不是相关关系的是( ) ((
2A(已知二次函数y,ax,bx,c,其中a,c是已知常数,取b为自变量,因变量是这
2个函数的判别式Δ,b,4ac
B(光照时间和果树亩产量
C(降雪量和交通事故发生率
D(每亩施用肥料量和粮食亩产量
2解:由函数关系和相关关系的定义可知,A中Δ,b,4ac,因为a,c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数关系(B,C,D中两个变量之间的关系都是相关关系(故选A.
【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的(
下列说法中正确的是( )
A(任何两个变量之间都有相关关系
B(球的体积与该球的半径具有相关关系
C(农作物的产量与施化肥量之间是一种确定性的关系
D(某商品的生产量与该商品的销售价格之间是一种非确定性的关系
解:A概念错误,B是函数关系,C中“确定性”说法错误(故选D.
类型二 线性回归方程的有关概念
为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10
次和15次试验,并且利用线性回归方法,求得回归直线分别为l,l,已知两人得到的试12验数据中,变量x的平均值都等于s,变量y的平均值都等于t,那么下列说法正确的是( )
A(直线l和l一定有公共点(s,t) 12
B(直线l和l相交,但交点不一定是(s,t) 12
C(必有直线l?l 12
D(直线l和l必定重合 12
ˆˆˆˆˆˆˆˆˆ解:线性回归直线方程为,,x,而,,,即,t,s.t,,s.ababxababyy
?(s,t)在回归直线上,即直线l和l必有公共点(s,t)(故选A. 12
【评析】回归方程一定通过样本点的中心(,);中心相同的样本点的回归方程不一xy
定相同(
ˆˆˆ 由一组样本数据(x,y),(x,y),„,(x,y)得到回归直线方程,y,bx,a1122nn那么下面说法错误的是( ) ((
ˆˆˆxA(直线必经过点(,) yy,bx,a
ˆˆˆB(直线至少经过点(x,y),(x,y),„,(x,y)中的一个点 y,bx,a1122nn
n
xy,nxy,ii,1iˆˆˆˆbC(直线的斜率, 2y,bx,an2
x,nx,i,1i
n2ˆˆˆˆˆD(直线和各点(x,y),(x,y),„,(x,y)的偏差y,bx,a[y,(bx,a)]1122nn,ii,1i是该坐标平面上所有直线与这些点的偏差中最小的
ˆˆˆx解:回归直线方程经过样本点的中心(,),可能不经过(x,y),(x,yy,bx,a112
y),„,(x,y)中的任何一点,这些点都分布在这条直线附近. 2nn
故选B.
类型三 散点图
(1)对变量x,y有观测数据(x,y)(i,1,2,„,10),得散点图1;对变量ii
u,v有观测数据(u,v)(i,1,2,„,10),得散点图2.由这两个散点图可以判断( ) ii
图1 图2
A(变量x与y正相关,u与v正相关
B(变量x与y正相关,u与v负相关
C(变量x与y负相关,u与v正相关
D(变量x与y负相关,u与v负相关
解:由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.
【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关(
下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg): (2)
施化肥量15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(?)将上述数据制成散点图;
(?)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗,水稻产量会一直随施化肥量的增加而增长吗,
解:(?)散点图如下:
(?)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大(图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会
一直随化肥施用量的增加而增长(
【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系(
(1)从左至右,观察下列三个散点图,变量x与y的关系依次为________(正相关记作?;负相关记作?;不相关记作?)(
解:散点图在左上角至右下角区域则负相关,反之,则正相关,散乱则不相关(故填???.
(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,?),并作了统计:
年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05
年降
748 542 507 813 574 701 432
雨量
(?)试画出散点图;
(?)判断两个变量是否具有线性相关关系(
解:(?)作出散点图如图所示(
(?)由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系( 类型四 求回归方程及用回归方程进行估计
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归
方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤, 参考值3×2.5,4×3,5×4,6×4.5,66.5) (
解:(1)散点图如下:
(2)由系数公式可知,,4.5,,3.5, xy
66.5,4×4.5×3.5ˆ,,0.7, b286,4×4.5
ˆ,3.5,0.7×4.5,0.35, a
ˆ所以线性回归方程为,0.7x,0.35. y
ˆ(3)x,100时,,0.7x,0.35,70.35,所以预测生产100吨甲产品的生产能耗比技y
术改造前降低19.65吨标准煤(
nn2
x【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算,,,;(3)iiiyxyx,,i,1i,1
ˆˆˆˆba代入公式求,再利用求,(4)写出回归方程. a,y,bx
(2013?重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入x(单i
10
位:千元)与月储蓄y(单位:千元)的数据资料,算得i=80, xi,i,1
1010102
i=20,ii=184,=720. yixyx,,,i,1i,1i,1
(1)求家庭的月储蓄y对月收入x的线性回归方程y,bx,a; (2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄(
附:线性回归方程y,bx,a中,
n
xy,nxy,ii,1ib,,, 2a,y,bxn2
x,nx,i,1i
^^^其中,为样本平均值,线性回归方程也可写为y,bx,a. xy
n
180解:(1)由题意知n,10,,,,8, xix,n10i,1
nn21202 2 ,,,2,又- n=720 -10×8=80,xiyyix,,n10i,1i,1
n
-n,184,10×8×2,24, iixyxy,i,1
24由此得b,,0.3, 80
,,b,2,0.3×8,,0.4, axy
故所求回归方程为y,0.3x,0.4.
(2)由于变量y的值随x的值增加而增加(b,0.3>0),故x与y之间是正相关( (3)将x,7代入回归方程可以预测该家庭的月储蓄为y,0.3×7,0.4,1.7(千元)(
1(在研究两个变量之间是否存在某种关系时,必须从散点图入手(对于散点图,可以
做出如下判断:
(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即
变量之间具有函数关系(
(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系( (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系( 2(
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
两个变量相关关系的常用方法:
(1)利用散点图进行判断;
(2)利用相关系数r进行判断(
3(在复习本节内容时应注意:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈
线性时,求出的回归直线方程才有实际意义,否则无意义(
(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值(
ˆˆˆˆ(3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量大,abab
计算时应仔细小心,分层进行(最好列出表格),避免因计算而产生错误(