变量的相关性
编稿:丁会敏 审稿:王静伟
【学习目标】
1.明确两个变量具有相关关系的意义;
2.知道回归分析的意义;
3.知道回归直线、回归直线方程、线性回归分析的意义;
4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
中两个变量间的回归直线方程;
【
要点
综治信访维稳工作要点综治信访维稳工作要点2018综治平安建设工作要点新学期教学工作要点医院纪检监察工作要点
梳理】
【高清课堂:变量的相关关系 400458 知识讲解1】
要点一、变量之间的相关关系
变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系
函数关系是一种确定性关系,如y=kx+b,变量取的每一个值,都有唯一确定的值和它相对应。
2.相关关系
变量间确定存在关系,但又不具备函数关系所要求的确定性
相关关系分为两种:
正相关和负相关
要点诠释:
对相关关系的理解应当注意以下几点:
(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.
3.散点图
将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关
(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。如:家庭年收入越高,年饮食支出越高。反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图
A
0
5
10
15
20
25
30
35
B
541.67
602.66
670.09
704.99
806.71
908.59
975.42
1034.75
(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。在散点图中,对应数据的位置为从左上角到右下角的区域。按表中所列数据制作的散点图如图。
C
5
8
16
18
28
30
35
D
64
56
50
42
37
32
21
(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。例如,学生的身高与学生的学习成绩没有相关关系。
要点诠释:
利用散点图可以大致判断两个变量之间有无相关关系。
【高清课堂:变量的相关关系 400458 知识讲解2】
要点三、线性回归方程
1.回归直线方程
(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。
2.回归直线方程的求法
设与个观测点()最接近的直线方程为,其中a、b是待定系数.
则 .于是得到各个偏差
.
显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和.
表示n个点与相应直线在整体上的接近程度.
记.
上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值.即
, ,
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。
要点诠释:
1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.
3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.
4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.
【典型例题】
类型一:变量间的相关关系与函数关系
例1.下列两个变量之间的关系中,不是函数关系的是( )
A.角度和它的余弦值 B.正方形的边长和面积
C.正n边形的边数和其内角度数之和 D.人的年龄和身高
【
答案
八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案
】D
【解析】 函数关系是一种确定的关系。而相关关系是非确定性关系。选项A、B、C都是函数关系,可以写出它们的函数表达式:,,,选项D不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D.
【总结升华】 本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.
举一反三:
【变式1】下列图形中具有相关关系的两个变量是( )
【答案】 C
【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
【变式2】下列关系是相关关系的是________(填序号).
①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系.
【答案】①③④
例2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。
气温x/℃
26
18
13
10
4
-1
杯数y
20
24
34
39
50
64
请画出散点图,并判断它们是否有相关关系。
【解析】 散点图如下图:
从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
举一反三:
【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
年平均气温(℃)
12.51
12.74
12.74
13.69
13.33
12.84
13.05
年降雨量(mm)
748
542
507
813
574
701
432
【解析】 以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示。
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。
【总结升华】用回归直线进行拟合两变量关系的一般步骤为:
①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解
例3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:
碳含量/%
0.10
0.30
0.40
0.55
0.70
0.80
0.95
20℃时电阻/μΩ
15
18
19
21
22.6
23.8
26
(1)画出散点图;
(2)求回归方程.
【解析】由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到,计算公式中所需的数据,代入易得,.
(1)作出散点图如下图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得
,,,.
则
,
.
所以回归方程为.
【总结升华】 求线性回归直线方程的步骤为:
第一步:列表;
第二步:计算;
第三步:代入公式计算的值;
第四步:写出直线方程.
举一反三:
【变式1】 某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
【答案】选B
【解析】
,回归方程为,
当时,=65.5,故选B.
【变式2】 观察两相关变量得如下数据:
x
-1
-2
-3
-4
-5
5
3
4
2
1
y
-9
-7
-5
-3
-1
1
5
3
7
9
求两变量间的回归方程.
【答案】
【解析】列表:
i
1
2
3
4
5
6
7
8
9
10
xi
-1
-2
-3
-4
-5
5
3
4
2
1
yi
-9
-7
-5
-3
-1
1
5
3
7
9
xiyi
9
14
15
12
5
5
15
12
14
9
计算得:,。
,。
∴。
。
∴所求回归直线方程为。
类型三:利用回归直线对总体进行估计
【高清课堂:变量的相关关系 400458 例2】
例4.给出了随机抽取的10位男性的收缩血压.
年龄x(岁)
收缩压y(毫米汞柱)
年龄x(岁)
收缩压y(毫米汞柱)
37
110
50
146
35
117
49
148
41
125
54
150
43
130
60
154
42
138
65
160
(1)画出散点图;
(2)求出收缩压与年龄之间的回归直线;
(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少?
(4)就(3)所得预测结果,比较其预测的精确性。
【解析】(1)散点图为:
(2)收缩压与年龄之间的回归直线
序号
x
y
x2
xy
1
37
110
1369
4070
2
35
117
1225
4095
3
41
125
1681
5125
4
43
130
1849
5590
5
42
138
1764
5796
6
50
146
2500
7300
7
49
148
2401
7252
8
54
150
2916
8100
9
60
154
3600
9240
10
65
160
4225
10400
求和
476
1378
23530
66968
列表:
所以y对x的回归直线方程为:
(3)根据所求的回归直线方程可以预测20岁的收缩压为
445岁的收缩压为:毫米汞柱
(4)预测20岁的结果时,20是外推的,所以不是很精确;而45是内插值,所以精确性比20的预测结果要好。
【总结升华】 只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.
举一反三:
【变式1】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为( ).
【答案】C
【变式2】下表是某地搜集到的新房屋的销售价格y,(单位:万元)和房屋的面积x(单位:m。)的数据:
x
115
110
80
135
105
y
44.8
41.6
38.4
49.2
42
(1)画出散点图;
(2)求回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
【解析】 据已知样本数据得到回归直线方程后,即得到两个变量之间相关关系的一个规律,因此可将给定的x值代入回归直线方程预测y值.
(1)散点图如下图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据,用计算器计算得,,,.
则
,
.故所求回归方程为.
(3)根据上面求得的回归方程,当房屋面积为1500时,销售价格的估计值为0.196×150+21.836=51.236(万元).