2018年高考数学(理)二轮复习练习
专题限时集训(七) 回归
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
、独立性检验
(对应学生用书第91页)
(限时:40分钟)
题型1 回归分析
1,3,5,6,7,9,10,11,12,14
题型2 独立性检验
2,4,8,13
一、选择题
1.(2017·石家庄一模)下列说法错误的是( )
【导学号:07804050】
A.回归直线过样本点的中心(
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小
D.在回归直线方程
C [根据相关定义知选项A,B,D均正确;选项C中,对分类变量X与Y,随机变量K2的观测值k越大,对判断“X与Y有关系”的把握程度越大,故C错误.选C.]
2.(2017·湖南名校联考)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
来确定“X和Y有关系”的可信度.如果k>3.841,那么有把握认为“X和Y有关系”的百分比为
P(K2>k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.5%
B.75%
C.99.5%
D.95%
D [由图表中数据可得,当k>3.841时,有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的几率,也就是有95%的把握认为变量之间有关系,故选D.]
3.(2017·湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程为
【导学号:07804051】
A.101.2万元
B.108.8万元
C.111.2万元
D.118.2万元
C [根据统计数据表,可得
4.(2017·佛山二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如图77所示的两个等高堆积条形图.
图77
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有理科意愿的学生数量多于有文科意愿的学生数量
C.样本中的男生偏爱理科
D.样本中的女生偏爱文科
D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.]
5.(2016·汕头模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )
图78(1)
图78(2)
图78(3)
图78(4)
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
A [由给出的四组数据的散点图可以看出,图(1)和图(3)是正相关,相关系数大于0,图(2)和图(4)是负相关,相关系数小于0,图(1)和图(2)的点相对更加集中,所以相关性要强,所有r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1.故选A.]
6.(2017·南昌一模)设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方程为
A.y与x具有正线性相关关系
B.回归直线过样本点的中心(
C.若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg
D.若该中学某高中女生身高为160 cm,则可断定其体重必为50.29 kg
D [因为回归直线方程
7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是( )
C [当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选项C的图对应的带状区域的宽度越窄.故选C.]
8.(2017·江西南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线
一线
合计
愿生
45
20
不愿生
13
22
35
合计
58
42
100
由K2=
参照下表,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
C [K2≈9.616>6.635,
∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.]
二、填空题
9.(2017·汉中二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为
【导学号:07804052】
天数x
3
4
5
6
7
繁殖数量y(千个)
2.5
3
4
4.5
c
6 [
10.(2017·安徽百校联盟二模)已知x、y的取值为:
x
1
2
3
4
5
y
5
6
7
8
10
从散点图可知y与x呈线性相关关系,且回归直线方程为
27.6 [由表格可知
11.(2017·山西太原五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如下:
单价x(元)
3.0
3.2
3.4
3.6
3.8
4.0
销量y(瓶)
50
44
43
40
35
28
已知x,y的关系符合回归方程
3.75 [
∴
∴回归直线方程为:
利润L=(x-2)(-20x+110)=-20x2+150x-220,
∴x=
故
答案
八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案
为3.75.]
12.(2017·哈尔滨三中二模)以模型y=cekx(e为自然对数的底)去拟合一组数据时,为了求出回归直线方程,设z=ln y,其变换后得到线性回归方程为z=0.4x+2,则c=________.
e2 [∵y=cekx,
∴两边取对数,可得ln y=ln(cekx)=ln c+ln ekx=ln c+kx,
令z=ln y,可得z=ln c+kx,
∵z=0.4x+2,
∴ln c=2,
∴c=e2.]
三、解答题
13.(2017·石家庄一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图79所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.
图79
(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?
(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.
附:K2=
P(K2≥k0)
0.025
0.010
0.005
k0
5.024
6.635
7.879
[解] (1)由茎叶图可得2×2列联表:
正常
偏高
合计
男性
16
4
20
女性
12
8
20
合计
28
12
40
K2=
所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系.
(2)由样本数据可知,男性正常的概率为
此项血液指标为正常的人数X的可能取值为0,1,2,3,4,
P(X=0)=
P(X=1)=C
P(X=2)=
P(X=3)=C
P(X=4)=
所以X的分布列为
X
0
1
2
3
4
P
所以E(X)=0×
14.(2017·湖南三湘名校联盟三模)为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y=C1x2+C2与模型②:y=eC3x+C4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃
20
22
24
26
28
30
32
产卵数y/个
6
10
21
24
64
113
322
t=x2
400
484
576
676
784
900
1024
z=ln y
1.79
2.30
3.04
3.18
4.16
4.73
5.77
26
692
80
3.57
1157.54
0.43
0.32
0.00012
其中ti=x
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线
图710
(1)在答题卡中分别画出y关于t的散点图、z关于x的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).
图711
(2)根据表中数据,分别建立两个模型下y关于x的回归方程;并在两个模型下分别估计温度为30℃时的产
卵数.(C1,C2,C3,C4与估计值均精确到小数点后两位)(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
(3)若模型①、②的相关指数计算得分分别为R
【导学号:07804053】
[解] (1)画出y关于t的散点图,如图1;z关于x的散点图,如图2.
图1 图2
根据散点图可判断模型②更适宜作为回归方程类型.
(2)对于模型①:设t=x2,则y=C1x2+C2=C1t+C2,
其中
所以y=0.43x2-217.56,
当x=30时,估计温度为y1=0.43×302-217.56=169.44.
对于模型②:y=eC3x+C4⇒z=ln y=C3x+C4,
其中
所以y=e0.32x-4.75,
当x=30时,估计温度为y2=e0.32×30-4.75=e4.85≈127.74.
(3)因为R
- 1 -