2014年高考一轮复习热点难点精讲精析:
10.2用样本估计总体与变量间的相关关系
一、用样本估计总体
(一)频率分布直方图在总体估计中的应用
※相关链接※
频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示组距,纵坐标表示,频率=组距×.
(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
(4)众数为最高矩形中点的横坐标.
(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
※例题解析※
〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
思路解析:利用面积求得每组的频率求样本容量求频率和求达标率
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
中位数.
解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.
(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.
(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.
注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.
(二)用样本的分布估计总体
※相关链接※
茎叶图刻画数据的优点
(1)所有的数据信息都可以从茎叶图中得到.
(2)茎叶图便于
记录
混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载
和表示,且能够展示数据的分布情况.
注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.
※例题解析※
〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,得到什么结论?
思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.
解答:(1)如图:
(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.
(三)用样本的数字特征估计总体的数字特征
〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.
解答:(1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
(2)由>可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.
(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差描述波动大小.
(3)平均数、方差的公式推广
①若数据的平均数为,那么的平均数是.
②数据的方差为.
a.
b.数据的方差也为;
c.数据的方差为.
二、变量间的相关关系
(一)利用散点图判断两个变量的相关关系
※相关链接※
1.散点图
在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.
2.正相关、负相关
从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.
反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.
※例题解析※
〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
思路解析:(1)用x轴表示身高,y轴表示体重,逐一描出各组值对应的点.(2)分析两个变量是否存在相关关系.
解答:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为正相关.
(二)求回归方程
※相关链接※
最小二乘法
(1)最小二乘法是种有效地求回归方程的
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
,它保证了各点与此直线在整体上最接近,最能反映样本观测数据的规律.
(2)最小二乘法估计的一般步骤:
①作出散点图,判断是否线性相关;
②如果是,则用公式求a、b,写出回归方程;
③根据方程进行估计.
注:如果两个变量不具有线性相关关系,即使求出回归方程也毫无意义,而且用其进行估计和预测也是不可信的.
※例题解析※
〖例〗如表,其提供了某厂节能降耗技术改造生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据
(1)请画出表中数据的散点图;
(2)请根据表中提供的数据,用最小二乘法求出y关于x的回归方程
思路解析:作散点图求出求得回归方程
解答:(1)题设所给数据,可得散点图如图.
(2)对照数据,计算得:
,
所以,由最小二乘法确定的回归方程的系数为:
因此,所求的线性回归方程为.
(三)利用回归方程对总体进行估计
〖例〗炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如表所示:
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
思路解析:(1)将表中的各对数据在平面直角坐标系中描点,得到散点图;(2)按求回归方程的步骤和公式,写出回归方程;(3)利用回归方程分析.
解答:(1)可作散点图如图所示:
由图可知它们呈线性相关关系.
(2)
(3)把x=160代入得,y=172.25(分钟),
预测当钢水含碳量为160时,应冶炼172.25分钟.
注: 利用回归方程可以进行预测估计总体,回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础和依据,有广泛的应用.
PAGE
7