null统计与统计案例统计与统计案例null
1.简单随机抽样
从元素个数为N的总体中 抽取容量为n的
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
,如果每一次抽取时总体中的各个个体有 被抽到,这种抽样方法叫做简单随机抽样.常用的简单随机抽样方法有 和 .逐个不放回地相等的(机会)概率抽签法随机数表法null2.系统抽样
当总体中的个体数较多时,可将总体分成均衡若干部分,然后按照预先制定的规则,从每一部分 ,得到所需要的样本,这种抽样方法叫做系统抽样.
3.分层抽样
当总体由 的几部分组成时,将总体中各个个体按某种特征分成若干个能充分反映总体情况的几部分,每一部分叫做层,在各层中按各部分在总体中 进行简单随机抽样,这种抽样方法叫做 .抽取一个个体差异明显所占的比例分层抽样null4.三种抽样方法的区别与联系:null1.相关关系及回归
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
(1)相关关系:自变量取值一定时,因变量的取值带有一定 的两个变量之间的关系叫做相关关系.
(2)回归分析:在统计中,对具有相关关系的两个变量进行 叫做回归分析.回归分析是寻找相关关系中非确定关系的某种确定性.随机性统计分析null2.散点图:将n个数据点(xi,yi)(i=1,2,3…n)描在平面直角坐标系中,以表示具有相关关系的两个变量的 叫做散点图.
3.正相关与负相关:从散点图上看,点散布的位置在从 的区域内,两个变量的这种相关关系称为正相关;点散布的位置在从 的区域内,两个变量的相关关系称为负相关. 左下角到右上角左上角到右下角图形nullnullnull5.线性回归模型y=bx+a+e(e称为 ),因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化.在统计中,我们也把自变量x称为 ,因变量y称为 .随机误差解释变量预报变量null
系的强弱.当r>0时,表示两个变量 ;当r<0时,表示两个变量 ;r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表示两个变量间之间 线性相关关系.通常当r> 时,认为两个变量有很强的线性相关关系.正相关负相关几乎不存在0.75null7.用相关指数R2来刻画回归的效果,其计算公式是
R2= R2的值越大,说明残差平方和越
小,也就是说模型拟合的效果 .在线性回归模型中,R2表示解释变量对预报变量变化的 ,R2越接近于1,表示回归的效果越好.越好贡献率null8.变量的不同“值”表示个体所属的 ,这样的变量称为分类变量.
9.列出两个分类变量的 表,称为列联表.
一般地,假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表如下表:称为2×2列联表.不同类别频数null10.利用随机变量K2来确定在 可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其中K2= 多大程度上null独立性检验null(1)计算线性回归方程的斜率与截距公式:(2)回归直线的线性回归方程:null求解线性回归问题的步骤:
1.列表 , 画散点图.
2.计算:
3.代入公式求 和
4.列出直线方程nullnull1.下表是某厂1~4月份用水量(单位:百吨)的一组数据,
由其散点图可知,用水量y与月份x之间有较好的线性相关关系,求y与x的回归方程并预测5月份用水量。2:在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;
(2)检验休闲方式是否与性别有关,可靠性有多大.nullnull练习2:在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)检验休闲方式是否与性别有关,可靠性有多大.null解:(1)2×2列联表如下:null
(2)假设休闲方式与性别无关,则
所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关.