首页 第四章 统计学

第四章 统计学

举报
开通vip

第四章 统计学第四章数据分布特征的描述学习目的和重难点提示本章学习目的领会数据分布的各种特征:集中趋势、离散趋势、偏斜程度和峰度。掌握数据分布特征各测定值的计算方法、特点及其应用场合。本章重难点提示数据分布特征的描述方法,如何使用一些统计量来对数据进行概括性测定。数据分布特征各测定值的计算方法、特点及其应用场合。补充知识一、绝对指标二、相对指标一、绝对指标(一)绝对指标的含义绝对指标(总量指标,或简称绝对数)是反映社会经济现象在一定时间、地点条件下规模或绝对水平的总量。如:2008年中国GDP为300670亿元。2009年4月底...

第四章 统计学
第四章数据分布特征的描述学习目的和重难点提示本章学习目的领会数据分布的各种特征:集中趋势、离散趋势、偏斜程度和峰度。掌握数据分布特征各测定值的计算方法、特点及其应用场合。本章重难点提示数据分布特征的描述方法,如何使用一些统计量来对数据进行概括性测定。数据分布特征各测定值的计算方法、特点及其应用场合。补充知识一、绝对指标二、相对指标一、绝对指标(一)绝对指标的含义绝对指标(总量指标,或简称绝对数)是反映社会经济现象在一定时间、地点条件下规模或绝对水平的总量。如:2008年中国GDP为300670亿元。2009年4月底中国外汇储备为17566亿美元。(二)绝对指标的种类1、按总量指标的总体内容不同分:总体总量:指总体单位总数。标志总量:指总体单位某一数量标志值的总和。2、按总量指标所反映的时间不同分:时期指标(时期数)时点指标(时点数)3、按计量单位不同分:实物指标价值指标劳动量指标二、相对指标(一)相对指标的含义相对指标是两个有联系的统计指标进行对比的比值。也称为相对数。①成数无名数②系数和倍数③百分数、千分数、万分数有名数④单名数和复名数。(二)相对指标的种类1、 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 完成相对数2、结构相对数3、比较相对数4、比例相对数5、动态相对数6、强度相对数1、计划完成相对数概念:计划期内实际完成数与计划数之比。作用:考核、反映计划完成的程度(进度)。基本计算 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 :4、比例相对数概念:同一总体某一部分数值与另一部分数值对比的比值。作用:反映总体各部分间的内在联系与比例关系。(同一总体不同部分比较)计算公式:特点:分子分母同属一个总体,而且分子与分母的位置可以互换。5、动态相对数概念:某一社会经济现象在不同时期两个数值对比的比率。又称发展速度或指数。作用:反映事物发展变化的方向与程度。计算公式:式中:报告期又称计算期,是研究或计算时期。基期是作为比较基础的时期。特点:分子与分母的位置一般不能互换。常用百分数、倍数、千分数表示。6、强度相对数概念:两个性质不同而又相互联系指标之比。作用:①反映一国一地的发展水平、力量强弱。②反映事物存在的密度、普遍程度、运动强度、负担强度。③反映经济效益的高低。计算公式:特点:有正指标和逆指标之分,数值大小与强度成正比为正指标,反之为逆指标。有些指标分子与分母可互换。计量单位常用复名数。运用相对数应遵循的原则1、两个对比指标要有可比性。2、相对数要和总量指标结合使用。3、各种相对指标结合运用。第一节数据分布集中趋势的测定一、均值(平均数、数值平均数,mean)(一)概念均值是反映数据分布集中趋势十分重要的数据,代表总体单位某一标志值的一般水平。(二)特征1.具有抽象性。2.具有代表性。3.反映总体分布的集中趋势。(三)举例1.某市中学生每周平均上网时间为2.8小时。2.某农贸市场2月份牛肉的平均价格为16元/千克。3.某地区“十五”期间经济平均增长率为9.6%。(四)均值的种类及计算1.算术平均数**(1)概念算术平均数又称平均值,是用一组数据中所有值之和除以该组数据的个数。(2)基本公式算术平均数的计算**简单算术平均数:总体平均数样本平均数算术平均数的计算**加权算术平均数概念:是对每个数据都根据其在全组中的重要程度赋予一定权重后得到的算术平均数。计算公式:(1)未分组数据其中,w表示各组的标志总量,而不是各组变量值出现的次数,总体和样本加权算术平均数的公式是相同。 [例4-1]根据某公司四个品牌数码相机的销售资料计算平均利润率。表4-1四个品牌数码相机的利润率和销售额资料所以,四个品牌数码相机的平均销售利润率为:因为:**加权算术平均数⑵分组的加权平均数:根据分组数据计算均值。 样本均值的计算公式:总体均值的计算公式:表示各组的变量值(组距式数列的组中值);表示各组变量值出现的频数(即权数)。其中, [例4-2]根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。按销售量分组(台) 组中值(Mi)市场个数(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175 合 计— ∑fi=120∑Mifi=222002.调和平均数(1)概念:调和平均数又称倒数平均数,是各个变量值倒数的算术平均数的倒数。(2)计算简单调和平均数:针对未分组资料。计算公式为:2.调和平均数加权调和平均数:针对分组资料。计算公式为:其中:是一种特殊权数,它不是各组变量值出现的次数,表示各组标志总量。即 [例4-3]根据某商场职工月工资资料计算月平均工资。表4-3某商场职工月工资资料3.几何平均数(1)概念:几何平均数(geometricmean)又称对称平均数,它是各变量值乘积的n次方根。(2)计算基本公式:对数公式:在实际工作中,由于变量个数较多,通常要应用对数来进行计算。即(3)几何平均数的应用及特点①应用条件a.变量值是相对数据,如比率或发展速度。b.变量值的连乘积等于总比率或总发展速度。②特点a.如果数列中有一个标志值等于零或负值,则无法计算。b.受极端值影响较小,故较稳健。 [例4-4]某电器销售公司2000~2005年销售量的环比增长率分别为:7.6%、2.5%、0.6%、2.7%和2.2%。求这期间销售量的平均增长速度。表4-4销售量平均发展速度计算表几何平均数的计算示例几何平均数的计算示例1.采用基本公式计算的销售量平均发展速度为:2.采用对数公式计算的销售量平均发展速度为:所以,销售量的平均增长速度=103.1%-1=3.1%二、位置平均数(一)中位数(median)1.概念中位数是将一组数据项按照数值大小升序或者降序排列后位于中间位置的那个数据,符号为。2.中位数的计算方法(1)未分组数据的中位数将变量值按升序或降序排列,找中间位置的变量值。(2)单项数列的中位数计算各组的累计频数(向上累计或向下累计);根据中位数位置确定中位数。[例4-5]计算某公司销售人员月销售冰箱中位数表4-5某公司销售人员月销售冰箱中位数计算按月销售冰箱分组(台)销售人员数(人)向上累计频数向下累计频数25303234363931014271883132754728080776753268合计80--中位数的位置即中位数在累计频数为40的那一组内(向上累计或向下累计均可得出),则。2.中位数的计算方法(3)组距数列的中位数:由下列公式近似计算下限公式其中:为总体单位总数;为中位数组的下限;为中位数组以下的累计频数;为中位数组的频数;为中位数组的组距;[例4-6]求以下组距数列的中位数。按家庭收入分组(元)家庭数(户)向上累计频率5000以下5000~1000010000~1500015000~2000020000以上214514662166808692合计92-中位数的近似值为:表4-6某地区家庭收入分组中位数的位置在第46(92/2)位,应在第二组中位数的特点⑴是一种位置平均数,不受极端值及开口组的影响。⑵对于分配不对称的数据,中位数比平均值更适合当集中趋势的代表值。⑶对某些不具有数字特征或不能用数字测定的现象,可用中位数表示其一般水平。例如,对众多的消费者购买数码相机时,分别对价格、外观、品质的注重程度排序后,可以求出消费者在乎的中位数因素。二、位置平均数(二)众数1.概念众数(mode)是指在一组数中出现次数最多的那个数值,符号为。2.数据数列的众数分布情况无众数如数据数列:13791268一个众数如数据数列:659866多个众数如数据数列:2235273527363.众数的计算方法**品质变量的众数——观察次数,出现次数最多的变量值就是众数。例如:企业的所有制结构分布、人口的城乡分布。**数值变量的众数未分组资料——观察次数,出现次数最多的数据就是众数。分组资料(1)单项式数列——直接观察,次数最多的组的变量值即为众数。[例4-7]单项式变量数列确定众数实例表4-7某市居民家庭按家庭人口数分组由上表可以看出,家庭人口数为3人的家庭数最多,因此本例中家庭人口数的众数为3人。3.众数的计算方法组距数列计算众数:由下列公式近似计算:其中为众数组与前一组频数之差;为众数组的下限;为众数组与后一组频数之差;为众数组的组距。[例4-8]组距式数列计算众数示例收入组别人均收入(元)频数(人)1234562000元以下2000~4000元4000~6000元6000~8000元8000~10000元10000以上234368322410合计-200其众数的近似值为:表4-8某地区的人均月收入调查数据三、均值、中位数和众数的比较(一)均值、中位数和众数的数量关系1.当数据呈对称分布时,三者合而为一。2.当数据呈左偏分布时,说明数据存在极小值,必然拉动均值向极小值一方靠,则从左至右依次是均值、中位数和众数。3.当数据呈右偏分布时,说明数据存在极大值,必然拉动均值向极大值一方靠,则从左至右依次是众数、中位数和均值。三、均值、中位数和众数的比较(二)均值、众数和中位数的特点及应用场合**均值是对数值型数据的计算,利用了全部数据信息,具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。**中位数是一组数据中间位置上的代表值,其特点是不受数据极端值的影响,主要适合于作为顺序数据的集中趋势测度值。**众数是一组数据分布的峰值,它也是一种位置代表值,不受极端值的影响,主要适合于作为分类数据的集中趋势测度值。第三节数据分布离散程度的测定一、极差(一)概念:又称全距,是数据中最大值和最小值之差。记为。(二)计算1.未分组数据的极差为:表示数据的最大值;表示数据的最小值。2.分组数据的极差极差=最大组的上限-最小组的下限若存在开口组,则:最大组的上限=前一组的上限+组距最小组的下限=下一组的下限-组距其中:(三)修正极差1.概念:修正极差(modifiedrange)是去掉极端值后的极差,又称四分位全距(IQR,interquartilerange),是中间50%的数据的间距,即数据分布中第25个和第75个百分位数的间距,也即第1个和第3个四分位数的间距。2.公式:其中,Q3表示第3个四分位数,即第75个百分位数;Q1表示第1个四分位数,即第25百分位数。二、平均差(一)概念平均差(meanabsolutedeviation,MAD)是各数据对平均数的离差绝对值的平均数。(二)样本平均差的计算公式1.未分组数据:2.分组数据:三、方差和 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差(一)概念方差(variance)是各变量值与其均值离差平方的平均数。标准差(standarddeviation)是方差的平方根,又称“均方差”。(二)比较与评价1.其内涵与平均差相似,均为各个数据对其平均数的平均离差。但平均差采用求绝对值消除正负离差,标准差采用平方法消除正负离差,在数学处理上标准差比平均差更为科学合理。2.方差和标准差是测度数值型数据离散程度的最主要的指标。[例4-9]某电脑公司销售量分组数据如表4-7,计算销售量的方差和标准差表4-7某电脑公司销售量分组数据(三)总体方差和标准差计算示例总体方差和标准差计算示例根据公式计算可知总体均值为:总体方差为:总体标准差为:[例4-10]根据以下资料,计算企业职工平均工资的标准差。(已知平均工资为760元)表4-9某企业职工工资分组数据表总体方差和标准差计算示例总体方差为:总体标准差为:(四)样本方差和标准差1.说明在大多数统计应用中,都针对样本数据来分析总体数量特征。因此通常用样本方差来估计总体方差,用样本标准差来估计总体标准差。2.符号样本容量用n表示;样本方差用S2表示;样本标准差用S表示。3.计算公式与总体方差和标准差公式类似,区别在于分母除以n-1。四、离散系数(一)概念:离散系数(coefficientofvariation)也称变异系数,是一组数据的离散指标的绝对数与其相应的均值之比,是离散指标的相对数形式。(二)表现形式有全距系数、平均差系数和标准差系数。最常用的是标准差系数。(三)计算公式总体标准差系数样本标准差系数四、离散系数(四)应用:用于比较不同总体数据分布的离散程度。[例 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 4-11]甲乙企业职工的年均收入分别为20000元和50000元,收入的标准差分别为3000和5000元,哪家企业职工的收入差距小一些?[分析]不同企业的年均收入不同,不能直接比较标准差,只能比较标准差系数。[结论]乙企业职工收入差距小于甲企业。甲企业标准差系数乙企业标准差系数第四节数据分布偏态与峰态的测定一、偏态及其测定(一)偏态(skewness)是指数据分布的不对称性,其度量值称为偏态系数SK。(二)计算未分组数据:分组数据:是样本标准差的三次方。一、偏态及其测定(三)偏态系数大小的说明 偏态系数SK=0,说明数据为对称分布。  偏态系数SK≠0,说明数据为偏态分布。  其中:SK>0说明数据为正偏(右偏)分布;     SK<0说明数据为负偏(左偏)分布。二、峰态及其测定(一)峰态(kurtosis)是指正态分布数据的平峰或尖峰程度,其度量值为峰态系数。(二)峰态通常是与标准正态分布相比较而言的。  若数据服从标准正态分布,则峰态系数=0。  若数据服从非标准正态分布,则峰态系数≠0。   当峰态系数>0时为尖峰分布,即比正态分布更尖。   当峰态系数<0时为平峰分布,即比正态分布偏平。本章 小结 学校三防设施建设情况幼儿园教研工作小结高血压知识讲座小结防范电信网络诈骗宣传幼儿园师德小结 1.数据集中趋势的测定介绍了各种均值、中位数、众数的概念和特点,比较了均值、中位数、众数的特点,重点介绍其计算方法和应用场合。2.数据离散程度的测定介绍了极差、平均差、方差、标准差、离散系数的概念和计算方法。重点是方差、标准差及标准差系数的计算。3.数据偏态与峰态的测定简单介绍了偏态和峰态的基本概念及测定方法。END
本文档为【第四章 统计学】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥16.8 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
于于
暂无简介~
格式:ppt
大小:1MB
软件:PowerPoint
页数:60
分类:建筑/施工
上传时间:2021-11-23
浏览量:5