首页 《管理统计学》马庆国著-

《管理统计学》马庆国著-

举报
开通vip

《管理统计学》马庆国著-第三章样本数据特征的初步分析一、整理样本数据信息在被操纵或处理后并没有超出其原有的格式原始数据--两种整理原始数据的根本方法数据阵列频数分布2、整理数据--数据阵列保存了数据的原值,并按数值的升序或降序显示数据。易观察到:数据集中包含最大观察值和最小观察值确认在某个数据集中哪些数组具有相同的值很容易发现各个值之间的差异3、样本数据结构的根本特征:频次与频率一、一些根本概念1、频次〔频数〕在有限的样本数据集合中,同样的数据值〔样本值〕出现的次数称为该样本值出现的频次。2、频率该样本值出现的频次/该数据集合的数据...

《管理统计学》马庆国著-
第三章样本数据特征的初步分析一、整理样本数据信息在被操纵或处理后并没有超出其原有的格式原始数据--两种整理原始数据的根本方法数据阵列频数分布2、整理数据--数据阵列保存了数据的原值,并按数值的升序或降序显示数据。易观察到:数据集中包含最大观察值和最小观察值确认在某个数据集中哪些数组具有相同的值很容易发现各个值之间的差异3、样本数据结构的根本特征:频次与频率一、一些根本概念1、频次〔频数〕在有限的样本数据集合中,同样的数据值〔样本值〕出现的次数称为该样本值出现的频次。2、频率该样本值出现的频次/该数据集合的数据总数。常用表示方法:〔1〕表;〔2〕饼图;〔3〕条形图;二、样本数据集合的根本特征的延伸:累积频率当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据xi的频率值累加起来,就得到“小于等于xi〞的累积频率。注:名义级的样本数据集合,不存在累积频率问题。表示法同上。整理数据--频数分布将数据值分成几组显示各组中有多少数值很容易发现数据的图形特点无法保存原始数据的值频数分布定义某个变量所有可能值的集合显示了变量的图形特点分布当数据集为小型时,数据之间的变化特点很容易观察出来随着数据集变为中型或大型,变量的特性一般表现得越来越不明显定义频数分布的类别频数分布频数每一组包含的观察值数目组组限每一组的上限和下限组宽上限和下限之间的间距如何将数据转换成表格?哪些重要或必要的信息应当包括在内?确定“组数〞和“组宽〞频数分布一般包括与每组有关的频数、累积频数、相对频数和相对累积频数频数分布频数分布累积频数相对频数相对累积频数显示每组范围内或其下有多少观察值相对频数描述每组范围内观察值所占的百分比,即每组的频数除以观察值的总数目显示每组范围内或其下观察值所占的百分比对于定性变量而言--常常根据变量结果的种类来选择组例如,为了研究本班100名学生的性别--频数分布对于定量变量而言--选择“组数〞和“组宽〞是主要问题频数分布应当遵循哪些根本原那么来确定组--1.各个组之间必须是“相互排斥〞的2.各个组必须将“所有数据均包括在内〞3.组数K的经验法那么2Kn,此处n代表观察值的总数目4.各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时,W频数分布5.应当尽量防止开口组6.组宽最好是整数例如,为了研究某班100名学生的身高--我们确定将整个数据分成5组,每组宽度相等,W=10厘米频数分布1.一张整理有序的表格可以使数据中隐藏的信息清楚地表现出来2.有助于采用图形方式来汇总数据数据集表格不具有唯一性频数分布频数分布以下数据表示一个当地咖啡馆进行的30笔交易举例146415347524816719254857696241463527726448517764515026428338频数分布首先--确定“组数〞和“组宽〞样本大小n=3025=32>305组最小观察值=14,最大观察值=83最好采用“整数〞W=15组数组宽频数分布茎叶图形数据必须按照升序排列为了构造图形,我们将数值的第一个数字作为茎茎叶排列使我们可以通过图形来了解数据的分布茎叶图形例如,我们想将12个数据转换成一张茎叶图形:4.43.64.43.77.63.93.63.52|23|05667894|4455|6|7|6茎叶图形用直观方式显示定量变量三种最常使用的图形类型--直方图频数多边形分布曲线在构造图形之前,需要用频数分布来显示数据用直观方式显示定量变量--直方图应当将数据转换成频数分布表水平轴代表变量的数值,核对符号代表每一组的中点垂直轴代表计数频数或百分比频数每个条形图的高度与每一组的频数或百分比相对应每个条形图的宽度与每一组的宽度相对应用直观方式显示定量变量--直方图例如,我们在本单元中想通过绘制直方图来表示100名学生的身高分布身高185.0175.0165.0155.0145.0计数频数403020100用直观方式显示定量变量--频数多边形身高190.0180.0170.0160.0150.0计数频数403020100200.0140.0用线段将各组中点和频数〔或相对频数〕的交叉点连接起来,就可以得到频数多边形图形身高.累积计数频数806040200100用直观方式显示定量--分布曲线图形显示了每一组的累积频数或相对累积频数它可以用“小于〞或“大于〞来表示定性变量常常用非数值刻度来测量对这些变量可以进行分类可以采用两种最为常见的图形来描述定性变量的分布饼图条形图用直观方式显示定性变量饼图的圆圈代表了所有观察值的集合根据定性变量的类型数目将饼图分成几个局部饼图每一局部的大小与每一类型的相对频数成正比用直观方式显示定性变量--饼图例如,我们可以用饼图来描述某班100名学生的性别分布状况男性60%女性40%用直观方式显示定性变量--饼图对于定性变量而言,条形图表示每一类型的百分比或计数频数每个条形图的高度代表每一类型的百分比或比例条形图的宽度没有意义,所有类型的宽度均相同用直观方式显示定性变量--条形图例如,我们用条形图来显示某班100名学生的性别分布状况020406080男性女性用直观方式显示定性变量--条形图SPSS统计软件给我们的工作带来了方便饼图:图形饼图对各组情形进行总结条形图:图形条形图对各组情形进行总结SPSS统计软件给我们的工作带来了方便直方图:图形直方图选择关心的变量茎叶图形:分析描述统计学寻找选择绘图选项集中趋势测度--未分组数据定义所有观察值的平均值均值所有观察值中位于最中心位置的那个值中位数出现最频繁的数据值众数均值--总体均值样本均值集中趋势测度--未分组数据Kim测验的平均成绩等于在此我们可以看到,在汇总Kim的测验成绩时,均值并不能发挥很好的作用。在大多数情况下,Kim的测验成绩低于30分,她只在一次测验中意外地获得了98的高分,因此她的平均成绩被提高到35分。集中趋势测度--未分组数据Kim是一名中等学校的学生,她上星期进行了5次测验,成绩分别如下7,98,25,19,和26均值对极值表现得非常敏感如果数据中存在极值〔或者说数据分布有所偏斜〕,那么均值就不能很好地测度集中趋势集中趋势测度--未分组数据中位数(Md)--1.将n个观察值按升序或降序排列2.如果观察值个数是奇数,那么中位数就是位于最中心位置的那个观察值,即数据集中的第个观察值3.如果观察值个数是偶数,那么中位数就是位于正中心两个观察值的平均值,即数据集中的第个和第个观察值的平均值集中趋势测度--未分组数据举例:有6名工人组成一个样本,请找出他们每周工资的中位数151179163142180195按升序重新排列每周的工资142151163179180195最中心位置的两个数值求这两个数值的平均数中位数=集中趋势测度--未分组数据Kim的5次测验成绩又如何呢?Kim成绩的中位数为25看来中位数能更好地测度Kim测验成绩的中心位置--中位数不受“极值〞的影响集中趋势测度--未分组数据众数(Mo)--并不经常用众数来测度中心位置适用于定性变量众数不具有唯一性集中趋势测度--未分组数据集中趋势测度--未分组数据举例:有6名工人组成一个样本,请找出他们每周工资的众数151179163142180195不存在众数151180163142180195180142180163142180195142和180(双峰)对两个旅行团的小孩年龄进行了数据调查,以下是调查结果:--A组年龄:14,17,11,10,11,14,9,12,8,10,9均值中位数11众数9,10,11和14(有4个众数)集中趋势测度--未分组数据B组age:9,14,8,10,13,7,9,11,16,10,12,9均值中位数10众数9集中趋势测度--未分组数据均值、中位数和众数之间的关系--1.对称分布(均值=Md=Mo)均值=Md=Mo集中趋势测度--未分组数据均值、中位数和众数之间的关系--2.倾向左侧(均值Md>Mo)MdMo均值集中趋势测度--未分组数据集中趋势测度--分组数据为了计算分组数据的均值–计算每一组的中点假设观察值都落在各组的中点上总体均值样本均值集中趋势测度--分组数据举例:以下频数分布显示了某家公司50名工人的每周工资收入,估计每周工资的平均水平集中趋势测度--分组数据每周的平均工资集中趋势测度--分组数据为了计算分组数据的中位数–计算每一组的累积频数包括“最中心位置〞观察值的那一组就是“中位数组〞LMd:中位数组的下限fMd:中位数组的频数w:中位数组的宽度c:位于中位数组之前那一组的累积频数集中趋势测度--分组数据举例:继续讨论前面的例子,即计算50名工人每周工资收入的中位数集中趋势测度--分组数据LMdfMd=12w=10c=19中位数组170–179每周工资收入的中位数集中趋势测度--分组数据为了计算分组数据的众数–出现最频繁的那一组就是“众数组〞LMo:众数组的下限d1:众数组的频数减去众数组之前那一组的频数w:众数组的宽度d2:众数组的频数减去众数组之后那一组的频数集中趋势测度--分组数据举例:继续讨论前面的例子,即计算50名工人每周工资收入的众数集中趋势测度--分组数据LMow=10d1=12–9=3众数组170–179每周工资收入的众数d2=12–9=3集中趋势测度举例:A列数据:5556575859606162636465均值=Md=Mo=60B列数据:3540455055606570758085均值=Md=Mo=60离中趋势测度--未分组数据测度离中趋势最常用的三种方法--1.全距2.标准差(SD)3.变异系数(CV)离中趋势测度--未分组数据全距=最大观察值–最小观察值全距有两个主要缺点--1.对数据集中的极值显得非常敏感2.忽略了位于最大观察值与最小观察值之间的数据是如何分布的定义离中趋势测度--未分组数据离中趋势测度--未分组数据举例:有5名工人组成一个样本,请找出他们每周工资的全距151179163142180X最大值=180X最小值=142全距=180–142=38标准差可以让我们大致了解数据值距离均值有多远定义标准差离中趋势测度--未分组数据总体标准差,样本标准差,s离中趋势测度--未分组数据计算标准差的其他公式–总体标准差:样本标准差:离中趋势测度--未分组数据举例:有5名工人组成一个总体,请找出他们每周工资的标准差151179163142180XX-m(X-m)2151-121441791625616300142-2144118017289SX=815S(X-m)2=1130数据分布的经验法那么--当数据集接近对称分布时,那么大约68.3%的数据落在均值的1倍标准差范围内95.5%的数据落在均值的2倍标准差范围内99.75%的数据落在均值的3倍标准差范围内离中趋势测度--未分组数据测量数据相对于均值的离中趋势定义变异系数(CV)离中趋势测度--未分组数据??什么时候采用变异系数(CV)来测度离中趋势??比较具有不同单位的数据集比较具有不同幅度的数据集离中趋势测度--未分组数据举例:例如,我们想比较1993年2月至1994年1月期间黄金和锌块的价格波动情况,我们收集了价格数据并得出如下计算结果:黄金:锌块:每盎司每磅离中趋势测度--未分组数据CV表示每种商品相对于其自身平均价格的波动幅度:黄金:锌块:离中趋势测度--未分组数据离中趋势测度--分组数据为了计算分组数据的标准差–计算每一组的中点假设观察值都落在各组的中点上总体标准差样本标准差离中趋势测度--分组数据总体标准差样本标准差计算标准差的其他公式离中趋势测度--分组数据举例:计算工人每周工资的总体标准差--离中趋势测度--分组数据每周工资收入工人人数(f)中点(x)(x-m)(x-m)2f(x-m)2140~1494150~1596160~1699170~17912180~1899190~199719200~2093N=Sf=50Sf(x-m)2=13298总体标准差离中趋势测度--分组数据举例:计算工人每周工资的样本标准差离中趋势测度--分组数据每周工资收入工人人数(f)中点(x)(x-)(x-)2f(x-)2140~1494150~1596160~1699170~17912180~1899190~199719200~2093N=Sf=50Sf(x-m)2=13298样本标准差样本数据的离散特征1、四分点下四分点:把排序后的样本数据集合,分成左右两局部,使左边局部包含25%的样本总个数,使右边包含75%的样本总个数。上四分点:把排序后的样本数据集合,分成左右两局部,使左边局部包含75%的样本总个数,使右边包含25%的样本总个数。2、十分点下十分点:把排序后的样本数据集合,分成左右两局部,使左边局部包含10%的样本总个数,使右边包含90%的样本总个数。上十分点:把排序后的样本数据集合,分成左右两局部,使左边局部包含90%的样本总个数,使右边包含10%的样本总个数。样本数据离散特征的区间描述:极差〔R〕:R=极大值-极小值四分位距〔Iqr〕:Iqr=上四分点–下四分点离差:每个样本值与样本均值之差。离差平方和:〔略〕。离散状况的统计值描述:样本方差样本数据特征的综合表达:箱体图箱体图根本结构刻度尺极差极小值极大值下四分点中位数上四分点四分位距SPSS统计软件给我们的工作带来了方便数值汇总:分析描述统计学频数选择统计选项注意,我们可以使用“样本〞数据来计算标准差2.SPSS输出结果中不包含CV
本文档为【《管理统计学》马庆国著-】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥18.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
婷婷
我是一名语文老师,一直担任班主任。
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:教育学
上传时间:2021-09-20
浏览量:16