首页 2数值变量的描述性统计

2数值变量的描述性统计

举报
开通vip

2数值变量的描述性统计nullnull复习 1.统计资料分为几类?特点? 判断:学历,职业,血红蛋白含量,血压等。 2.基本概念:总体和样本 参数和统计量抽样误差 统计推断 小概率事件 3.统计工作的基本步骤是什么? 第二章第二章计量资料的统计描述主要内容主要内容频数表 集中趋势 离散趋势 正态分布 正态分布的应用null原始资料第一节. 频 数 表第一节. 频 数 表 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对...

2数值变量的描述性统计
nullnull复习 1.统计资料分为几类?特点? 判断:学历,职业,血红蛋白含量,血压等。 2.基本概念:总体和样本 参数和统计量抽样误差 统计推断 小概率事件 3.统计工作的基本步骤是什么? 第二章第二章计量资料的统计描述主要内容主要内容频数 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 集中趋势 离散趋势 正态分布 正态分布的应用null原始资料第一节. 频 数 表第一节. 频 数 表 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。 原始资料原始资料null 例2.1 1.求全距 (R) : R = 最大值 – 最小值 = 173.6 – 154.7=18.9(cm) 2.确定组数:通常8~15组 计算组距(i) i=R/组数 i=18.9 / 10 = 1.89 cm 取整数 2 cm 所以,i=2 cm 组段首尾相接,最末组段同时表明上下限。 3.列表划记原始资料原始资料1998年100名18岁健康女大学生身高的频数分布1998年100名18岁健康女大学生身高的频数分布null二、频数分布图 null频数分布的两个特征: 集中趋势与离散趋势 频数分布的类型: 对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态) 频数表的主要用途: 1. 揭示分布类型 2. 发现特大值和特小值 3. 计算集中趋势指标与离散趋势指标nullnullnull 第二节 集中趋势 描述一组观察值集中趋势或平均水平的指标称为平均数。平均数为一指标体系。统计上的平均数一般包括算术平均数、几何平均数、中位数等.null 一、算术平均数 简称为均数,它是一组已知性质相同的数值之和除以数值个数所得的商。 总体均数:µ 样本均数: 适用于呈正态或近似正态分布的资料。 2 4 6 8 10 null1.直接法 当观察例数不多(样本含量n小于30) Σ为求和符号,Xi为各观察值,n为总例数。 例 13名健康成年男子脉搏资料(次/分) :81 70 66 75 71 63 77 74 76 68 65 77 69,均数为: =(81+70+66+75+71+63+77+74+76+68+65+77+69)/13 = 932/13 = 71.69 null 2.加权法 适用于频数表资料。 计算步骤是:首先将数据编制成频数表,得出每组的频数,求出各组的组中值Xi (每个组段的下限与上限之和除以 2),然后将组中值Xi和频数fi乘积相加求和,最后除以总频数。nullnull 二、几何均数 抗体滴度: 1:8、1: 16、1:32、1:64、 1:128、1:256 (1:84) 几何均数用 G表示,是将 n个观察值X的乘积再开 n次方所得的根。若对各观察值X取对数,对数值均值的反对数即为G。其适用对象:原始数据呈倍数关系或对数正态分布资料。 null l.直接计算法 观察例数不多(样本含量n小于30)null例 有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。 G=lg-1[(lg5+lg10+lg20+…+lg640)/8] =lg-1(1.752575)=56.57 null 2.频数表法 计算几何均数的观察值不能小于或等于0。 nullnull 三、中 位 数和百分位数 中位数用符号M表示。把一组变量值按大小顺序排列,位置居中的那个数值被称作中位数。中位数是一个位置指标,以中位数为界,将变量值分为左右两半。 中位数用于描述偏态、分布一端或两端无确定数值或分布不清的资料。null l.中位数直接计算法 (样本含量不大时使用) n为奇数时,M=X(n+l)/2 n为偶数时, M=(Xn/2+Xn/2+1)/2 例 有9名中学生甲型肝炎的潜伏期(天):12,13, 14,14,15,15,15,17,19,试求中位数。 变量值按大小顺序排列 M= X(9+1)/2=X5=15 若仅有前8名中学生的潜伏期,正中间有2个数据,则 M=(X8/2+X(8/2)+l)/2=(X4+X5)/2=(14+15)/2 =14.5null 2. 百分位数 用于描述一组观察值在某百分位置上的水平。第x百分位数以 Px表示。有(100-x)%的数值大于Px,有x%的数值小于Px。 步骤:先编制频数分布表,按所分组段由小到大计算累计频数和累计频数,确定 Px 所在组段,按下式计算。 L 该组段的下限, i为该组段的组距, fx该组段的频数, n为总的观察例数, ΣfL表示小于该组段的累计频数。 样本例数不够多时,两端的百分位数不稳定。 nullnull 对于正态分布或对称分布的资料,理论上中位数等于均数。但中位数没有充分利用观察到的每个变量值的信息。正态分布时: 均数=中位数 正偏态分布时:均数 > 中位数 负偏态分布时:均数 < 中位数正态分布时: 均数=中位数 正偏态分布时:均数 > 中位数 负偏态分布时:均数 < 中位数第三节 离散趋势 第三节 离散趋势 平均数仅描述了一组数据的集中趋势,可以作为总体的一个代表值。由于变异的客观存在,需要一类指标描述资料的离散趋势。两者结合使用才能对数据进行全面的统计学描述。 极差、四分位间距、方差、标准差 6 7 8 9 10 (8) 3 5 8 11 13 (8)null 一、极差 (range, R) 又称全距,即最大和最小观察值之间的间距,用极差描述资料的离散程度简单明了,但它不能反映观察值的整个变异度,样本的例数越多,极差越大,不够稳定。 null 二、四分位数间距 四分位数间距用 Q表示,是上四分位数QU(P75)和下四分位数QL(P25)之差。 Q=QU-QL=P75-P25=34.58-15.11=19.47 Q值越大,说明资料变异程度越大。常用于描述偏态分布资料的离散程度。该指标比全距稍稳定,但仍未考虑每个观察值。null三、方 差 总体中每个观察值Xi与总体均数μ之差称为离均差。其绝对值可反映个体变异的大小。但该值受观察例数多少的影响,为了消除这一影响,可取离均差平方和的均数。 方差的度量单位是原观察值单位的平方,使用不便。 null 四、标 准 差 标准差是方差的平方根 n-1为自由度,在单位相同、均数相差不大的条件下,标准差大表示变异程度大。 6 7 8 9 10 (8)null例 10名健康成年男子脉搏资料:75 76 72 69 66 72 57 68 71 72,计算标准差。 n=10, 例 利用120名8岁男孩身高的数据和频数表法计算标准差。nullnull 五、变异系数 变异系数(coefficient Of variation)用 CV表示。是标准差占均数的百分比例,用于比较多组单位不同或均数相差悬殊资料的变异度。 null 例 100名8岁男孩身高 =123.04cm,s=4.79cm;体重 =23.46kg,s=2.68kg,比较变异程度。 身高 CV=4.79/123.04×100% = 3.89% 体重 CV=2.68/23.64×100% = 11.42% 例 60名新生男婴体重 =3.40kg,s=0.42kg;80名18 岁男中学生体重 =57.20kg,s=5.60kg,比较变异 程度。 男婴 CV=0.42/3.40×100% = 12.06% 男中学生 CV=5.60/57.20×100% = 9.79%null小结 算术均数可以用于对称分布,尤其时正态资料的平均水平的描述 几何均数可以用于呈倍数变化的数据;对数正态分布资料 中位数、百分位数应用于任何分布类型的资料,尤其偏态 极差:任何分布,但少用 四分位间距:任何分布,尤其偏态;末端无具体值 方差、标准差:对称分布,尤其正态分布 变异系数:单位不同;均数相差较大 null习题: 1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不变 C.二者均不变 D.均改变 2.用均数和标准差可全面描述: A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布计算器的应用及操作计算器的应用及操作一、进入统计模式 MODE + 2 (SD) 二、清零 SHIFT + CLR + 1(SCL) + = 三、数据输入 1. 数据输入 55 DT 54 DT 51 DT 55 DT 53 DT 53 DT 54 DT 52 DT 2. 重复输入 双遍DT 3. 多次输入 10次110 110 SHIFT + ;+ 10 + DT 4. 删除 SHIFT + CL 可利用上下键选择计算器的应用及操作计算器的应用及操作四、计算 SHIFT + 1 + 1 = SHIFT + 1 + 2 = SHIFT + 1 + 3 = SHIFT + 2 + 1 = SHIFT + 2 + 2 = SHIFT + 2 + 3 = THANK YOU FOR LISTENING THANK YOU FOR LISTENING
本文档为【2数值变量的描述性统计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_000955
暂无简介~
格式:ppt
大小:962KB
软件:PowerPoint
页数:0
分类:
上传时间:2013-06-26
浏览量:9