nullnull复习
1.统计资料分为几类?特点?
判断:学历,职业,血红蛋白含量,血压等。
2.基本概念:总体和样本 参数和统计量抽样误差 统计推断 小概率事件
3.统计工作的基本步骤是什么?
第二章第二章计量资料的统计描述主要内容主要内容频数
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
集中趋势
离散趋势
正态分布
正态分布的应用null原始资料第一节. 频 数 表第一节. 频 数 表 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。
频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。
原始资料原始资料null
例2.1
1.求全距 (R) : R = 最大值 – 最小值
= 173.6 – 154.7=18.9(cm)
2.确定组数:通常8~15组
计算组距(i) i=R/组数
i=18.9 / 10 = 1.89 cm 取整数 2 cm
所以,i=2 cm
组段首尾相接,最末组段同时表明上下限。
3.列表划记原始资料原始资料1998年100名18岁健康女大学生身高的频数分布1998年100名18岁健康女大学生身高的频数分布null二、频数分布图
null频数分布的两个特征:
集中趋势与离散趋势
频数分布的类型:
对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)
频数表的主要用途:
1. 揭示分布类型
2. 发现特大值和特小值
3. 计算集中趋势指标与离散趋势指标nullnullnull 第二节 集中趋势
描述一组观察值集中趋势或平均水平的指标称为平均数。平均数为一指标体系。统计上的平均数一般包括算术平均数、几何平均数、中位数等.null 一、算术平均数
简称为均数,它是一组已知性质相同的数值之和除以数值个数所得的商。
总体均数:µ 样本均数:
适用于呈正态或近似正态分布的资料。
2 4 6 8 10 null1.直接法
当观察例数不多(样本含量n小于30)
Σ为求和符号,Xi为各观察值,n为总例数。
例 13名健康成年男子脉搏资料(次/分) :81 70 66 75 71 63 77 74 76 68 65 77 69,均数为: =(81+70+66+75+71+63+77+74+76+68+65+77+69)/13 = 932/13 = 71.69
null 2.加权法 适用于频数表资料。
计算步骤是:首先将数据编制成频数表,得出每组的频数,求出各组的组中值Xi (每个组段的下限与上限之和除以 2),然后将组中值Xi和频数fi乘积相加求和,最后除以总频数。nullnull 二、几何均数
抗体滴度: 1:8、1: 16、1:32、1:64、
1:128、1:256 (1:84)
几何均数用 G表示,是将 n个观察值X的乘积再开 n次方所得的根。若对各观察值X取对数,对数值均值的反对数即为G。其适用对象:原始数据呈倍数关系或对数正态分布资料。
null l.直接计算法
观察例数不多(样本含量n小于30)null例 有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。
G=lg-1[(lg5+lg10+lg20+…+lg640)/8]
=lg-1(1.752575)=56.57
null 2.频数表法
计算几何均数的观察值不能小于或等于0。
nullnull 三、中 位 数和百分位数
中位数用符号M表示。把一组变量值按大小顺序排列,位置居中的那个数值被称作中位数。中位数是一个位置指标,以中位数为界,将变量值分为左右两半。
中位数用于描述偏态、分布一端或两端无确定数值或分布不清的资料。null l.中位数直接计算法 (样本含量不大时使用)
n为奇数时,M=X(n+l)/2
n为偶数时, M=(Xn/2+Xn/2+1)/2
例 有9名中学生甲型肝炎的潜伏期(天):12,13,
14,14,15,15,15,17,19,试求中位数。
变量值按大小顺序排列
M= X(9+1)/2=X5=15
若仅有前8名中学生的潜伏期,正中间有2个数据,则
M=(X8/2+X(8/2)+l)/2=(X4+X5)/2=(14+15)/2
=14.5null 2. 百分位数
用于描述一组观察值在某百分位置上的水平。第x百分位数以 Px表示。有(100-x)%的数值大于Px,有x%的数值小于Px。
步骤:先编制频数分布表,按所分组段由小到大计算累计频数和累计频数,确定 Px 所在组段,按下式计算。
L 该组段的下限, i为该组段的组距, fx该组段的频数, n为总的观察例数, ΣfL表示小于该组段的累计频数。 样本例数不够多时,两端的百分位数不稳定。 nullnull 对于正态分布或对称分布的资料,理论上中位数等于均数。但中位数没有充分利用观察到的每个变量值的信息。正态分布时: 均数=中位数
正偏态分布时:均数 > 中位数
负偏态分布时:均数 < 中位数正态分布时: 均数=中位数
正偏态分布时:均数 > 中位数
负偏态分布时:均数 < 中位数第三节 离散趋势
第三节 离散趋势
平均数仅描述了一组数据的集中趋势,可以作为总体的一个代表值。由于变异的客观存在,需要一类指标描述资料的离散趋势。两者结合使用才能对数据进行全面的统计学描述。
极差、四分位间距、方差、标准差
6 7 8 9 10 (8)
3 5 8 11 13 (8)null 一、极差 (range, R)
又称全距,即最大和最小观察值之间的间距,用极差描述资料的离散程度简单明了,但它不能反映观察值的整个变异度,样本的例数越多,极差越大,不够稳定。
null 二、四分位数间距
四分位数间距用 Q表示,是上四分位数QU(P75)和下四分位数QL(P25)之差。
Q=QU-QL=P75-P25=34.58-15.11=19.47
Q值越大,说明资料变异程度越大。常用于描述偏态分布资料的离散程度。该指标比全距稍稳定,但仍未考虑每个观察值。null三、方 差
总体中每个观察值Xi与总体均数μ之差称为离均差。其绝对值可反映个体变异的大小。但该值受观察例数多少的影响,为了消除这一影响,可取离均差平方和的均数。
方差的度量单位是原观察值单位的平方,使用不便。
null 四、标 准 差
标准差是方差的平方根
n-1为自由度,在单位相同、均数相差不大的条件下,标准差大表示变异程度大。
6 7 8 9 10 (8)null例 10名健康成年男子脉搏资料:75 76 72 69 66 72 57 68 71 72,计算标准差。
n=10,
例 利用120名8岁男孩身高的数据和频数表法计算标准差。nullnull 五、变异系数
变异系数(coefficient Of variation)用 CV表示。是标准差占均数的百分比例,用于比较多组单位不同或均数相差悬殊资料的变异度。 null 例 100名8岁男孩身高 =123.04cm,s=4.79cm;体重
=23.46kg,s=2.68kg,比较变异程度。
身高 CV=4.79/123.04×100% = 3.89%
体重 CV=2.68/23.64×100% = 11.42%
例 60名新生男婴体重 =3.40kg,s=0.42kg;80名18
岁男中学生体重 =57.20kg,s=5.60kg,比较变异
程度。
男婴 CV=0.42/3.40×100% = 12.06%
男中学生 CV=5.60/57.20×100% = 9.79%null小结
算术均数可以用于对称分布,尤其时正态资料的平均水平的描述
几何均数可以用于呈倍数变化的数据;对数正态分布资料
中位数、百分位数应用于任何分布类型的资料,尤其偏态
极差:任何分布,但少用
四分位间距:任何分布,尤其偏态;末端无具体值
方差、标准差:对称分布,尤其正态分布
变异系数:单位不同;均数相差较大
null习题:
1.各观察值加同一数后:
A.均数不变,标准差改变
B.均数改变,标准差不变
C.二者均不变 D.均改变
2.用均数和标准差可全面描述:
A.正偏态资料 B.负偏态资料
C.正态分布和近似正态分布 D.任何分布计算器的应用及操作计算器的应用及操作一、进入统计模式 MODE + 2 (SD)
二、清零 SHIFT + CLR + 1(SCL) + =
三、数据输入
1. 数据输入 55 DT 54 DT 51 DT 55 DT 53 DT 53 DT 54 DT 52 DT
2. 重复输入 双遍DT
3. 多次输入 10次110 110 SHIFT + ;+ 10 + DT
4. 删除 SHIFT + CL 可利用上下键选择计算器的应用及操作计算器的应用及操作四、计算
SHIFT + 1 + 1 =
SHIFT + 1 + 2 =
SHIFT + 1 + 3 =
SHIFT + 2 + 1 =
SHIFT + 2 + 2 =
SHIFT + 2 + 3 = THANK YOU FOR LISTENING THANK YOU FOR LISTENING