首页 北京大学_甘怡群教授_心理统计讲义WORD版_92页(全)

北京大学_甘怡群教授_心理统计讲义WORD版_92页(全)

举报
开通vip

北京大学_甘怡群教授_心理统计讲义WORD版_92页(全)心理统计 北京大学心理系(2011-2012年上学期) 讲员信息 主讲: 甘怡群博士, 副教授 电话: 6275 7271 Office: 交流中心350s e-mail: ygan@pku.edu.cn 助教: 王晓春、庄明科 辅导时间 周一16:00-17:00 周五19:00-20:00 事先预约 联络方式 : 王晓春:62757271 62763176 庄明科:62757271 e-mail: 王晓春:zbtl@263.net 庄明科:zm...

北京大学_甘怡群教授_心理统计讲义WORD版_92页(全)
心理统计 北京大学心理系(2011-2012年上学期) 讲员信息 主讲: 甘怡群博士, 副教授 电话: 6275 7271 Office: 交流中心350s e-mail: ygan@pku.edu.cn 助教: 王晓春、庄明科 辅导时间 周一16:00-17:00 周五19:00-20:00 事先预约 联络方式 : 王晓春:62757271 62763176 庄明科:62757271 e-mail: 王晓春:zbtl@263.net 庄明科:zmk2000@263.net 课程介绍 课程内容:行为科学(重点在心理学)中用到的基本统计: 描述性统计, 简单的假设验证(hypothesis testing) 和最简单的多元统计. 课程目标:帮助学生掌握处理研究和工作中数据的能力。本课程是统计入门课, 也是本系本科和研究生必修课SPSS 及心理学高级统计的基础。 学生成绩: 总成绩评定方法:期末考试, 期中考试,和测验和作业。 期末考试 40% 期中考试 30% 测验和作业 30% 总成绩 100 出席:无论正当理由或无故缺席在本课中不应多于2次。缺席第3次或以上者,每次在总成绩中扣去4分。 作业要求: word 文件;用Email 或A4纸打印;手写工整亦可。 下次上课前提交。迟交扣分。 课程计划 周次 日期 课程内容 阅读章节 1 11 Sep 课程介绍 统计和度量的基本概念 绪论、第一章的1,2,3节 2 18 Sep 次数分布 (Frequency Distribution) 集中趋势 (Central Tendency) 第一章第4节 第二章 3 25 Sep 离中趋势 (Variability) Z 分数(Z-scores) 第三章 4 2 Oct 公众假期 *5 9 Oct 概率(Probability)简介 概率,样本及样本均值的分布 第五章 6 16 Oct 假设检验 (Hypothesis Testing) 初步 第七章 *7 23 Oct t统计量介绍 两个独立样本的假设检验 第七章 8 30 Oct 两个相关样本的假设检验 第七章 *9 6 Nov 复习 第一、二、三、五、七章 10 13 Nov 期中考试 11 20 Nov 估计(Estimation) 方差分析 ANOVA 第六章 第八章 *12 27 Nov 重复测量的方差分析 (Repeated measures ANOVA) 13 4 Dec 2 二因素方差分析(2-Factors ANOVA) 第八章第5节 *14 11 Dec 相关(Correlation) 和回归(Regression) 第四、九章 15 18 Dec 卡方检验 (Chi-square) 第十章 *16 25 Dec 顺序型数据 (ordinal data) 的统计检验 第十一章 17 1 Jan 02 公众假期 18 8 Jan 02 复习 19 15-18 Jan 期末考试 注:“阅读章节”专指张厚粲《心理与教育统计学》一书。 * 的周次可能有课前测验。 主要参考书 Gravetter, F. J., Wallnau, L. B. (1996). Statistics for the Behavioral Sciences: A First Course for Students of Psychology and Education, 5th Edition. New York: West Publishing. 张厚璨,心理与教育统计学。高等教育出版社,1986 第一章 统计和度量的基本概念 统计 (Statistics)– 指组织,总结和解释信息的一整套方法和规则。 总体(population)-- 特定研究所关注的所有个体的集合。 样本 (sample)-- 从总体中选择出的个体的集合,应该能代 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 研究的总体。 参数(parameter)-- 描述总体的数值。参数可以从一次测量中获得,或者从总体的一系列测量中推论得到 统计量 (statistic)描述样本的数值。统计量可以从一次测量中获得,或者从样本的一系列测量中推论得到。 数据(Data) 测量或观察所得。 描述统计(Descriptive statistics) 总结,组织,和使数据简单化统计程序。 推论统计(Inferential statistics) 使我们能够通过对样本的研究将其结果推广于总体。 取样误差(Sampling error)样本统计量与相应的总体参数之间的差距。 随机取样 (random sampling) 从总体抽取样本的一种策略,要求总体中的每一个体被抽到的机会均等。用随机取样法得到的样本叫做随机样本. 变量(variable) 是一种特征或条件,其本身是变化的或对不同的个体有不同的值。 常数(constant)是一种特征或条件,其本身是不变的且对不同的个体的值也相同。 自变量(independent variable) 被研究者操纵的变量. 在行为科学研究中,自变量常常包括两个(或更多)的处理条件。 因变量(dependent variable) 被观测的变量,其变化被用来评价处理的效果。 相关法(correlational method)看两个变量是否有某种特定关系。 实验法(experimental method) 操纵一个变量,观测另外一个变量的变化。用以建立两个变量间的因果关系。实验法用随机分组和控制其他变量恒定的方法,试图消除其他因素的影响或使之减为最小。 准实验法(quasi-experimental method) 考察已有的各组被试间的差别(如性别差异)或在不同时间所采集数据的差异(如, 处理前和处理后). 这里的分组变量称准自变量, 每个被试的分数称因变量。 控制组(control group) 是自变量的一种处理方法,此组被试不接受任何实验处理. 有时控制组被试接受一种中性处理或安慰剂。其目的是提供一个与实验组对照的基线水平。 实验组(experimental group)此组被试接受某种实验处理。 混淆变量(confounding variable) 未能控制的变量,与自变量有非预期的系统性关系。 假设(hypothesis) 对实验结果的预测。 在实验研究中, 假设就是对操纵自变量会如何影响因变量的预测。 构念(Constructs) 指假设的概念,用于理论中,按其内部机制来组织观察。 操作定义(operational definition) 用具体的操作或程序以及由此产生的测量指标来定义构念。因此, 一个操作定义包含两个成分:1)它描述了度量一个构念的一系列操作或程序;2)它用度量的结果来定义构念。 命名量表(nominal scale) 由一系列具不同名称的范畴所组成。命名量表的度量将观察所得标定并分类, 但不会对观察所得作任何数量化的区分(无大小之分) 。 顺序量表(ordinal scale)由一系列按顺序排列的范畴所组成。顺序量表的度量将观察所得按其大小或数量排定秩次(rank)。 等距量表 (interval scale)由一系列按顺序排列的范畴所组成,且每两个邻近范畴之间的距离都是相等的。在等距量表中,加减运算反映数目的大小差距. 但是,乘除运算没有任何意义。 比例量表 (ratio scale) 是具有绝对零点的等距量表. 在比例量表中,乘除运算反映数量间的比例关系。 离散型变量(discrete variable) 由分离的,不可分割的范畴组成。在邻近范畴之间没有值存在。 连续型变量(continuous variable) 在任何两个观测值之间都存在无限多个可能值。连续型变量可以分割成无限多个组成部分。 统计中常用的符号  求和符号 summation   N = 群体大小 (参数)  n = 样本容量(统计量) 第二章 次数分布 次数分布综述 次数分布表 次数分布图 次数分布的形状 茎和叶图 百分位数,百分位等级,插值法 次数分布综述 描述统计的目的:简化和整理数据的表达。 次数分布表和次数分布图就是表达一组数据是如何在某一度量上分布的。 次数分布:是指一批数据在某一量度的每一个类目所出现的次数情况 组织此类数据的第一种方法是:建立次数分布表 次数分布表 次数分布表的要素 变量的值? -填充x列 每个值出现多少次(发生次数)? -填充f列 观察的总数?将次数行求和, 将得到 f = N 变量的总值?最简单的方法就是求(X) 和 (f) 的乘积列, 然后将结果求和  (Xf ) 例1:对于下面的次数分布表: 此分布中共有几个分数 (N = ?) 对这些分数求和 ∑X x f 4 2 3 4 2 5 1 3 例2: 某个班的26个学生在一次测验中的分数如下(10分为满分): 9,2,3,8,10,9,9,2,1,2,9,8,2, 5,2,9,9,3,2,5,7,2,10,1,2,9 将这些分数作成一个次数分布表 x f 比例 (相对次数;Proportions). 全组中有多大比例取值为X? p = f / N (N = 观察的总数). 百分比 (Percentages). 全组中有多大比例取值为X? p * 100 分组次数分布表 常常以区间的形式出现, 而不是某一特定值. 例如学生成绩, (A = 90-100, B = 80-89, ...). 编制分组次数分布表的步骤 求全距 定组数 定组距 写出区间上下限 统计每个区间的次数 建构这些区间有一系列的“惯常法则” (rules of thumbs) 分组次数分布表应该有大约10个区间,目的是使这组数据易于直观感受和理解 组距应该是个比较简单的数字,如2,5,10,20 每个区间开始的分数应该是组距的倍数 所有区间的宽度应该相等 次数分布图 次数分布的数据可以用图简明地概括 直方图 (histogram):用一些垂直条画在每个分数之上 垂直条的高度代表次数 垂直条的宽度代表分数的精确区间. 只有数据是等距或等比量度时,才能用直方图 注意:对于一个连续变量, 每个分数实际对应一段组距. 分割这些组距的界限叫做精确界限(real limits). 分割两个邻近分数的精确界限位于两个分数的中间。 每个分数有两个精确界限, 一个在组距的顶端,称为精确上限(upper real limit), 另一个在组距的底端,称为精确下限(lower real limit). 注意一个组距的精确上限也是高一个组距的精确下限。 例3: 绘制一个直方图来表达例2的分布 水平轴 - X 轴 (abscissa) - X 的值 垂直轴 - Y 轴 (ordinate) - 次数 棒图(条形图;bar graph): 用一些垂直条画在每个分数(或类别)之上 垂直条的宽度代表分数的精确区间. 垂直条的高度代表次数 每个垂直条之间有一段空间。 只有数据是命名或顺序量度时,才能用棒图 - 作全班同学家乡地区的棒图 次数分布的形状 用3个特征可以完整地描述一个分布: 形状(shape), 集中趋势(central tendency), 和变异性(variability). 对称分布(symmetrical distribution): 可以画一条垂直线穿过分布的中央,使得分布的一边恰是另一边的镜象。 偏态分布(skewed distribution)中, 分数堆积在分布的一端,而另一端成为比较尖细的尾端(tail)。 <------ 尾端向左: 负偏态 正偏态: 尾端向右----> 偏态分布尾端向右的称为正偏态(positively skewed )(因为其尾端指向正数) 偏态分布尾端向左的称为负偏态(negatively skewed). 如何描述例2-例3分布的形状? 从整体上说,这个班的学生测验情况怎么样?大部分分数是偏高还是偏低?测验容易还是简单? 双峰分布 茎和叶图 茎和叶图 (stem and leaf display)- 将每一数字分解为左边部分(称为茎)和右边部分(称为叶). 如果数字是两位数, 左边的一位就是茎,右边的一位就是叶. 例4:考察下列茎和叶图: 8 7 6 5 4 3 2 271 4586 302 4169 3 26 5 以10为组距宽度,作相应的分组次数分布表 以10为组距宽度,作相应的次数分布直方图 如果给定分组次数分布表,能否作出茎和叶图?为什么? 百分位数 以上是描述观察的整体,而我们也可用次数分布来描述某一个别点在一个集合中的位置 一个分数的等级(rank) 或百分位数等级(percentile rank): 某一分布中分数在某一值之下或等于该值的个体所占的百分比. 例4:此表是一次词汇测验的分数: ___________________________________________ X f p % cf c% 5 2 .05 5 40 100 4 10 .25 25 38 95 3 16 .40 40 28 70 2 8 .20 20 12 30 1 4 .10 10 4 10 cf = 累积次数(cumulative frequency) c% = 累积百分比(cumulative percentage) 95百分位数等级的所对应的测验分数是多少? 如果你在测验中得到4分, 你的百分位数等级是多少? 如何确定百分位数 注意: 对于连续型数据, 必须考虑其精确上限和精确下限 -对于分数4, 其对应的累积百分比是 95%.但注意:分数4意味着一个人得分在3.5 和 4.5之间. 累积百分比表明组距的精确上限。因此,95 的百分位数是与4.5 相对应(而不是 4.0). 找出分布中4分的精确上限和精确下限的累积次数. - 对于分数4.5, 其对应的累积百分比是95 对于分数3.5, 其对应的累积百分比是70 对于分数4.0, 其对应的累积百分比是多少呢? 插值法(Interpolation) - 有时你所感兴趣的值并未出现在表内。此时你需要做基于经验的猜测. 其中的一个方法是插值法。 早上8:00 温度是20度,到中午12:00温度是28度 上午9:00是多少度呢? 步骤: 找出两个量数组距的宽度 如, 时间 8 到 12点;温度60 到68 度 4 小时; 8 度 找出组距中已知值的位置 =已知值与组距顶端的距离/ 组距宽度 = 12:00 - 9:00 = 3小时 / 4 小时 = .75 3) 用所得位置 (分数) 来确定另一量表中对应的所求值与组距顶端的距离 = (分数) X (另一量表组距宽度) = .75 X 8 度 = 6 度 再求得插入值--> 28 - 6 = 22 度 (9:00的温度) 例4: ___________________________________________ X f p % cf c% 5 2 .05 5 40 100 4 10 .25 25 38 95 3 16 .40 40 28 70 2 8 .20 20 12 30 1 4 .10 10 4 10 - 对于分数4.5, 其对应的累积百分比是95 对于分数3.5, 其对应的累积百分比是70 对于分数4.0, 其对应的累积百分比是X? 第三章 集中趋势 (Central Tendency) 内容 均值 (mean) 中数 (median) 众数 (mode) 选择适当的集中量数 集中趋势与分布形状 学习目标 学会计算均值,中数和众数 对于给定的分数分布,确定如何选用适宜的集中量数 集中趋势 目的:选择一个最能代表整个分布的数值 三种集中趋势量数 1.均值 (Mean) 算术平均数(arithmetic average) 总体的均值 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 : μ=  X/ N 样本的均值公式: x =  X /n 如何计算分布的均值: 公式:  = X / N = 均值具有下列特征: 1) 如果改变一个给定的分数,增加一个被试, 或减少一个被试, 均值应当有变化. 2) 如果对每一个分数都加上 (或减去) 一个常数, 均值也会加上 (或减去) 这个常数。 3) 如果对每一个分数都乘以 (或除以) 一个常数, 均值也会加上 (或减去) 这个常数。 2.中数(median) 中数(median) 是将分数分布均分为两部分的那个分数. 分布有50% 的个体等于或小于中数. 中数等价于百分位数(percentile)是50. 如何计算中数? 1)如果分数的个数是奇数个,将其按从小到大的顺序排列. 找出中间的分数 2)如果分数的个数是偶数个,将其按从小到大的顺序排列.然后找出中间的两个分数。将其相加后再除以2 3)当分布的中间分数有相等的分数时,用中间分数的精确上下限作插值法 例:计算下列连续型变量的中数 8, 10, 12, 15, 18, 19, 60 8, 10, 12, 15, 16, 18, 19, 60 8, 10, 12, 15, 15, 15, 18, 18, 19, 60 ________________________________________ X f % c% 60 1 10 100 19 1 10 80 18 2 20 70 15 3 30 60 ? 50 12 1 10 30 10 1 10 20 8 1 10 10 3. 众数 (mode) 在次数分布中, 众数是具有最多次数的那个分数或类目。 众数是 5 注意:一个次数分布可能有多个众数. 众数是2 和 8 如何选择适当的集中量数? 均值:是首选, 它考虑了分布中的每一个分数, 与分布的变异性也有关系。 但在下列情况它未必适合: 众数:对于命名型量表无法计算均值和中数, 只能用众数作集中量数。 中数:在下列情况中数最为适合: 在分布中有少数极端值 (有长尾的偏态分布) 有未确定的值 所考察分布是 'open-ended' - (如. 问卷 关于教学调查问卷关于员工内部调查问卷员工内部调查问卷基药满意度调查问卷论文问卷调查格式 中有个选项 '5个或更多') 4) 如果数据是顺序量表. 分布形状与集中趋势量数的关系 对称分布? 正偏态分布? 负偏态分布? 对称的双峰分布? 第四章 差异量数(Variability) 分布的第三个特征 ----变异性(Variability). 变异数是对于分布的延伸和聚类状态程度的定量化描述 变异数越高,表明分数间的差别大, 变异数越高,表明分数间越近似. 三种变异数: 全距 (range), 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差 (standard deviation), 和四分位距(interquartile range). 全距 (range) -全距是分布分数最大值(maximum) X的精确上限与分布分数最小值(minimum) X 的精确下限的差值。 注意:如果分数是连续型,必须用精确上下限。 __X f cf c% 10 2 25 100 9 8 23 92 8 4 15 60 7 6 11 44 6 4 5 20 5 1 1 4 若 X是离散型: range =? 若 X是连续型: range =? 用全距描述分数变异性的局限: - 该统计量只依据分布中的两个极端值,未利用到分布的大部分信息. 四分位距(interquartile range) 度量变异数的另一种方法. - 50%,25%和75%的百分位数代表什么? - 用50%,25%和75%的百分位数分布被分成4部分 _X f % c% 7 4 12.5 100 6 4 12.5 87.5 5 4 12.5 75 8 25 62.5 3 4 12.5 37.5 2 4 12.5 25 1 4 12.5 12.5 四分位距就是75%百分位数与25%百分位数间的距离. 它代表分布中间50%的距离. 如果上例是连续型变量, median = Q2 = 4.0 -> 用插入法 25%tile = Q1 = 2.5 -> 区间2 的精确上限 75%tile = Q3 = 5.5 -> 区间5 的精确上限 四分位距 (IQR) = 5.5 - 2.5 = 3.0 semi-interquartile range:四分位距的一半(interquartile range). SIQR = (Q3 - Q1) 2 第四讲 标准差和 Z分数 学习重点 方差/标准差的逻辑步骤 和方的定义公式和计算公式 总体和样本的方差 总体和样本的标准差 自由度 计算Z分数 根据 Z分数推知原始分数 标准分布及其应用 标准差 (standard deviation) 量度了分布中的每一个个体与某一标准偏移的距离,这个标准就是均值。 最重要,最常用的差异量数. 考虑了分布中的所有信息 方差/标准差的逻辑步骤 1.离差 X -  = 离差分数(deviation score) 例: 全班男同学的体重 (公斤) 69, 67, 72, 74, 63, 67, 64, 61, 69, 65, 70, 60, 75, 73, 63, 63, 69, 65, 64, 69, 65 mean =  = 67  (X - ) = (69 - 67) + (67 - 67) + .... + 65 - 67) = ? = 2+ 0 +5 +7+ -4 +0+ -3 +-6 +2 + -2 +3 + -7 + 8 +6 + -4 + -4 +2 + -2 + -3 +2 + -2 = 0 注意:如果分数的值大于均值,离差是正数 如果分数的值小于均值,离差是负数 离差的和必定为0。 因此,要去掉符号. 将离差平方,再取其和的平方根。 2 . 和方 和方的操作定义:SS =  (X - )2 x X - (X -)2 69 2 4 67 0 0 … … …  SS = 362 和方的计算公式为: SS = X2 - (X)2 N 此二者为等价。计算公式的优点为 可直接利用 X 值。 上例中: X X2 1 6 4 3 8 7 6  X=  X2 = SS = X2 - (X)2 N 注意:以下方差/标准差部分,总体和样本有区别 3.总体方差和标准差 总体方差(Population Variance): 和方的平均, 即和方除以总体的容量. 总体方差= 2 = SS/N 总体标准差:将总体方差求平方根。 standard deviation = sqroot(variance) = sqroot(SS/N)  = sqroot() 上例中: 2 = ?  = ? 求总体标准差步骤: step 1: 计算和方 SS - 可用定义公式或计算公式 step 2: 确定方差 - 计算均方 - 将 SS 除以 N step 3: 确定标准差 取方差的平方根 样本的方差和标准差 注意与总体标准差的不同: s =样本的标准差(sample SD) 用 (不是 ) 来计算SS 需要考虑样本常常比其所属的总体较少变异性,标准差的计算需做校正. - 如果样本有代表性, 那么样本与总体的就会非常近似, 两个分布的形状也应该近似。但是, 样本的变异程度仍然低于总体的变异程度. - 因此,样本方差的分母是n - 1 而不是 n sample variance = s2 = __SS _ n - 1 - 对于样本标准差也是同样 sample standard deviation = s = sqroot(SS/(n - 1)) 用n-1 作分母,意思是利用自由度来校正样本离差,以利于对总体参数的无1偏差估计。 自由度 n - 1意思是除了一个值,其余都可变化。 如: sample mean =5,如果前4 个分数是: 5, 4, 6, 2 最后一个是什么? 5 + 4 + 6 + 2 + X = 25 X = 8 X必须固定在8。 例1:求标准差: 1, 2, 3, 4, 4, 5, 6, 7 第一步: 计算和方 列表: 第二步: 确定样本方差 sample variance = s2 = _SS_ n - 1 = 28/(8-1) = 28/7 = 4.0 第三步: 确定样本的标准差 standard deviation = sqroot(SS/(n - 1)) = sqroot(28/(8 - 1) = sqroot 4.0 = 2.0 粗略估计均值和标准差  = ?  = ? 标准差的性质 1) 对分布中的每一个分数加上一个常数不会改变其标准差. 2) 对分布中的每一个分数乘上一个常数,所得分布的标准差是原分布的标准差乘上这个常数. 比较三种离中量数 极端分数: 全距(range) 受影响最大, IQR 受影响最小 样本大小: 全距(range) 可能随n 的增加而增加 , IQR & s 不会 样本选取:从同一总体中多次取不同样本,全距(range) 没有稳定的值, 但 IQR 和 S 是稳定的,不应波动很大。 - 对于有不确定值的分布, 全距 或 S 都无法求得, IQR (或SIQR) 是唯一的选择。 Z 分数(Z-Scores): 分数的位置和标准分布 Z 分数的目标:对分布中的每一个原始分数,描述其在分布中的位置。 参照点:均值 用离差(x - ) 或 (x - )描述分数的位置 当只涉及一个分布时, 用离差是简便易行的. 但当我们需要比较两个不同分布中的分数的相对位置, 用离差就不够了. 用Z 分数描述分数的位置 例: 你参加了ACT和SAT 两种测验. ACT:26 SAT:620。 申请学校只需任选寄送其中一种,你会送哪一种? 直接的比较不可能,因为两个分数分布的均值和标准差不同. 看分布图,将两个分数定位再试图比较—还是很困难 计算百分位数等级(percentile ranks) 计算标准差 要比较两个分布,一个方法就是将两个分布都转换成标准分布。 标准分布(standardized distribution) 由转换分数组成, 和 已经确定,而无论其原始分数如何. 其作用是使不同的分布有可比性。 可将其转换为Z分数. 这里需要做的是将每个分数转换为z-score, 从而将整个分布标准化. 标准分数(standard score) is 是一种转换分数提供其分布位置的信息. Z 分数是标准分数的一种。 z-score 指出了每个X 值在分布中的精确位置。z-score 的符号(+ 或 -) 表明其比均值大或小. z-score 的数值部分用X 与 .间标准差个数的形式指出了其与均值的距离。 对于Z分数分布, mean = 0,standard deviation =1. Z分数为 1, 表示数据点恰位于均值的一个标准差之上。 Z分数为 -1, 表示数据点恰位于均值的一个标准差之下。 如何转换? population sample Z = deviation = standard deviation = 如果总体/样本的均值和标准差已知,分布中的所有原始分数都可转换为 Z分数。 如果分布中的总体/样本的均值和标准差已知,Z分数也可转换回原始分数。 Z = (X - ) --> (Z)( ) = (X - ) --> X = (Z)( ) +   如果某人说他的SAT 分数高于均值 2 SD。他得了多少分? Z分数分布的属性 形状 - Z分数分布的形状与原始分数分布完全相同。每个分数所在的相对位置亦完全相同。 均值- 当原始分数转换成Z分数, mean = 0. 标准差 -当原始分数转换成Z分数, standard deviation = 1. 转换程序实际上是对分布轴的一种重新标定。-- 将X 轴中心重新标定为0,再将每个SD 间隔标定为1. 例: 美国男人的身高和体重 person height weight 1 66 203 2 71 174 3 74 223 4 69 175 5 70 144 6 74 219 7 73 184 8 69 237 9 69 204 10 75 237 sum 710 2000 height2 weight2 4356 41209 5041 30276 5476 49729 4761 30625 4900 20736 5476 47961 5329 33856 4761 56169 4761 41616 5625 56169 50,486 408,346 height  = 710 / 10 = 71.0 SS = 50486 - (710)2 / 10 = 76.0  = 2.8 weight  = 2000 / 10 = 200.0 SS = 408346 - (2000)2 / 10 = 8346.0  = 28.9 Z = (X - )  Z1 = (66 - 71)/2.8 = -1.8 Z2 = (71 - 71)/2.8 = 0 Z3 = (74 - 71)/2.8 = 1.1 Z4 = (69 - 71)/2.8 = -0.7 Z5 = (70 - 71)/2.8 = -0.4 Z6 = (74 - 71)/2.8 = 1.1 Z7 = (73 - 71)/2.8 = 0.7 Z8 = (69 - 71)/2.8 = -0.7 Z9 = (69 - 71)/2.8 = -0.7 Z10 = (75 - 71)/2.8 = 1.4 Z = (X - )  Z1 = (203 - 200)/28.9 = 0.1 Z2 = (174 - 200)/28.9 = -0.9 Z3 = (223 - 200)/28.9 = 0.8 Z4 = (175 - 200)/28.9 = -0.9 Z5 = (144 - 200)/28.9 = -1.9 Z6 = (219 - 200)/28.9 = 0.7 Z7 = (184 - 200)/28.9 = -0.6 Z8 = (237 - 200)/28.9 = 1.3 Z9 = (204 - 200)/28.9 = 0.1 Z10 = (237 - 200)/28.9 = 1.3 the sums of the z-scores = 0 ; mean of the z-scores = 0 the standard deviations = 1 这样我们可以比较每个人身高和体重各自的相对位置 Person #4: Person # 8: 第六讲: 概率(Probability) 概率简介 概率与正态分布 百分位点和百分位等级 概率与二项分布 概率(Probability) 推论统计所必需的概念, 根据样本的信息对总体作出判断。 在可能有几种后果发生的情况下,概率被定义为某一种后果发生的可能性大小. 如果几种后果分别是A, B, C, D, 等等,那么: 概率 of A = A后果的次数 = f / N 所有可能后果次数的总和 为获得正确定义的概率, 个体的选取 (取样) 一定要通过随机取样 随机取样应满足以下两个条件: 总体中的每个个体有同样的机会被选择 如果样本中要选择多于一个的个体,每次选择的概率应当恒定 回置取样(Sampling with replacement) - 一种取样方法, 在选择下一个个体(下次取样之前),将每个已选择个体放回总体之中 次数分布与概率的关系 ___________________ X f_ p_ 5 2 .05 4 10 .25 3 16 .40 2 8 .20 1 4 .10 此表中比率栏与概率相同. 此比率对应这些间隔中曲线下方的面积。 选择到3的概率是多少? p (3) = f / N = 16 / 40 = .40 选择到5的概率是多少? p(5) = f / N = 2 / 40 = .05 选择到大于2的值的概率是多少? p(X > 2) = ? .05 + .25 + .40 = .70 选择到小于5的值的概率是多少? p(X < 5) = ? .10 + .20 + .40 + .25 = .95 选择到大于1而小于4的值的概率是多少?? p(4 > X > 1) = ? .20 + .40 = .60 概率与正态分布(Normal Distribution) 正态分布是最常见的分布, 单峰和具对称性. 它可定义为下列方程: Y = 正态分布的注意点 并非所有的单峰,对称曲线都是正态分布,但很多是 在本课程中, 无须担心所研究分布与正态分布有多接近, 在本课程所遇到的问题中,多数情况下,分布是正态 上述的平滑的曲线 是指密度曲线 (而并非次数曲线) 曲线下方的面积总和必定为1. 因为 曲线下方的面积相当于概率 (或比率)总概率 应当等于 1. 正态分布常常转换为 z分数. 对于一个正态分布: 34.13% 的分数会落入均值与一个标准差之间. 13.59% 的分数会落入第一个标准差与第二个标准差之间。2.28% 的分数会落入第二个标准差与第三个标准差之间。 一个重要的工具是正态分布表. 在大部分教科书的附录中 (pg. 414). 利用此表可查到曲线下方的面积(亦即抽样的概率) 与曲线纵高 (以 z-分数位为单位). 正态分布表的应用: (A) z 0.00 0.01 : 0.30 0.31 : 1.00 : (B) 主体的比例 0.5000 0.5040 : 0.6179 0.6217 : 0.8413 : (C) 尾端的比例 0.5000 0.4960 : 0.3821 0.3783 : 0.1587 : 注意 z = 1.0 = .5000 + .3413 = median + 34.13% 正态分布表可以将z-分数转换成概率和从概率查到相应的 z-分数. 建议: 画出分布图,目测距离 . 1)用正态分布表由z分数查概率的步骤: step 1: 画出分布图, 标出均值和标准差 step 2: 标出所要查的分数点, 查核其与均值的相对位置以及到均值的粗略距离 step 3: 重读一次题目看清你所需要的分数区间概率. 将图中的相应面积涂为阴影. step 4: 将 X 分数 转换为 Z-分数 step 5: 在正态分布表中使用正确的栏目 (以及符号) 找出概率 例1: IQ为 130或以上的 概率是多少? p(X > 130)? IQ:  = 100,  =15 z = (130 - 100)/15 = 2.0 --查表--> p = 0.0228 IQ为 70或以下的 概率是多少? p(X < 70)? IQ: = 100,  =15, z = (70 - 100)/15 = -1.0 --查表 p = 0.1587 2)用正态分布表由概率查z分数的步骤: step 1: 画出正态分布图 step 2: 将所求的概率相应区域涂为阴影. step 3: 在正态分布表上找到所求的概率的适当栏(有时需换算) step 4: 用查到的z-分数标记阴影区域的边界 step 5: 计算所对应的原始分数 (X). 例2: 相当于人群顶端 5%的IQ 是多少 ? 分布最前面的尾端. p = 0.05 查表 ---> z = 1.65 故 X = (1.65)(15) + 100 = 124.75 3)找出X落在两个分数之间概率 step 1: 绘出曲线将所需的区域涂上阴影 step 2: 将两个分数转换成 Z-分数 step 3: 查表求这两个 z-分数的概率 step 4: 将两个概率相加或相减 例3: 在SAT 中得到300 到650 的概率是多少? SAT:  = 500,  =100 p(z < (650 - 500) = p(z < 1.5) = 0.9332 100 p(z < (300 - 500) = p(z < -2.0) = 0.0228 100 p(300 < z < 650) = .9332 - .0228 =.9104 4)落在两点之外的百分比. 例4: 在SAT 中得到300以下或 650 以上的概率是多少? SAT:  = 500,  =100 p(z > (650- 500) = p(z >1.5) = 0.0668 100 p(z < (300 - 500) = p(z <-2.0) = 0.0228 100 p(300 < z < 650) = .0668 + .0228 =.0896 第七章 : 概率和样本:样本均值的分布 综述 样本均值的分布 概率和样本均值的分布 标准误的特性 一.综述 上一章:总体中某一特定分数或一组分数出现的概率 本章: 总体中特定样本发生的概率。 与推论统计关系更密切. 推论统计的目标? 逻辑? 从同一总体取3次不同样本. 每一个都不同. 不同形状, 不同均值, 不同 方差. 如何对总体均值作出最佳估计? 可能取多少个样本? (注意是回置取样,sampling with replacement) 二.样本均值的分布(distribution of sample mean) 所有这些可能的样本会组成一个简单,有序,可预测的模式 (样本分布). 因此, 我们可以用样本均值的分布(distribution of sample mean)的特征为依据来预测。 样本均值的分布(distribution of sample mean):总体中可抽取的所有可能的特定容量(n)的随机样本的集合的样本均值。 样本分布: 总体中可抽取的所有可能的特定容量的样本所形成的统计分布。 我们所要做的就是考察所有可能的样本 (n一定,这点很重要) 然后根据其特性作出预测。 如何作到? 一个具体例子: 考虑下列总体: 2, 4, 6, 8 这个总体很小,我们知道其均值 (和方差):  = 5, 但假定我们不知道, 想根据样本进行估计: step 1: 选取样本容量。 本例中n = 2 – 以后还会讨论样本容量, 而一般原则是:样本容量越大,样本间相似的机会越高(样本与总体相似的机会也越高) step 2: 考虑所有可能的样本, 并考察其分布 ____________________________________ 分数 样本均值 样本 first second () 1 2 2 2 2 2 4 3 3 2 6 4 4 2 8 5 5 4 2 3 6 4 4 4 7 4 6 5 8 4 8 6 9 6 2 4 10 6 4 5 11 6 6 6 12 6 8 7 13 8 2 5 14 8 4 6 15 8 6 7 16 8 8 8 样本均值的分布 f 2 1 3 2 4 3 5 4 6 3 7 2 8 1 step 3: 现在可以回答这个问题: 选取一个均值大于7 p( > 7)的样本的概率是多少? 考察样本均值的分布, 我们发现 16 个当中有1个 a其均值大于 7. 实际情况比上例复杂的多。我们必须借助样本均值的一些特性. 形状: 样本均值的分布形状一定是正态分布.当 n 较大时(30 以上),样本均值的分布几乎是完全的正态分布. 如果在同一总体中选择一组样本, 大部分均值应当堆积在总体均值  附近(如果不是这样,取样一定有偏差) 均值: 这些样本均值的平均应该等于总体均值. 样本均值的平均 叫做 的期望值. 期望值的意思因为这个值会在总体均值  的附近. 在上例中, 的期望值(一组样本均值的均值) 是: 2 + 3 + 4 + 5 + 3 + 4 + 5 + 6 + 4 + 5 + 6 + 7 + 5 + 6 + 7 + 8 = 80 = 5。0 16 16 注意: 如果 n 足够大, 那么分布是正态, 也一定是对称和单峰, 则mean = median = mode 方差: 样本均值分布的标准差 叫做 的标准误 (standard error of ;SE) 的标准误= = 与  的标准距离. 这个统计量描述了与均值的标准(或称典型,平均)距离. 在这里,它也是样本 均值 和 总体均值  的差值. 这个统计量的主要目的和用途是 告诉我们样本均值对总体均值的估计是否准确. 换言之,取样误差是多大. 标准误的数值取决于两个特征: 总体方差和样本容量 1) 总体方差 - 总体方差越大, 样本均值的方差越大. 总体方差大 与 总体均值的差异大 总体方差小 与 总体均值的差异小 2) 样本容量 - 样本容量(n) 越大,样本越能准确地代表总体. 这个规律叫做大数定律(law of large numbers) . 假定总体是1,000个学生. 欲知总体的SAT 分数. - 如果随机抽取1个学生,用这个学生的分数预测总体分数的准确性怎样? -如果随机抽取5个学生. 会不会更准确些? -如果随机抽取100个学生呢? 将这两个特征合并起来,就是标准误的定义公式. 的标准误= = 中心极限定律 (Central Limit Theorem)中包含所有这些特性 (形状, 均值, 方差) 中心极限定律(Central Limit Theorem): 对于任何均值为 μ,标准差为σ的总体, 样本容量为n的样本均值的分布,随着n 趋近无穷大时,会趋近均值为μ,标准差为 的正态分布 因此,当 n 足够大时(30或以上): ~ N ( , ) 三.样本分布与概率 例 1:一位老师对班上学生的IQ感兴趣. 她班上有9位学生,她认为他们都很聪明. 这班学生IQ 的均值大于等于 112的概率是多少? IQ test: μ= 100, σ= 15 首先我们需要知道样本的分布 (注意: 即使n 小于 30,我们仍然假定正态分布.) ~ N (, ) = N(100, 5) 我们需要知道对应这个样本均值的z分数: Z = P( > 112) = P(Z > (112 - 100)/ 5 ) = P(Z > 2.4) = 0.0082 这个答案是否合理? - 最初看起来似乎不对 - 应当大于 z = 1对应的概率, 因为 115 对应于z = 1 - 但是, 必须注意这不是正确的分布, 我们需要考察样本均值的分布 -我们知道样本均值分布的标准误是5 和均值是 100. - 所以 112 应当位于 z >2 之外 例 2: 如果班上有25位学生,如果让其均值位于顶端 10%的IQ 分布,均值应该有多大? 首先我们需要知道样本的分布 (注意: 即使n 小于 30,我们仍然假定正态分布.) ~ N (μ, ) = N (100, 3) 然后我们需要找出对应于这个全距的均值: 这个公式与我们从前遇到的很类似 : = Z * + μ = (= Z)() +μ step 1: 查正态分布表:90% 概率对应的 Z 分数是1.28 step 2: = 1.28 * + 100 = (1.28)(3)+100 = 103.84 所以, 对于 25 个人的样本, 他们的均值必须在103.84 以上才能位于分布顶端的10% 假定上例中样本较小, n = 16? 答案会不会改变? step 1: l查正态分布表:90% 概率对应的 Z 分数 step 2: =1.28*(15/sqrt(16)+100=(1.28)(3.75)+100 =104.80 所以, 对于 25 个人的样本, 他们的均值必须在104.80以上才能位于分布顶端的10% 对于不同的样本容量: n=9,=1.28*(15/sqrt(9))+100 =(1.28)(5)+ 100=106.40 n=4,=1.28 * + 100 = (1.28)(7.5) + 100 = 109.60 n=1,=1.28 * + 100 = (1.28)(15) + 100 = 119.20 注意: 如果 n = 1, 标准误等于总体标准差 所以, 样本容量越小, 取样误差 (标准误, ) 越大. 四.标准误的解释: 取样误差: 任何一个样本可能大于或小于估计值。 标准误: 大部分均值会与μ相当接近 , 但也有一些会非常不同. 样本均值的方差代表μ和 之间的标准距离。它的定义是样本容量和 代表μ的准确程度间的关系. C) 信度: 标准误变小时,我们用作为μ的估计值的信心增加。 -信度大略是指同一总体的不同样本 (具同样的样本容量) 彼此间的近似程度. 如果大部分样本 具有相似的统计量(e.g., 均值, 标准差), 那么其信度就高。如果大部分样本具有不同的统计量, 其信度就低. - 从上面的例子中可以看出, 当 n 增大时,样本 统计量能更好地对总体参数进行估计. 因此, 多次重复取样, 且样本容量相对较大,我们会得到相近的统计量(都在总体参数附近). D) 稳定性: 标准误越小, 添加或去掉一个分数或改变某一 分数会改变 μ的估计值. - 我们已经讨论过添加或去掉一个分数或改变某一 分数对总体均值和标准差的影响,而对标准误的影响又如何呢? 总体 X ~ N(50, 10) [μ= 50; [σ= 10] 比较这两个样本: 样本 1: 1 = 50, n = 4 = = 10/2 = 5 样本 2: 2 = 50, n = 100 = = 10/10 = 1 假定我们在每个样本中添加一个新的分数 20. 样本 1: 新的均值是:50 * 4 = 200 --> (200 + 20)/5 = 44 样本2: 新的均值是:50 * 100 = 5000 --> 5020/101 = 49.7 所以样本 2 比样本 1 稳定. 一般说,标准误越小,
本文档为【北京大学_甘怡群教授_心理统计讲义WORD版_92页(全)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_133619
暂无简介~
格式:doc
大小:1MB
软件:Word
页数:93
分类:教育学
上传时间:2011-11-10
浏览量:42