首页 07第七章 抽样调查

07第七章 抽样调查

举报
开通vip

07第七章 抽样调查null第七章 抽样调查第七章 抽样调查第一节 抽样调查的概念及其分类第一节 抽样调查的概念及其分类一、几个概念 1、抽样调查 从研究的总体中按随机原则抽取部分单位为样本,进行观察研究,并根据样本的调查结果推断总体,以达到认识总体的统计调查方法。 (以很小的样本来推断很大的总体) 2、总体 N(全及总体: Total population/Parent population )(有限总体、无限总体)null全及总体又称“母体”,简称“总体”,是指所要认识对象的全体,总体是由具有某种共同性质的许多单位组成的,因...

07第七章    抽样调查
null第七章 抽样调查第七章 抽样调查第一节 抽样调查的概念及其分类第一节 抽样调查的概念及其分类一、几个概念 1、抽样调查 从研究的总体中按随机原则抽取部分单位为样本,进行观察研究,并根据样本的调查结果推断总体,以达到认识总体的统计调查方法。 (以很小的样本来推断很大的总体) 2、总体 N(全及总体: Total population/Parent population )(有限总体、无限总体)null全及总体又称“母体”,简称“总体”,是指所要认识对象的全体,总体是由具有某种共同性质的许多单位组成的,因此,总体也就是具有同一性质的许多单位的集合体。。 通常全及总体的单位数用大写的英文字母N来 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示。作为全及总体,单位数N即使有限,但总是很大,大到几千,几万,几十万,几百万。对无限总体的认识只能采用抽样的方法,而对于有限总体的认识,理论上虽可以应用全面调查来搜集 资料 新概念英语资料下载李居明饿命改运学pdf成本会计期末资料社会工作导论资料工程结算所需资料清单 ,但实际上往往由于不可能或不经济而借助抽样的方法以求得对有限总体的认识null3、样本 n(抽样总体)(大(小)样本) (样本单位数达到或超过30个称为大样本,而在30个以下称为小样本 ) 不唯一性; 抽样总体的确定原则: 1)相关性是指抽样总体与抽样目标相关。 2)完整性是指抽样总体的内容能全面反映项目的实际情况。 3)经济性是指抽样总体的确定应符合成本效益原则 null4、总体指标  根据总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标,称为“总体指标”。全及指标也称为“母体参数”或“总体参数”。 唯一性:由于全及总体是唯一确定的,所以总体指标也是唯一确定的。 常用的总体指标有:总体平均数、总体成数、总体方差和标准方差。 null5、样本指标 样本指标又称“抽样指标”、“样本统计量”,由样本总体各单位标志值计算出来反映样本特征,用来估计总体指标的综合指标。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差 )。 对于一个问题总体是唯一确定的,所以总体指标也是唯一确定的,总体指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。null在预测美国的总统选举中: 总体:全体合法选民 样本:部分选民 推断:根据部分对整体做出归纳 指标:1、全体合法选民的平均年龄 2、当前登记投票的全体合法选民的百分比 以上总体指标是不能精确测定的,仅能根据统计量和样本指标来估计举例: 美国1936年选举 美国1936年选举 Roosevelt的百分比 Gallup预言《摘要》的预测结果 44 《摘要》预测的选举结果(240万人) 43 Gallup预测的选举结果 (59万人) 56 选举结果 62 (注:上述百分比仅用主要政党所得选票计算,选举中约有2%的选票投向小党的候选人) (由于选择偏倚和不回答偏倚造成《摘要》的预测差错)美国1948年的选举美国1948年的选举候选人 Crossley Gallup Roper 结果 Tromam 45 44 38 50 Dewey 50 50 53 45 Thurmond 2 2 5 3 Wallace 3 4 4 2 (由于访问员自由挑选时无意的共和党偏性造成预测差错)Gallup在St.Louis定额抽样13对象Gallup在St.Louis定额抽样13对象 规定 关于下班后关闭电源的规定党章中关于入党时间的规定公务员考核规定下载规定办法文件下载宁波关于闷顶的规定 :6人住近郊,7人住在市中心 男的7人:3人40岁以下,4人40岁以上 1名黑人,6名白人 6名白人支付的月租又做了以下的规定: 1人的支付金额不少于44.01美元 3人的支付金额在18.01-44.00美元 2人的支付金额不超过18美元 女的6人Gallup民意测验在1948年后的总统选举中的记录 (采用概率抽样调查)Gallup民意测验在1948年后的总统选举中的记录 (采用概率抽样调查)年份 样本容量 获胜候选人 Gallup民意 选举结果 误差 测验预测值 1952 5385 艾森豪威尔 51 55.4 +4.4 1956 8144 艾森豪威尔 59.5 57.8 -1.7 1960 8015 肯尼迪 51 50.1 +0.9 1964 6625 约翰逊 64 61.3 -2.7 1968 4414 尼克松 43 43.5 +0.5 1972 3689 尼克松 62 61.8 -0.2 1976 3439 卡特 49.5 51.1 +1.6 1980 3500 里根 55.3 51.6 -3.7 1984 3456 里根 59.0 59.2 +0.2 1988 4089 布什 56.0 53.9 -0.2 (注:误差=预测-实际)二、抽样的理论依据二、抽样的理论依据 大数定律 契比雪夫定理:当样本容量n足够大时,独立同分布的一系列随机变量的算术平均数接近(依概率p收敛于)数学期望值,即随机变量平均数具有稳定性,该定律提供了用样本平均数估计总体平均数的理论依据。 即: null贝努里定理:当试验次数n足够大时,事件A发生的频率接近(依概率收敛于)事件A发生的概率,即频率具有一定的稳定性,该定理也说明,在试验不变的条件下,重复进行很多次时,随机事件的频率在它的概率附近摆动。 如:投硬币 即: null大数定理在抽样中的作用: A、理论基础 B、通过偶然现象揭示必然性和规律性的工具null中心极限定理 (独立同分布)如果随机变量x1,x2,….xn,独立且服从同一分布,且存在数学期望E(xi)=X和方差D(xi)=σ2,则当样本容量n趋于无穷大时,随机变量均值 趋于期望值为X、标准差为 的正态分布,即当n→∞时, null(棣莫弗-拉普拉斯)设随机变量xn (n=1,2,…)服从二项分布B(n, p), 则对于任意实数z, 有 null中心极限定理表明,不论总体服从何种分布,只要存在数学期望和方差,从中抽取容量为n的样本,则当n足够大时(n >30) ,样本均值趋于正态分布。 null大数定律与中心极限定理 相同点是,都是通过极限理论来研究概率问题,研究对象都是随机变量序列,解决的问题都是概率论中的基本问题,因而在概率论中具有重要意义; 两者不同点是,大数定律研究的是概率或平均值的极限,而中心极限定理研究的是随机变量总和或平均值的分布极限。三、概率论三、概率论null 二、抽样调查的分类 概率调查 简单随机抽样 (随机抽样) 类型抽样 等距抽样 整群抽样 多阶段抽样 非概率调查 重点抽样 典型抽样 随意抽样 定额抽样 第二节 随机抽样的基本原理第二节 随机抽样的基本原理一、样本的可能数目 1、 概念 2、计算方法 (1)考虑顺序的重复纯随机抽样的样本的可能数目 (2)不考虑顺序的不重复纯随机抽样的样本的可能数目 (3)考虑顺序的不重复(不考虑顺序的重复)纯随机抽样的样本数目? 二、代表性平均误差 二、代表性平均误差(一)几个概念 1、代表性误差(以部分推断总体) 2、代表性平均误差 或 3、极限误差(可能误差的范围) 极限误差:在一定观测条件下偶然误差的绝对值不应超过的限值 或在同一个测试条件下,按给定置信度预期达到的最大误差。null(二)平均误差的估计 1、简单随机抽样平均误差的估计 (1)按重复简单随机抽样方式估计平均误差 成数指标: null(2)按不重复简单随机抽样方式估计平均误差 成数指标: 3、举例运用 P192-193.null(三)影响代表性平均误差的因素 总体标志的变动程度; 抽样单位的多少 ; 受不同抽样方法的影响(抽样方法 :不重复抽样的平均误差一般会小于重复抽样); 受不同抽样组织方式的影响。(简单随机抽样。。。) 第三节 置信度与置信区间第三节 置信度与置信区间一、概念 1、置信区间:在一定的概率保证程度下,某总体指标所在的区间范围——区间估计。 置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 null2、置信度:总体指标在某一区间内的概率保证程度,F(t)。 所谓置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度,也就是概率。置信水平是指总体参数值落在样本统计值某一区内的概率。 null3、概率度t:抽样极限误差除以抽样平均误差得到的相对数. 公式: 或 null二、确定置信区间的方法 1、条件:需知置信度F(t),样本平均数或样本成数,平均误差估计量。 2、方法: (1)由F(t)查t分布表或标准正态分布表得t值。 (2)计算平均误差估计量 或 。 (3)计算极限误差 的值。 (4)写出置信区间并加以说明。 null三、确定置信度的方法 1、条件:需知置信区间,样本平均数或样本成数,平均误差估计量。 2、方法: (1)由求出t值。 (2)由t分布表或标准正态分布表得置信度F(t)。nulleg. 某大型股份公司设有5个工资级别,该公司人员的月平均工资为5000元,标准差为1421元,(1)是否可以认为,在这5个级别的人员中,95%的人所挣工资在2215~7785元之间?为什么? (2) 以下说法是否正确:如果反复地从这些级别中每次抽取100人的简单随机样本,这些人的平均工资有95.45%的概率在4718~5282元之间。 (3)以下说法是否正确:如果反复地从这些级别中每次抽取10000人的简单随机抽样,这些人的平均工资有99.73%的概率在4718~5282元之间。null解:(1)已知: 下限 上限 则 可以认为。。。! (2)(1)已知: 上限 下限 null说法是对的! (3)已知:下限上限null说法是错误的!估计量的标准估计量的标准 无偏性: 样本指标所有可能取值的平均 数等于估计总体指标的属性。 样本平均数是总体平均数的无偏估计 样本方差 是总体方差 有偏估计;但是 是总体方差 的无偏估计。 null有效性:方差最小的属性。 (两个样本,其中一个的方差比另一个的方差小,说明小方差的样本更有效) 一致性:样本指标逐渐趋于总体指标的属性。 (大数定律) (P196) 不同情况下总体均值的区间估计不同情况下总体均值的区间估计第四节 随机抽样调查的组织形式第四节 随机抽样调查的组织形式一、随机抽样调查的概念及特点 1、随机抽样的概念 2、特点 (1)是一种非全面调查 (2)按随机原则抽取调查单位 (3)以样本代表总体,用样本指标去推断总体指标。 (4)抽样调查中产生的误差可以事先计算并加以控制null二、随机抽样的作用 1、可节省人力、物力、财力和时间 2、用于不可能进行全面调查的总体数量特征的推断 3、用于某些不必要进行全面调查的总体数量特征的推断。 4、用于全面调查资料的评价和验证。 5、用于生产过程的质量控制。null三、随机抽样的一般方式 (一)简单随机抽样 1、概念:纯随机抽样。 2、抽选方法:直接抽选法,抽签法,随机数字法。 3、各项指标的计算(P198) (1)总体平均数 (2)总体总值 (3)总体方差 (4)样本总值 (5)样本平均数 (6)样本方差 null(7)抽样平均误差 (8)抽样极限误差 (9)区间估计 (10) 点估计 (10)成数指标 (11)样本容量?? (P203) (12)计算(P200)null抽样的组织方式 (一)简单随机抽样(也叫纯随机抽样,SPS抽样)。 1.概念:就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。 特点: 每个样本单位被抽中的概率相等,样本的每个单位完全独立, 简单随机抽样是其他各种抽样形式的基础。 通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 方法:将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位。null(二)类型抽样 1、概念:先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或其他抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 null2、类型抽样如下图: 3、样本容量的确定(P203)?null[例] 某年级学生共180人分为四个班,其中甲班N1=40人,乙班N2=50人,丙班N3=45人,丁班N4=45人,现要抽取20%作为样本,则每班应抽取的样本单位数按如下步骤算出:      1.确定样本单位数n=N×20%=180×20%=36人; 2.每班的样本单位数分别为null各类型之间样本单位数的分配1.等比例分配 即各层所抽样本数占各层总体单位数的比例相等。 2.不等比例分配 例:按各层的离散情况分配样本: 某层的离散程度大,则该层多分摊一些样本 分层抽样的优点 分类的原则:扩大组间差异,缩小组内差异null(三)整群抽样 1、概念: 又称集团抽样 抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。如下图: null2、 整群抽样的主要优缺点 优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。 缺点:若样本分布比较集中、代表性相对较差。一般来说,当类别相对较多、每一类中个体相对较少的情况时效果较好。null抽样的样本就是要差异大才能尽可能包含所有情况,误差才会小分层抽样与整群抽样的区别: 分层抽样要求各子群体之间的差异较大,而子群体内部差异较小;整群抽样要求各子群体之间的差异较小,而子群体内部的差异性很大。换句话说,分层抽样是用代表不同子群体的子样本来代表总体中的群体分布;整群抽样是用子群体代表总体,再通过子群体内部样本的分布额来反映总体样本的分布。null(四)等距抽样 1、概念: 系统抽样或机械抽样 2、抽取样本的具体方法 (1)随机等距 (2)对称等距 (3)中点等距 3、等距抽样的计算null 把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。 K(抽样距离)=N(总体规模)/n(样本规模) 方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。排序依据的标志:(1)无关标志;(2)有关标志(总体单位按某一标志排序)············null[例]现有180名学生,要利用系统抽样法从中抽取15名学生作研究样本,调查成绩,其方法如下。          (1)确定间隔距离 (2)随机决定起点(1-12之间):决定起点R=(k+2)/2=(12+2)/2=7,即决定从第一部分的第7号单位作为第一个样本。第二个样本为7+12=19号单位;如此类推,抽出的15个样本为:   (7),(19),(31),(43),(55),(67),(79),(91),(103),(115),(127),(139),(151),(163),(175)。 先将学生按与学生学习成绩无关的标志编号,假设按学生座位顺序把学生编为1-180号,然后按下述步骤抽取: null(五)多阶段抽样 1、概念:多级抽样。 2、多阶段抽样的作用 1)总体范围发布广;2)节省人、财、物等费用;3)灵活、方便。 null多阶段抽样例: 假定某县20个乡镇,平均每个乡镇10个行政村,每个行政村10个自然村,每个自然村50户、则全县共200个行政村,2000个自然村,10万户。现决定对该县 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 生育状况按户做千分之五的抽样调查,共抽取500户。做法如下: (1)确定抽样单位、根据该县的4个层次,即乡镇、行政村、自然村、户,应采取4阶段抽样,乡镇为第一级单位,行政村为第2级单位,自然村为第3级单位,户为第4级单位。 (2)从县抽乡镇 从乡镇抽行政村,从行政村抽出自然村,从自然村抽出户 null本章的重点是纯随机抽样和类型抽样的计算,难点是多阶段抽样的计算。
本文档为【07第七章 抽样调查】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_609574
暂无简介~
格式:ppt
大小:409KB
软件:PowerPoint
页数:0
分类:
上传时间:2011-11-26
浏览量:36