null第二章 描述统计分析第二章 描述统计分析主讲 石立第二章 描述统计分析第二章 描述统计分析第一节 调查设计
第二节 数据的图
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
分析
第三节 数据的概括性度量第一节 调查设计第一节 调查设计数据的来源有两个:
间接来源:二手数据、次级数据
直接来源:一手数据、原始数据null间接来源的数据是别人已经收集好的,我们借用的。如国家统计局的数据,图
书
关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf
馆的数据等。
——是我们获取数据的首选,
但常找不到需要的数据。
直接来源的数据不是别人收集的,而是调查者第一次收集的数据。
——常通过调查或实验获取null【思考】如何进行调查或实验得到数据呢?
调查的关键是什么?
——确定调查的
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
实验的关键是什么?
——确定实验的方案,即实验设计
参考《实验设计》课程null【思考】如何调查?
调查分为两种:
全面调查
——较少用到
抽样调查
——常用null在实施抽样之前,首先要清楚总体是什么。
如从班上抽10个人得小礼品,总体是什么呢?
但今天有几个同学没来,他们能参加今天的抽样吗?
——不能
这涉及到另一个概念——抽样框
在实际抽样时,我们应先确定正确的抽样框,实际中的抽样,都是在抽样框中抽取。
抽样框是总体中排除不能被抽取的个体之后的个体的集合,常以名册或排序编号的形式存在,能确定总体的抽样范围和结构。【抽样框误差:一次失败的抽样调查】null【思考】确定抽样框之后,如何抽样呢?
抽样的方法有两类:
一.概率抽样:简单随机抽样;分层抽样;整群抽样;系统抽样;多阶段抽样
二.非概率抽样:方便抽样;判断抽样;自愿样本;滚雪球抽样;配额抽样
null一.概率抽样(probability sampling)
(1)也称随机抽样:按一定的概率以随机原则抽取样本。
(2)“随机原则”:
是在抽取样本时使每个单位都有一定的机会被抽中的原则。(每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。)null【思考】如何理解“随机原则”
①“随机原则” “随便原则”:
随机:有严格的科学定义,可用概率来描述;
随便:带有人为主观的因素。
②“概率抽样” “等概率抽样”
如:在企业中,各个股东在投票决策某项提案时,手中选票的影响力是不等的;
概率抽样常用的方法有:简单随机抽样;分层抽样;整群抽样;系统抽样;多阶段抽样≠≠与与null1.简单随机抽样(simple random sampling)
(1)定义:是从总体N个单位中随机地抽取n个单位作为样本的抽样方法。每个单位被抽中的概率是相等的,属于“等概率抽样”。
(2)最基本的抽样方法,是其它抽样方法的基础,适用于总体较小时使用。
(3)特点:
①优点:简单、直观,在抽样框完整时,可直接从中抽取样本;用样本统计量对目标量进行估计比较方便。
②局限性:当N很大时,不易构造抽样框;抽出的单位很分散,给实施调查增加了困难;没有利用其它辅助信息以提高估计的效率。null(4)具体操作:
①“抽签法”
②“随机数表法”:表中每个
表格
关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载
一个数字,均为“0~9”中随机抽取一个数字随机而成。
“随机数表”
(5)例题:从班上50个同学中抽取10个同学参加某项活动,采用“随机数表法”进行抽样。null2.分层抽样(stratified sampling)、
在上面的例题中,“从班上50个同学中抽取10个同学参加某项活动”,若班男生30人,女生20人,按照性别之比,在抽取的10个同学中,应该男生6人,女生4人,如此才能保证男女生性别上的公平。但在实际操作中,采用简单随机抽样进行抽样,得到的样本,男女生之比会出现偏离3:2的情况,即会出现性别上不公平的现象,因此我们需要对简单随机抽样进行改进,得到分层抽样。
(1)定义:先将抽样单位按某种特征或某种规则划分为不同的层,再从不同的层中独立、随机地抽取样本。null(2)优点
①是对简单随机抽样的改进,保证样本的结构与总体的结构比较相近,从而提高估计的精度;
②组织实施调查方便;
③既可以对总体参数进行估计,也可以对各层的目标量进行估计
(3)应用例题:在校运会上,将教师分为青年教师组和老年教师组,分开进行比赛,如此可以保证青年教师和老年教师获奖方面的公平。null3.整群抽样(cluster sampling)
简单随机抽样在使用时有个限制,即适用于总体比较小时,但现实中有时后总体很大,如某学院1000学生,需从中抽取200人参加某项集体活动,若采用简单随机抽样,无论是使用抽签法还是随机数表法,抽取样本都会要很长时间或工作量大,因此我们需要对此进行改进,得到了总体较大时的整群抽样。
(1)定义:先将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。null(2)特点
①是对简单随机抽样的改进,适用于总体较大时的抽样。抽样时只需群的抽样框,可简化工作量;
②调查的地点相对集中,节省调查费用,方便调查的实施;
③缺点是估计的精度较差
(3)应用例题:
以上问题的解决,如可以将1000人分为20个组,每组50人,从20个组中简单随机抽取4个组即可。
在许多国家中,选民要从中许多政客中选取一群人来执政,采取的方法就是整群抽样,这些政客各自根据自己的执政理念,成立不同的政党,选民通过选中政党的头号人物(即总统)来确定哪个政党执政。null4.系统抽样(systematic sampling)
从班上50个同学中抽取10个同学参加某项活动,按照不同学生的学号来看,1~5号同学应该有一个同学被选中,6~10号同学应该有一个同学被选中,……,46~50号同学应该有一个同学被选中,如此才能保证不同学号的同学在学号抽样上是公平的。但在实际中,采用简单随机抽样来抽取样本,有时会出现被抽中同学的学号集中在某一段的情况,如此一来,造成了不公平,为解决此问题,我们对简单随机抽样进行了改进,得到了系统抽样。
(1)定义:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位。null具体操作:将总体编号1~N,用总体量N除以样本量n,得间隔数k;从第一组数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k,……,r+(n-1)k等单位。
(2)特点:
①是对简单随机抽样的改进,样本均匀的分布在总体中;
②优点:操作简便,可提高估计的精度;
③缺点:对估计量方差的估计比较困难。null5.多阶段抽样(multi-stage sampling)
(1)定义:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。
(2)具有整群抽样的优点,保证样本相对集中,节约调查费用;
(3)需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开;
(4)在大规模的抽样调查中,经常被采用的方法。null二.非概率抽样(non-probability sampling)
(1)是相对于概率抽样而言的;
(2)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查;
(3)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式。null1.方便抽样
(1)定义:调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。
(2)应用:常用于调查员在街头、公园、商店等公共场所进行拦截调查,厂家在出售产品柜台前对路过顾客进行的调查;
(3)特点:
①优点:容易实施,调查的成本低;
②缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体。null2.判断抽样
(1)定义:研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本。
(2)特点:
①判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性;
②抽样成本比较低,容易操作
③样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体null3.自愿样本
(1)定义:被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本。
(2)特点:
①自愿样本与抽样的随机性无关;
②样本是有偏的;
③不能依据样本的信息推断总体。null4.滚雪球抽样
(1)定义:先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。
(2)特点:
①适合于对稀少群体和特定群体研究;
②优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低。null5.配额抽样
(1)定义:先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。
(2)特点:
①操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似;
②抽取具体样本单位时,不是依据随机原则,属于非概率抽样。null三.概率抽样与非概率抽样的比较null四.如何确定样本量
一般而言,总体越大,样本应该越大,在给定误差范围的情况下,常用以下公式计算样本量。(2为总体方差, E为误差范围, 为总体比例)
估计总体均值时
估计总体比例时null实际中,如果总体过大或总体信息不充分时,往往也可以用以下经验结果确定样本量。