首页 统计学原理(经典)

统计学原理(经典)

举报
开通vip

统计学原理(经典)nullnull统计学教程第一章 绪论 第二章 统计调查与整理 第三章 综合指标 第五章 参数估计和假设检验 第六章 相关与回归 第七章 非参数检验 第八章 时间序列 第九章 指数结束null第一章 绪论一、统计学的产生与发展 二、统计学的研究对象和研究方法 三、统计学的要素和内容 四、统计测定的层次主要内容目录null二、统计学的研究对象和研究方法(一)统计包含三种涵义,两重关系1、统计工作:调查研究...

统计学原理(经典)
nullnull统计学教程第一章 绪论 第二章 统计调查与整理 第三章 综合指标 第五章 参数估计和假设检验 第六章 相关与回归 第七章 非参数检验 第八章 时间序列 第九章 指数结束null第一章 绪论一、统计学的产生与发展 二、统计学的研究对象和研究方法 三、统计学的要素和内容 四、统计测定的层次主要内容目录null二、统计学的研究对象和研究方法(一)统计包含三种涵义,两重关系1、统计工作:调查研究。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计学:研究如何搜集、整理、分析数据资料的一 门方法论科学。统计工作 统计资料 统 计 学工作与工作成果关系实践与理论关系null统计学的性质:是一门适用于自然现象和社会现象的方法论学科。统计学的研究对象:大量现象的数量方面。包括数量 特征、数量关系、数量界限等。(二)统计学的研究对象(三)统计学的研究对象1、大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是反映随机现象基本规律的大数定律。null2、综合指标法是从数量方面对现象总体特征的概括说明。综合指标法,就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。3、统计推断法是在一定置信程度(即可靠程度)下,根据样本资料的特征对总体特征作出估计和预测的方法。统计推断是现代统计学的基本方法。null一、统计学的产生与发展产生原始社会后期: 统计萌芽于计数活动; 奴隶制国家产生:使统计日显重要; 封建社会时期: 统计已具规模; 资本主义的兴起:统计扩展到社会经济各方面。 统 计学应运而生,统计学作为一门系统的科学,距今只有300多年的历史。null一、统计学的产生与发展发展(三个时期)(一)统计学的萌芽期(17世纪中-18世纪中)1、德国的记述学派(国势学派〕 康令 (1606-1681) 阿痕瓦尔(1719-1772; 1764年首创统计学一词) 他们在大学中开设“ 国势学”采用记述性材料,讲述国家“ 显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。null(二)统计学的近代期(18世纪末-19世纪末) 1、数理统计学派 代表人物:法国的拉普拉斯,比利时的凯特勒。 拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。 2、政治算术学派 代表人物:英国的威廉·配第、约翰·格朗特等。 威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“ 国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。 null 凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“ 统计学之父”之称。 2、社会统计学派 代表人物:德国的克尼斯、恩格尔、梅尔等。 他们强调统计学是研究社会现象的科学,包括统 计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。null(三)统计学的现代期(20世纪初至今) 统计学的主流从描述统计学转向推断统计学。20世纪30年代R·费希尔的推断统计理论标志着现代数理统计学的确立。60年代以后统计学发展有三个明显的趋势:1·统计学依赖和吸收数学更多; 2·以统计学为基础的边缘学科不断形成; 3·与电子计算机技术相结合,应用范围更广,作用更大。null三、统计学的要素和内容1、统计总体和总体单位总体统计研究所确定的客观对象,是具 有共同性质的许多单位组成的整体。无限总体:含无限多个单位范围 有限总体:含有限个单位。总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。(一)统计学的要素特点null2、标志标志总体单位的属性、特征。品质标志:用文字表示属性分类数量标志:用数字表示特征不变标志:各单位具体表现 相同可变标志:各单位具体表现 不同指标:综合反映总体数量特征的概念和数值。构成:指标名+指标数值特点:具体性;综合性3、指标和指标体系null分类:数量指标;质量指标描述指标;评价指标;预警指标绝对数指标;相对数指标;平均数指标在推断统计中:说明总体的指标也称参数。 说明样本的指标称统计量。指标体系:具有内在联系的一系指标构成的整体。标志与指标的联系与区别:联系(1)一些数量标志汇总可以得到指标的数值 。区别(1)标志是说明总体单位特征的,而指标是说统 统计总体数量特征的; (2)数量标志与指标之间存在变换 关系。 (2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。null4、变量和变量值变量可变的数量标志和统计指标。确定性变量分类随机性变量离散性变量连续性变量变量值:即变量的具体数值,包括标志值和指标数值社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。null5、样本是从总体中随机抽取部分单位所构成的集合体。必须取自所要研究的总体;特点从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异;样本必须具有代表性;样本必须具有客观性,也即排除主观因素的影响6、推断:就是以样本信息为依据对总体的某些特 征作出预测和估计。7、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称置信度。null(二)统计学的内容1、描述统计指搜集、整理、分析并提供统计资料的理论和方法。主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。2、推断统计是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。描述统计是推断统计的前提,推断统计是描述统计的发展。null四、统计测定的层次 统计测定(measurement)即对总体数量特征的量度,包括登记、分类、 标示、计算等。四个测定层次的比较1234量化等级功能包容1234null测定层次特征运算功能举例1、定名测定 2、序列测定 3、间距测定 4、比率测定分类 分类;排序 分类;排序; 有基本测量单位 分类;排序; 有基本测量单位; 有绝对零点计数 计数;排序 计数;排序; 加减 计数;排序; 加减 乘除产业分类 企业等级 产品质量 差异 商品销售 额null第二章 统计调查与整理统计调查统计整理统计分析有组织、 有 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 地 搜集资料。 要求:准确、 完整、及时对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化描述性分析 推断分析、 决策分析。 要求:定性 定量结合统计工作的三个中心阶段null统计调查一、调查组织方式统计调查二、调查方案 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 报表制度普 查重点调查典型调查抽样调查方案内容调查表、问卷设计制度化的 经常性调查专门组织调查全面调查非全面调查null一、统计调查的组织方式统计报表制度由政府部门组织,采用统一的 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 ,自上而下布置,自下而上报告。任务:搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。优点:精心周密设计、高度统一、 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 。 回收率高,内容相对稳定,便于资料积累、对比。 层层上报、逐级汇总,可以满足各部门需要。特点:null普查特点:工作量大,时间性强,需要大量人力和财力。任务:搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。方式:建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。原则:规定统一的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 时点。规定统一的普查期限。规定调查的项目和指标。null重点调查特点:在总体中选择个别或部分重点单位进行调查。任务:及时了解总体基本情况,为主管部门指导工作服务。方式:一次性调查;专门设计和备配人员现场调查。 重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表调查。 null典型调查特点:在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。任务:为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。作用:适宜于研究处于萌芽状态事物和倾向性问题; 适宜于分析事物的类型,它们之间的差别和关系。方法:“‘解剖麻雀’;‘ 划类选典’;‘抓两头’”。 null抽样调查特点:1·按随机原则从总体中抽取样本;2·以样本指标(统计量)为依据推断总体参数 或检验总体的某种假设;3·抽样误差可以事先计算并加以控制。调查误差登记性误差代表性误差编 差随机误差抽样平均误差实际误差统计推断中的抽样误差就是抽样平均误差。它是处于调查所固有的,是对抽样推断精确度的量度。null样本容量抽样方式总体内部差异null抽样调查的组织方式:1·简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或 随机数表抽取样本单位。适用:总体规模不大;总体内部差异小2·类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。总体 N样本 n等额等比例最优······null3·等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。排序依据的标志:(1)无关标志;(2)有关标志(总体单位按某一标志排序)············4·整群抽样方法: 将总体全部单位分为许多个““群”,然后随机抽取若干““群”,对被抽中的各““群”内的所有单位登记调查。例:null总体群数R=16 样本群数r=4 样本容量例:ABCDEFGHIJKLMNOPLHPDnull例:在某省100多万农户抽取1000户调查农户生产性投资情况。5·多阶段抽样第一阶段:从省内部县中抽取5个县第二阶段:从抽中的5个县中各抽4个乡 第三阶段:从抽中的20个乡中各抽5个村 第四阶段:从抽中的100个村中各抽10户样本n=100×10=1000(户)抽样方法1·放回抽样:抽出样本单位登记后放回总体,再抽时总体不变2·不放回抽样:抽出样本单位登记后不放回总体,再抽时总体渐次减少null二、调查方案统计调查方案的主要内容 1、确定调查目的2、确定调查对象和调查单位 3、拟订调查提纲4、确定调查时间 5、编制调查的组织计划null调查表与问卷设计调查表单一表一览表例:《工业企业统计报表》 问卷结构:说明词 + 主题词句 + 作业记录例:《人口普查登记表》问卷 设计 基本要求:主题明确,形式简明, 文字通俗,容易理解, 便于回答。词句编排, 层次分明,先易后难。 问卷形式:①开放式词句 ②对选式词句 ③多项选择式词句 ④顺位式词句 ⑤标度式词句〖案例〗null统计整理主要任务资料审核、分组、 汇总、制表、制图等。分组频数分布统计表统计图null分组分组前分组后25%33%42%1·划分现象类型作用: 例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济 null2·研究总体结构例:上海市按GDP计算的三次产业结构(%) 1980年 1990年 1996年 1997年 GDP 100 100 100 100 第一产业 3.2 4.3 2.5 2.3 第二产业 75.7 63.8 54.5 52.2 第三产业 21.1 31.9 43.0 45.5 3·研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元) <200 <300 <400 <500 <600 <800 <1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6 null分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组分组体系null频数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的 分布状态。基本形式:分组单位数频率合计………100频数分布频率分布null分类品质数列变量数列单项数列组距数列等距数列异距数列例例例例变量数列的编制1·计算极差2·确定形式单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。3·组距数列:组距;组数;4·计算各组频数,频率,累计频数,累计频率等。5·组中值的计算:闭口组;开口组null统计表构成总表题横行标题:统计研究的对象。也称主词。纵栏标题:说明主词的指标名。也称宾词。数字资料分类主词简单表分组表复合表宾词平行形式交叉形式编制规则:null统计图直方图等距数列:(变量,频数)异距数列:(变量,频数密度)折线图曲线图等距数列:(组中值,频数)异距数列:(组中值,频数密度)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线 便趋于一条光滑的曲线。P55 图2-5图形null某厂职工人数统计表按性别分组男 职 工女 职 工合 计人数(人)(频数)比率(%)(频率)25311536868.7531.25100.00返回null某厂职工家庭人口分组统计按家庭人口分组1合 计职工户数(频数)比率(%)(频率)7返回23456381055431202.915.241.320.512.18.0255100null第三章 综合指标一、综合指标概述 二、总量指标(绝对数指标) 三、相对数指标(相对数) 四、平均数指标(平均数) 五、标志变异指标主要内容案例null一、综合指标概述统计指标统计指标是综合反映统计总体数量特征的概念和数值。指标名称指标数值反映总体某一方面的质的规定性,是对总体本质特征的一种概括。是总体量的规定性在一定时间、地点、条件下的具体表现。null统计指标重要特点:具体性; 综合性描述指标 评价指标 监测指标分类数量指标 质量指标绝对数指标 相对数指标 平均数指标null指标体系具有内在联系的一系列指标所构成的整体,即称为指标体系。分类社会指标体系 经济指标体系 科技指标体系基本统计指标体系是针对某项社会经济问题而制定的专项指标体系,如工业经济效益指标体系、价格指标体系等。专题统计指标体系null二、总量指标(绝对数指标)概念 总量指标是反映社会经济现象总规模、总水平的 总和指标。 (1)反映国情、国力和企事业单位人、财、物 的状况; (3)是计算相对指标和平均指标的基础。 (2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;作用null分类 按反映总体的内容分按反映的时间状态分 (1)社会总产品, (2)增加值, (3)国内生产总值(GDP) 按计量单位分国民经济统计中几个重要的生产总量指标标志总量 总体单位总数时期总量 时点总量实物量 劳动量 价值量null三、相对指标(相对数)概念相对指标是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。 (1)反映总体内在的结构特征 (3)反映事物发展变化的过程和趋势。 (2)用于不同对象的比较评价;作用种类计划完成相对数结构相对数比例相对数比较相对数强度相对数动态相对数null不同时期 比 较动 态 相对数强 度 相对数不同现象 比较不同总体 比较比 较 相对数同一总体中部分与部分 比 较部分与总体 比 较实际与计划 比 较比 例 相对数结 构 相对数计划完成 相对数同一时期比较同类现象比较null应用原则(1)正确选择对比的基数; (2)必须注意统计的可比性; (3)相对指标要与总量指标相结合。null四、平均指标(平均数)概念平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。数据集中区变量xnull常用的几种平均数概 念 计算 公 式 特 点 优点:①容易理, 便于计算 ②灵敏度高 ③稳定性好 ④ 和 缺点:①易受极值影响 ②在偏斜分布和U形分布中, 不具有代表性1. 算术平均数 ( )标志总量与总体单位总数的比值 简单:加权:null常用的几种平均数概 念 计算 公 式 特 点 优点:①灵敏度高 ②在某种不能计算的条件下,可以代替 缺点:①不易理解 ②易受极值影响 ③有“ 0”值时不能计算 2. 调和平均数 ( )标志值倒数平均数的倒数简单:加权:null常用的几种平均数概 念 计算 公 式 特 点 优点:灵敏度高 ②受极值影响小于 和 ③适宜于各比率之积为总比率的变量求平均 缺点:①有“ 0”或负值时不能计算 ②偶数项数列只能用正根3. 几何平均数 ( )几个变量值连乘积的几次根简单:加权:null常用的几种平均数概 念 计算 公 式 特 点 4. 中位数 (Me)标志值由小到大顺序排列中居中间位置的标志值位置平均数 上限公式:下限公式:优点:①容易理解, ②不受极值影响 ③适宜于开口组资料和些不能用数字测定的事物 缺点:①灵敏度和计算功能差 ②间断数Menull常用的几种平均数概 念 计算 公 式 特 点 5. 众数 (Mo)分配数列中出现次数最多的标志值位置平均数 上限公式:下限公式:优点:①容易理解, ②不受极值影响 缺点:①灵敏度和计算功能差 ②稳定性差 ③具有不唯一性null要点解释权数(Weighted),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。权数例(1) (2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.080100.0 =5 =5 =4.75 null调和平均数与算术平均数的区别例频率分布变了,均值也变。因此,严格地说, 权数应指频率。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标分子:标志总量分母:总体单位总数=几何平均等于对数的算术平均例 组矩数列求中位数是用插值法对中位数组分割的结果。例组距数列求众数是以频数之差计算的比例分割众数组组距的结果。例null价格(元)3.32.52.0合计销售量(斤)34512算术平均求某种商品三种零售价格的平均价格调和平均价格(元)3.32.52.0合计销售额(元)10101030返回null例 求95%、93%、90%的几何平均数(计算误差:0.0007)返回null例 (书上例11的资料)返回分组: <500 <800 <1100 <1400 <1700 <2000 频数: 40 90 110 105 70 50 35 d1=20 d2=5 众数组800~1100①求比例:d1/(d1+d2)=20/(20+5)=0.8②分割众数组的组距:0.8×(1100-800)=240(元)下限公式③加下限,即M0=800+240=1040(元)下页null返回500800110014001700200050100150f (人数)月收入:元1040上页 d1 d2null例 (书上例11的资料)返回①求比例:250-240/(345-240)=0.095②分割中位数组的组距:1400-1100)×0.095=28.5下限公式③加下限,即Me=1100+28.5=1128.5(元)下页标志值由小到大分组: <500 <800 <1100 <1400 <1700 <2000< 频数: 40 90 110 105 70 50 35 累计频数: 40 130 240 345 415 465 500 中位数位置:500/2=250null返回5008001100140017002000∑f/2=250月收入:元1128.5累计人数(∑f)=50040130240345415465500上页null位置平均数与算术平均数的关系XfXfXf(对称分布)正偏态分布(右)负偏态分布(左)在偏斜不大时1212null应用平均指标的原则 1.必须是同质的量方可平均; 2.总平均数与组平均数结合分析; 3.根据具体条件选择平均方法; 4.平均数与典型值和分配数列结合分析; 5.集中趋势与离散趋势结合分析null某厂职工人数统计表按人数分组5~1011~16合 计人数(人)(频数)比率(%)(频率)512325.051.04.0返回17~2220100null某厂职工人数统计表按人数分组5~1011~19合 计人数(人)(频数)比率(%)(频率)512325.051.04.0返回20~2220100null上海市总人口数(1980~1991)年 份1980年末总人口1146.52返回年 份年末总人口198119821983198419851986198719881989199119901162.841180.511194.011204.781216.691232.331249.511262.421276.451283.351287.20null返回null 上海市城市居民消费与投资倾向调查问卷 尊敬的先生、女士: 我们是上海财经大学的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!返回下页null(1)您家是否已经拥有下列耐用家电设备 1、□彩电,2、□组合音箱, 3、□VCD(或DVD), 4、□冰箱, 5、□空调,6、□电脑 (2)您家的住房是: 1、□租赁公房,2、□有产权公房 , 3、□新商品房, 4、□其他(请注明) (3)您家今明两年是否准备以下项目支出: 1、□购买家电设备 5、□现有住房装修 2、□购买成套家俱 6、□支付子女教育费 3、□购买汽车 7、□国内或国际旅游 4、□购买(或置换)房屋 返回下页上页null(4)您今明两年不准备上列大项目支出的主要 原因是:(选填3项) 1、□没有必要 5、□售后服务差 2、□经济不宽裕 6、□价格不合理 3、□品牌不中意 7、□其他(请注明) 4、□质量信不过 (5)您购买商品考虑的主要因素是: 1、□实用价值 4、□品牌 2、□商品质量 5、□售后服务 3、□价格 (请按您认为的重要性□在中写上位序) 返回下页上页null(6)您家平均每月总收入是: 1、□500元以下 5、□2000~3000元 2、□500~1000元 6、□3000~5000元 3、□1000~1500元 7、□5000~8000元 4、□1500~2000元 8、□8000元以上 (7)您家平均每月日常生活费开支是 元 A、其中用于吃(食品)支出大约是 元 (8)您认为您家近几年生活水平是 1.□ 2.□ 3.□ 4.□ 5.□ 提高很多 略有提高 没有变化 略有下降 下降很多 返回下页上页null(9)您收入节余用予以下哪些项?各项约占多大比重? 1.银行储蓄 ( )% 4.其他债券 ( )% 2.国债(国库卷) ( )% 5.股票 ( )% 3.基金 ( )% 6.保险 ( )% 7.其他 ( )% (10)您存钱的主要目的是: 1、□购买设备 4、□子女教育 2、□购买住房 5、□养老防病 3、□结婚 6、□旅游 (请按你认为的重要性在□中写位序) 返回下页上页null(11)您是否了解现在推行的信贷消费 1、□不了解,2、□了解一点,3、□了解, 4、□很了解 (12)您是否打算参加信贷消费: 1、□是,2、□不 (跳过第13问题) (13)您信贷消费的项目是( ) (请按第3题的编号填写)返回下页上页null(14)您是否同意下列看法: 很同无不很 同意所同不 意 谓意同 意 1、信贷消费不合中国国情 2、信贷消费是资本主义国家的做法 3、信贷消费是先甜后苦 4、借债享受有风险 5、借债消费不光彩 6、信贷消费是现代通行的做法 7、只要量力借贷,有利无害 8、发展信贷消费能促进经济增长 返回下页上页null(15)最后,了解一下您的基本情况 A、您的性别:1、□男,2、□女 B、您的年龄: 周岁 C、您的文化程度: 1、□不识字或识字不多, 2、□小学 3、□初中 4、□高中或中专, 5、□大专或大学以上 D、您家庭人口数 人 其中D(1)在业 人;D(2)离退休 人; D(3)失业、下岗 人; D(4)在校学生 人 E、您的职业 (见卡片) F、职务 返回上页nullnull五、标志变异指标(Dispession)概念标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。 (1)反映变量分布的离散趋势; (3)是对事物发展均衡性的量度。 (2)是对平均数的代表性程度的量度;作用null概 念 计 算 特 点 数列中最大值 与最小值之差1.极差 (R)R=最大值-最小值优点:容易理解, 计算方便 缺点:不能反映全部数据分布状况2.平均差 (A、D)各标志值与 均值离差绝 对值的算术 平均 简单:加权:优点:反映全部数据分布状况 缺点:取绝对值 ,数字上 不尽合理 null概 念 计 算 特 点 各标志值与均值离差平方的平均。 方差的平方根(取正根)3.方差(σ2) 和 标准差(σ) 优点:反映全部数据分布状况,数字上合理。 缺点:受计量单位和平均水平影响,不便于比较4.标准差系 数 (Vσ) 标准差与均值 之商,是无量 纲的系数 简单:加权:优点:适宜不同数据集的比较 缺点:对数据结构变化反应不灵敏 方差(σ2)和标准差(σ)是应用最广的标志变异指标nullσ2和σ的简易计算公式由组方差(或组标准差)求总方差(或总标准差)平均组内方差组间方差null标准差的应用测定分布的偏度1.偏度系数SK=0SK>0SK<0(对称分布)正偏态分布(右)负偏态分布(左)null2.偏度系数 (m3——三阶中心矩) 定义M=∑(X-A)k/n为变量X关于A的k阶矩。 当A=0,即以原点为中心,上式称为““K阶原点矩”。K=1,2,3时,有:一阶原点矩M1=∑(X-0)1/n=∑X/n 二阶原点矩M2=∑(X-0)2/n=∑X2/n 三阶原点矩M3=∑(X-0)3/n=∑X3/n 当A= ,即以 为中心,上式称为“K阶中心矩”。K=1,2,3时,有:一阶中心矩 二阶中心矩 三阶中心矩null 所以,m3可以测定偏度。为消除量纲,转变为系数,再除以σ3。<0负偏态 =0对称分布 >0正偏态null计算标准分即将原始分数X经过线性变换转变为标准分Z。反映各原始分的平均数为中心的相对位置。XO 任何原始分在总体中的位 置,用Z倍的σ来测定。null计算抽样误差(以平均指标为例) 设:null抽样误差就是样本平均数分布数列的标准差。null第五章 参数估计和假设检验推断统计:利用样本统计量对总体某些性质或数量特征进行推断。随机原则总体参数统计量推断估计参数估计检验假设检验抽样分布null抽样分布简单随机抽样和简单随机样本的性质不放回放 回放回不放 回独立性和同一性同一性当n/N≤5%时,有限总体不放回抽样等同于放回抽样null统计量与抽样分布统计量:即样本指标。样本均值样本成数样本方差如:抽样分布:某一统计量所有可能的样本的取值形成的分布。性 质数字特征0≤P(Xi)1∑P(Xi)=1均值E(X) 方差E[x-E(x)]2 方差的平方根即抽样分布的标准差就是 推断的抽样误差。null样本均值的抽样分布(简称均值的分布)抽样 均值均值μ=∑Xi/N样本均值是样本的函数,故样本均值是一个统计量,统计量是一个随机变量,它的概率分布称为样本均值的抽样分布。null抽 样 方 法 均 值 方 差 标 准差 (1)从无限总体抽 样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差null从正态总体中抽样得到的均值的分布也服从正态分布。从非正态总体中抽样得到的均值的分布呢? 中心极限定理:无论总体为何种分布,只要样本n足够大(n≥30),均值( )标准化为(z)变量,必定服从标准正态分布,均值( )则服从正态分布,即:null两个样本均值之差的抽样分布抽样抽样估计(1)如:(2〕如果两个总体都是非正态总体,只要n1、n2足够大,根据中心极限定理,可知:null样本成数(即比例)的抽样分布(简称成数的分布)抽样 成数成数P=Ni/N 所有可能的样本的成数( )所形成的分布,称为样本成数的抽样分布。null抽 样 方 法 均 值 方 差 标 准差 (1)从无限总体抽 样和有限总体放回抽样(2)从有限总体不放回抽样根据中心极限定理,只要样本足够大, 的分布就近似正态分布。(np和nq大于5时)抽样误差抽样误差null两个样本成数之差的抽样分布抽样抽样估计 当n1、n2都足够大时,样本成数 都近似服从正态分布,两个样本成数之差( )也近似服从正态分布。P1-P2=?null一个样本方差的抽样分布抽样若:从一个正态总体中抽样所得到的样本方差的分布n,S2则 当 则 null两个样本方差之比的抽样分布抽样从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。n1,S12则 抽样n2,S22null参数估计点估计以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即该估计量称为无偏估计。无偏性有效性当 为 的无偏估计时, 方差 越小,无偏估计越有效。一致性对于无限总体, 如果对任意则称的一致估计。是充分性一个估计量如能完全地包含未知参数信息,即为充分量估计量null区间估计估计未知参数所在的可能的区间。评价准则随机区间置信度精确度随机区间包含(即可靠程度)越大越好。的概率的平均长度(误差范围)越小越好一般形式或总体参数估计值误差范围 △:一定倍数的抽样误差例如:抽样误差 一定时,越大,概率(可靠性)大;随之增大,精确度就差。null抽样组织方式和参数的区间估计待估计参数已知条件置信区间正态总体,σ2已知正态总体,σ2未知非正态总体,n≥30有限总体,n≥30 (不放回抽样)总体均值 (μ)σ未知时,用Sσ未知时,用S两个正态总体已知两个正态总体未知但相等两个非正态总体,n1,n2≥30两个总体均值之差 μ1-μ2null待估计参数已知条件置信区间无限总体, np和nq都大于5总体成数 (p)无限总体, N1P1>5, n1q1>5 N2P2>5, n2q2>5两个总体成数之差 (P1-P2)有限总体, np和nq都大于5有限总体, N1P1>5, n1q1>5 N2P2>5, n2q2>5null待估计参数已知条件置信区间正态总体总体方差 两个正态总体两个总体方差之比null待估计参数已知条件置信区间有限总体不放回抽样(n等比例分配于各层) 各层nh≥30总体均值 (μ)有限总体不放回抽样(n等比例分配于各层) 各层nh≥30总体成数(P)null总体 N样本 n均值:平均层 内方差:置信区间抽样误差估计null待估计参数已知条件置信区间有限总体不放回抽样,样本群数r足够大总体均值 (μ)有限总体不放回抽样,样本群数r足够大总体成数(P)null总体群数R ABCDEFGHIJKLMNOPLHPD 样本群数 r估计均值:群间 方差:置信区间抽样误差null样本数的确定待估计参数已知条件样本数的确定正态总体,σ2已知总体均 值(μ) 例:误差范围简 单 随 机 抽 样 有限总体,不放回抽样, σ2已知总体成数 (P)服从正态分布有限总体,不放回抽样null待估计参数已知条件样本数的确定总体均 值(μ)分层抽样总体均 值(μ)整群抽样有限总体不放回抽样, 等比例分配样本有限总体不放回抽样, 服从正态分布未知用未知用案例null 假设检验 基本思想 检验规则 检验步骤 常见的假设检验null 基本思想小概率原理:如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。总 体 (某种假设)抽样样 本 (观察结果)检验(接受)(拒绝)小概率事件 未 发 生小概率事件 发 生null假设的形式: H0——原假设, H1——备择假设 双尾检验:H0:μ=μ0 , H1:μ≠μ0单尾检验: H0:μ≥μ0 , H1:μ<μ0 H0:μ≤μ0 , H1:μ>μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。null 检验规则确定检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0差 异临界点拒绝H0接受H0cc判 断两类错误接受或拒绝H0,都可能犯错误I类错误——弃真错误, 发生 的概率为α II类错误——取伪错误,发生 的概率为β检验决策 H0为真 H0非真 拒绝H0 犯I类错误(α) 正确 接受H0 正确 犯II类错误(β) 怎样确定c?nullα大β就小,α小β就大基本原则:力求在控制α前提下减少β α——显著性水平,取值:0.1, 0.05, 0.001, 等。如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更,α值取大。 确定α,就确定了临界点c。①设有总体:X~N(μ,σ2),σ2已知。②随机抽样:样本均值③标准化:④确定α值,⑤查概率表,知临界值⑥计算Z值,作出判断0接受区拒绝区拒绝区null 当检验判断为接受原假设H0时,就有可能犯取伪的错误即II类错误。犯II类错误的概率计算: (1)先求出拒绝H0的临界值; (2)再求得在统计量真实的抽样分布下达到临界值的概率β。 统计中,称不犯取伪错误的概率1-β为统计检验的能力或效力。II类错误的概率β的计算null 检验步骤建立总体假设 H0,H1抽样得到样 本观察值12选择统计量 确定H0为真 时的抽样分布3根据具体决策 要求确定α确定分布上的临 界点C和检验规则计算检验统 计量的数值比较并作出检验判断7456null 几种常见的假设检验条件检验条件量拒绝域H0、H1(1) H0:μ=μ0 H1:μ≠μ0 z(2) H0:μ≤μ0 H1:μ>μ0(3) H0:μ≥μ0 H1:μ<μz0z0正态总体σ2已知null条件检验条件量拒绝域H0、H1(1) H0:μ=μ0 H1:μ≠μ0 t(2) H0:μ≤μ0 H1:μ>μ0(3) H0:μ≥μ0 H1:μ<μt0t00正态总体σ2未知(n<30)null条件检验条件量拒绝域H0、H1(1) H0:μ=μ0 H1:μ≠μ0 z(2) H0:μ≤μ0 H1:μ>μ0(3) H0:μ≥μ0 H1:μ<μz0z00非正态总体n≥30 σ2已知或未知null条件检验条件量拒绝域H0、H1(1) H0: μ1=μ2 H1: μ1 ≠ μ2 z(2) H0:μ1 ≤ μ2 H1: μ1 > μ2 (3) H0: μ1 ≥ μ2 H1:μ1 < μ2 z0z00两个正态总体已知null条件检验条件量拒绝域H0、H1(1) H0: μ1 = μ2 H1: μ1 ≠ μ2 t(2) H0: μ1≤ μ2 H1: μ1> μ2 (3) H0: μ1≥ μ2 H1: μ1< μ2 t0t00两个正态总体未知, 但相等null条件检验条件量拒绝域H0、H1(1) H0:μ1 = μ2 H1:μ1 ≠ μ2 (2) H0:μ1 ≤ μ2 H1:μ1 > μ2 (3) H0:μ1 ≥ μ2 H1:μ1 < μ2 0z00两个非正态体n1≥30 n2≥30已知或 未知zznull条件检验条件量拒绝域H0、H1总体服从正态分布 null条件检验条件量拒绝域H0、H1总体服从正态分布 FFFnull条件检验条件量拒绝域H0、H1(1) H0:P=P0 H1:P≠P0 z(2) H0:P≤P0 H1:P>P0(3) H0:P≥P0 H1:P<P0z0z00np≥5 nq≥5null条件检验条件量拒绝域H0、H1(1) H0:P1=P2 H1:P1 ≠P2 z(2) H0: P1 ≤P2 H1:P1 > P2(3) H0:P1 ≥P2 H1:P1 <P2z0z00n1p1≥5 n1q1≥5 n2p2≥5 n2q2≥5 案例null 相关分析 回归分析第六章 相关与回归 相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。主要内容null 相关分析 概念 种类 线性相关变量之间关系函数关系相关关系因果关系互为因果关系共变关系确定性依存关系 随机性依存关系 null 种类一元相关多元相关负 相 关正 相 关线性相关曲线相关xy正 相 关xy负 相 关xy曲线相关xy不 相 关null 线性相关相关系数测定两变量是否线性相关?定义式:未分组:已分组:值:|r|=0 不存在线性关系; |r|=1 完全线性相关 0<|r|<1不同程度线性相关(0~0.3 微弱;0.3~0.5 低度; 0.5~0.8 显著;0.8~1 高度)符号:r>0 正相关;r<0 负相关计算公式相关系数的检验(t检验)检验统计量案例null 回归分析 特点 线性回归 非线性回归回归分析和相关分析的联系和区别1·理论和方法具 有一致性;2·无相关就无回归, 相关程度越高,回归越好;3·相关系数和回归系数 方向一致,可以互相推算。1·相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量;2·相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;3·相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。null 线性回归一元线性回归模型1·一元线性回归模型的一般形式总体一元线性回归模型的一般形式Y的数学期望E(Y)随机误差也称一元线性回归方程,是对应于自变量X某一取值时因变量Y的均值。未知参数样本的一元线性回归模型和回归方程一元线性回归模型一元线性回归方程截距斜率(回归系数)null回归系数b表明自变量x每变化一个单位因变量y的增(减)量。b与r的关系:r>0 r<0 r=0 b>0 b<0 b=0是理论模型,表明x与y两变量之间的平均变动关系。(实际值):X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。随机干扰:各种偶然因素,观察误差和其他被忽视因素的影响。的理论假定值相互独立服从正态分布的数学期望E( )=0的方差都相同,且nullxy2·一元线性回归模型的确定 根据实际数据,用最小平方法,即使 ,分别对a、b求编导并令其为零,求得两个标准方程: 解联立方程,得到null3·一元线性回归模型拟合优度的评价判定系数(r2)是对回归模型拟合优度的评价。xy总偏差 = 回归偏差 + 剩余偏差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。r 的符号同 bnull估计标准误(Sxy) Sxy是二元正态分布中因变量实际值(yj)对估计值( )离散程度的量度。 Sxy 越小, 拟合越好; Sxy 越大, 拟合越差。 Sxy也是用自变量对因变量进行区间估计的抽样误差。68.27% 94,45% 99.73%null4·一元线性回归模型的显著性检验回归系数b的检验设总体回归系数为β H0:β=0;H1:β≠0n≥30时 检验统计量 (β=0) σb是样本回归系数抽样分布的标准差。通常是未知的,用其估计量 代替。 给定显著性水平α,查Z表可知其临界值 。n<30时(β=0) 给定显著性水平α,查t表可知其临界值 。null00Ztnull回归模型整体的F检验 H0:R2=0;H1:R2≠0 检验统计量 F检验假设案例null5·应用一元回归模型进行区间估计n≥30时给定x0,y0的置信度(1-α)的置信区间为:n<30时xyX00给定的x0越接 ,y值估计的精确度越高。平均值估计n<30时特定值估计null 线性回归多元线性回归模型1·多元线性回归模型的性质与模型的确定二元线性回归模型:总体多元线性回归模型的一般形式Y的数学期望E(Y)随机误差表明自变量共同变动引起的Y 的平均变动。也称总体的二元线性回归方差。常数项,和Y构成的平面与Y轴的截距偏回归系数,表示在 固定时 每变化一个单位引起的Y的平均变动;案例null偏回归系数,表示在 固定时 每变化一个单位引起的Y的平均变动;随机误差,其理论假定与一元线性回归模型中的 一样。在多元回归模型中,还要求各自变量之间不存在显著相关,或高度相关也即不得存在多重共线性。样本多元线性回归模型的一般形式二元线性回归模型为:其数学期望也称样本(或估计的)二元线性回归方程。null二元线性回归方程的确定根据实际资料,用最小平方法,即使 ,分别对a、b1、b2求编导并令其为零,求得三个标准方程:解此联立方程便可得到a、b1、b2。2·多元线性回归模型的判定系数和估计标准误判定系数 0<r2<1修正的判定余数:null估计标准误(Sy(x1、x2)) r2和Sy(x1、x2)都是对回归模型拟合优度的评价指标。 Sy(x1、x2)也是用自变量对因变量进行区间估计的抽样误差。3·多元回归模型的显著性检验对偏回归系数的t检验 H0: β1=0 , H1: β1≠0; H0: β2=0, H1: β2≠0。检验统计量:null按显著性水平α和自由度 (n-3)查t表可得到临界值t0模型整体的F检验检验统计量:(k—自变量个数)或 按给定的α和自由度(2) 和(n-3)查F表可得到 临界值Fαnull4·多元回归中的相关分析 复相关:指一个因变量同多个自变量的相关关系。复相关系数恒取正值。偏相关(净相关)指各个自变量在其他自变量固定不变时,单个变量同因变量的相关关系。 计算偏相关系数需借助相关系数矩阵表的资料。二元回归中的相关系数矩阵表yyx1x1x2x2ry1ry2r121.001.001.00 x1与y的偏相关系数: x2与y的偏相关系数:案例null5·应用多元回归方程进行区间估计Y的平均值的区间估计Y的特点值的区间估计式中,是即区间估计的抽样误差。的抽样分布的标准差,式中,是的抽样分布的标准差,即区间估计的抽样误差。null 非线性回归模型当自变量与因变量存在某种曲线相关关系时,可拟合曲线回归模型。例如: 双曲线:a>0 b>0a>0 b<0xxyy指数曲线:y=aebxb>0 b<0xxyynull幂函数曲线:y=axba>0 b>0xyb<1b=1b>1曲线模型的判别方法:
本文档为【统计学原理(经典)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_400881
暂无简介~
格式:ppt
大小:11MB
软件:PowerPoint
页数:0
分类:企业经营
上传时间:2012-02-10
浏览量:84