首页 统计学第七章虚拟变量

统计学第七章虚拟变量

举报
开通vip

统计学第七章虚拟变量这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文化程度的虚拟变量可取为:1,本科学历D=0,非本科学历第一页,共44页。一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。第二页,共44页。概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模...

统计学第七章虚拟变量
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文化程度的虚拟变量可取为:1,本科学历D=0,非本科学历第一页,共44页。一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。第二页,共44页。概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模型:其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。第三页,共44页。二、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(i)=0,则企业女职工的平均薪金为:1.加法方式第四页,共44页。企业男职工的平均薪金为:几何意义:假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。第五页,共44页。可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。02第六页,共44页。又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上。这时需要引入两个虚拟变量:第七页,共44页。模型可设定如下:在E(i)=0的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:第八页,共44页。高中:大学及其以上:假定3>2,其几何意义:第九页,共44页。还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。如在上述职工薪金的例中,再引入代 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 学历的虚拟变量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:第十页,共44页。女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:第十一页,共44页。2.乘法方式加法方式引入虚拟变量,考察:截距的不同。许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。第十二页,共44页。例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。如,设消费模型可建立如下:第十三页,共44页。这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。假定E(i)=0,上述模型所表示的函数可化为:正常年份:反常年份:第十四页,共44页。当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。例,考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。第十五页,共44页。第十六页,共44页。以Y为储蓄,X为收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n11990年后:Yi=1+2Xi+2ii=1,2…,n2则有可能出现下述四种情况中的一种:(1)1=1,且2=2,即两个回归相同,称为重合回归(CoincidentRegressions);第十七页,共44页。(2)11,但2=2,即两个回归的差异仅在其截距,称为平行回归(ParallelRegressions);(3)1=1,但22,即两个回归的差异仅在其斜率,称为汇合回归(ConcurrentRegressions);(4)11,且22,即两个回归完全不同,称为相异回归(DissimilarRegressions)。第十八页,共44页。平行回归第十九页,共44页。汇合回归第二十页,共44页。相异回归第二十一页,共44页。可以运用邹氏结构变化的检验。这一问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 也可通过引入乘法形式的虚拟变量来解决。将n1与n2次观察值合并,并用以估计以下回归:Di为引入的虚拟变量:第二十二页,共44页。于是有:可分别表示1990年后期与前期的储蓄函数。在统计检验中,如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。第二十三页,共44页。具体的回归结果为:(-6.11)(22.89)(4.33)(-2.55)由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:1990年前:1990年后:=0.9836第二十四页,共44页。第二十五页,共44页。第二十六页,共44页。第二十七页,共44页。第二十八页,共44页。邹氏结构变化的检验和虚拟变量法的比较邹检验只是告诉我们结构是否已经变化,而不能告诉我们当有变化时候是因为只是斜率相异或只是截距相异,或两者均相异。但是虚拟变量法不仅告诉我们两个回归是否有差异,而且落实到差异的起因——由于截距或由于斜率或由于两者。我们只要做一个回归,因为其他的回归可以方便地由它导出。这个单一的回归可以用来做各种假设检验。由于合并而增加了自由度,参数估计的相对精度也有所改进。第二十九页,共44页。3.临界指标的虚拟变量的引入(分段回归)在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。第三十页,共44页。则进口消费品的回归模型可建立如下:这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:第三十一页,共44页。OLS法得到该模型的回归方程为:则两时期进口消费品函数分别为:当t
本文档为【统计学第七章虚拟变量】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_179289
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:44
分类:其他高等教育
上传时间:2018-07-18
浏览量:2