null第九章 自相关:
误差项相关第九章 自相关:
误差项相关null一、自相关的性质
二、自相关的后果
三、自相关的检验
四、自相关的修正
问题的引出(听懂即可) 问题的引出(听懂即可)为什么最小二乘估计量 好?因为 具有 线性性无偏性有效性
(最小方差性)只要满足经典假设,就一定具备三性,无须检验。需进行的是:
统计检验(R2、t、F)使用前提:随机项μ ~N(0, )—经典假设若经典假设不全满足,则t、F检验失效,则将发生严重的后果。经典假设满足么——计量经济学检验?回顾:模型的若干假定回顾:模型的若干假定诸解释变量 XK之间无多重共线性随机误差项μ零均值同方差无自相关X为非随机变量一元线性回归模型的假定服从正态分布多重共线性异方差性序列相关性多元线性回归模型的假定null一、序列相关性的性质如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。 对于模型
Yi=0+1X1i+2X2i+…+kXki+i i=1,2, …,n随机项互不相关的基本假设表现为
Cov(i , j)=0 ij, i,j=1,2, …,nnull称为一阶序列相关,或自相关.其中:为自协方差系数或一阶自相关系数.如果仅存在 E(i,i-1)0 i=1,2, …,n 自相关往往可写成如下形式:
i=i-1+i -1<<1如果因变量观测值之间存在自相关,
则随机干扰项之间就存在自相关。实际经济问题中的序列相关性
(截面数据中的序列相关性举例)
(时间序列数据中的序列相关性举例)
实际经济问题中的序列相关性
(截面数据中的序列相关性举例)
(时间序列数据中的序列相关性举例)
截面数据中因变量取值之间(或误差项取值之间)自相关的解释截面数据中因变量取值之间(或误差项取值之间)自相关的解释一个家庭收入增加对自己消费支出的影响(比如增加自己消费支出),这种影响会波及其他家庭,很有可能迫使另外的某个家庭增加消费支出(死要面子,相互攀比)。因此这两个家庭的消费支出数额之间就存在相关性。进而各自误差项的取值之间也就存在相关性。
这类相关性称为空间相关,是就截面数据而言的。
可以从下表中找到解释……null时间序列数据中变量取值之间(或误差项取值之间)自相关的解释时间序列数据中变量取值之间(或误差项取值之间)自相关的解释
众所周知,GDP等时间序列都呈现出周期性。当经济复苏时,存在某种力量推动序列上移,在GDP序列由谷底向上移动的过程中,序列在某一时点的值会大于其前期值。因此,连续的因变量观察值很可能是相互依赖或相关的。
这类相关性是就时间序列数据而言的。可以从下表中找到解释……null*时间序列数据: 对变量在不同时间所取的观测值。
中国1978年—2001年的GDP数据随机干扰项关系图随机干扰项关系图二、自相关的后果二、自相关的后果1.最小二乘估计量仍然是线性的和无偏的;
2.但不是有效(最小方差)的;
3.计算得到的 不是 的无偏估计量,而是有偏差的;
4.因此,OLS估计量的方差(该方差的计算公式中含有 )是有偏(差)的;
5.因此,通常所用的t检验和F检验是不可靠的。
三、序列相关性的检验序列相关性检验方法有多种,但基本思路相同: 三、序列相关性的检验 检验自相关性,也就是检验随机误差项的取值之间的相关性。或者是检验被解释变量的取值之间的相关性。
但是,实际检验中有一个问题,因为无法得到总体回归模型的随机误差项的取值,这些真实的取值是无法观察的。因此,我们只能根据所给定的一个样本,采用OLS法进行样本回归模型的拟合,从而得到样本残差序列e,再利用e的取值判断是否存在自相关。
自相关检验方法之一:图示法 真实的随机扰动项μ无法得知,只能利用回归残差e来做图形判断。
缺点:定性判断,无定量结论。
方法一:对时间做散点图,对自相关程度作直观判断。该散点图此时称为“时序图”。
方法二:对前后期残差作相关图。该法更直观。 自相关检验方法之一:图示法自相关检验方法之一:图示法做残差关于时间的散点图(时序图),看是否存在可识别的系统模式。若有,则存在自相关。自相关检验方法之一:图示法图示法(二)图示法(二)做残差前后期的散点图,如果趋势为“右上”则为正相关,反之,负相关。若平行,则无自相关。
图示法案例
图示法案例 影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为
式中,Yt为农村居民人均消费支出,X t为农村人均居民纯收入,ut为随机误差项。下表是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。null用OLS回归原始模型用OLS回归原始模型用OLS回归原始模型用OLS回归原始模型用OLS回归原始模型结果用OLS回归原始模型结果作当期残差μt与前期残差μt-1的关系图作当期残差μt与前期残差μt-1的关系图Workfile中可见到eWorkfile中可见到e作当期残差与前期残差的关系图时所用命令作当期残差与前期残差的关系图时所用命令得到:当期残差与前期残差的关系图得到:当期残差与前期残差的关系图null
点击上面Equation输出窗口的按钮Resids可得到残差图,从残差图可见,残差的变动有系统模式,连续为正和连续为负,表明残差项存在一阶正自相关,如下图所示。 作残差与时间的关系图得到:残差与时间的关系图得到:残差与时间的关系图检验自相关方法之二:德宾-沃森d检验
(D.W检验)
检验自相关方法之二:德宾-沃森d检验
(D.W检验)
诊断自相关最著名的检验
针对原假设“无一阶自相关”,构造如下d统计量:构造d统计量的基本假定(要求、前提)构造d统计量的基本假定(要求、前提)1、回归模型包含截距项
2、变量X是非随机变量
3、随机干扰项的生成方式是“一阶自回归模式”:
4、模型中不包含因变量的滞后项,即。DW检验的粗略判定法则DW检验的粗略判定法则DW检验步骤DW检验步骤1.对原模型进行OLS回归,得到样本残差序列e
2. 根据d统计量计算公式 ,得到d值(eviews软件对原始模型回归时自动给出d值)
3.根据样本容量(n)和原模型解释变量的个数(k),查表得到临界的DL(下限)和DU(上限)
4. 根据d检验的判定
规则
编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf
来判断是否存在自相关。d检验的判定规则d检验的判定规则零假设:无一阶自相关。具体又分为二:
返回根据原模型OLS回归结果中输出的DW值判断有无自相关性根据原模型OLS回归结果中输出的DW值判断有无自相关性回顾:原始模型回归结果 原回归方程可决系数较高(0.9788),回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.18,dU= 1.40,模型中DW(0.7704)
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
LM检验结果分析 从LM检验的输出结果可以看出,LM(2)=n*R2=11.31531,临界概率P=0.0034。查表得到的 0.052(2)=5.99147。
11.31531>5.99147,因此拒绝原假设,接受备择假设,也就所原模型的残差存在自相关,又因为,工具模型右边的滞后一期残差与滞后二期残差的回归系数均显著地不为0(通过t检验),说明原来的双对数模型存在二阶自相关性。四、自相关的补救(修正)
根本大法:广义差分法
但根据对随机扰动项之间的相关系数的估计方法不同,又分成几个分支。
四、自相关的补救(修正)关于差分的理解关于差分的理解差分就是增量的意思。
比如ΔGDP2010=GDP2010-GDP2009
上述表达式就是(狭义上)的差分的意思。
那么,什么是广义差分的意思呢?
ΔGDP2010 (广义)=GDP2010-0.8GDP2009
ΔGDP2010 (更加广义)=GDP2010-0.8GDP2009 -0.85GDP2008
以上两个表达式就是广义上差分的意思,简称广义差分。(要注意的是0.8和0.85是为了理解这个概念而随机赋的值)关于随机干扰项生成方式的假定对序列相关进行补救需要事先对随机干扰项的生成方式进行设定。
最常见的做法是假定随机干扰项的生成方式为AR(1)或AR(P),然后采取补救措施。关于随机干扰项生成方式的假定先以双变量模型为例来说如何将原模型变换为广义差分模型,以消除自相关先以双变量模型为例来说如何将原模型变换为广义差分模型,以消除自相关原双变量模型:Yt=B1+B2Xt+Ut
假设误差项服从一阶自回归过程:Ut=ρut-1+vt(无截距项)
再把原模型写成滞后一期的形式:
Yt-1=B1+B2Xt-1+Ut-1
两边同时乘以ρ得到:
ρYt-1=ρB1+ρB2Xt-1+ρUt-1
将原双变量模型减去“两边乘以ρ的模型”得到:
Yt-ρYt-1=B1(1-ρ)+B2(Xt-ρXt-1)+vt
此时,最后那个模型就是广义差分模型,将Yt-ρYt-1
和 Xt-ρXt-1 看作两个新的变量Y*和X*,再用OLS法进行估计。
第一种方法:利用原始模型的残差估计ρ ,进而再使用广义差分法第一种方法:利用原始模型的残差估计ρ ,进而再使用广义差分法
首先,利用当期残差与前期残差进行回归。注意:没有截距项。null
0.496086便是当期残差与前期残差之间的相关系数,这就是ρ的估计值对原模型进行广义差分变换,得到广义差分方程:
Yt- 0.496086 Yt-1=β1(1- 0.496086)+β2(Xt- 0.496086 Xt-1)+vt利用0.496086对原始模型进行广义差分变换
对原模型进行广义差分变换,得到广义差分方程:
Yt- 0.496086 Yt-1=β1(1- 0.496086)+β2(Xt- 0.496086 Xt-1)+vt利用0.496086对原始模型进行广义差分变换对广义差分方程进行OLS估计(首先要生成新序列)
对广义差分方程进行OLS估计(首先要生成新序列)
对原模型进行广义差分变换,得到广义差分方程:
Yt- 0.496086 Yt-1=β1(1- 0.496086)+β2(Xt- 0.496086 Xt-1)+vt对x进行差分变换,生成新序列X1对x进行差分变换,生成新序列X1Workfile中见到差分变换后的新序列Workfile中见到差分变换后的新序列用OLS法对广义差分模型进行拟合用OLS法对广义差分模型进行拟合由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL = 1.16,dU = 1.39,模型中DW = 1. 397593> dU,说明广义差分模型中已无自相关.由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL = 1.16,dU = 1.39,模型中DW = 1. 397593> dU,说明广义差分模型中已无自相关.用OLS法对广义差分模型进行拟合的结果第二种方法:利用原模型回归结果中的DW值估计ρ ,进而再使用广义差分法第二种方法:利用原模型回归结果中的DW值估计ρ ,进而再使用广义差分法
DW值与ρ的估计值之间有如下近似关系:
DW值≈2*(1-ρ的估计值)
ρ的估计值≈1-(DW值/2)=1-(0.77047/2) =0.6148
(注:原模型的DW值为0.77047)
利用0.6148对原始模型进行广义差分变换
对原模型进行广义差分变换,得到广义差分方程:
Yt-0.6148Yt-1=β1(1-0.6148)+β2(Xt-0.6148Xt-1)+vt利用0.6148对原始模型进行广义差分变换对广义差分方程进行OLS估计
(首先要生成新序列)对广义差分方程进行OLS估计
(首先要生成新序列)对x进行差分变换,生成新序列X2对x进行差分变换,生成新序列X2Workfile中可见到新序列Y2,X2Workfile中可见到新序列Y2,X2用OLS法对广义差分模型进行拟合用OLS法对广义差分模型进行拟合用OLS法对广义差分模型进行拟合的结果用OLS法对广义差分模型进行拟合的结果由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL = 1.16,dU = 1.39,模型中DW = 1.478094> dU,说明广义差分模型中已无自相关.第三种方法:广义差分法 之 杜宾两步法第三种方法:广义差分法 之 杜宾两步法(原)差分方程:Yt-ρYt-1=β1(1-ρ)+β2(Xt-ρXt-1)+vt
将上述差分方程变形如下:
Yt=ρYt-1+β1(1-ρ)+β2(Xt-ρXt-1)+vt
=ρYt-1+β1(1-ρ)+β2Xt –ρ*β2Xt-1+vt
采用OLS法估计变换后的差分方程,可以得到Yt-1前面的系数ρ的估计值。再将ρ的估计值代入原差分模型,采用OLS法可以得到原差分模型的估计结果。
杜宾两步法
案例分析
安全事故典型案例分析生活中谈判案例分析管理沟通的案例分析股改案例分析刑法学案例分析
杜宾两步法案例分析 本例主要分析中国商品进口M与国内生产总值GDP的关系,选取了1978年到2001年的国内生产总值GDP,商品进口量M,以M为被解释变量, GDP作为解释变量进行分析 。null 1978—2001年中国商品进口与国内生产总值DW值为0.6279,证明存在严重的自相关。
DW值为0.6279,证明存在严重的自相关。
原模型回归结果 (记住:由于有自相关性,最后会对原模型进行调整,注意最终调整后的模型与原模型的比较)原始模型的公式表达原始模型的公式表达构建以下回归得到ρ的估计值构建以下回归得到ρ的估计值ρ的估计值为0.846611ρ的估计值为0.846611利用0.8466生成新序列im利用0.8466生成新序列im利用0.8466生成新序列igdp利用0.8466生成新序列igdpWorkfile中可见到生成的新序列Workfile中可见到生成的新序列利用新序列进行OLS估计利用新序列进行OLS估计利用新序列进行OLS估计结果利用新序列进行OLS估计结果二阶自相关的修正二阶自相关的修正 观察回归后的DW值,我们无法判断是否还存在序列相关,因此我们假定随机误差项存在二阶序列自相关(在无法判断的情况下,宁可信其有,不可信其无),我们再次用杜宾两步法进行修正。
在命令栏输入:
ls m c m(-1) m(-2) gdp gdp(-1) gdp(-2)
利用该辅助回归模型对ρ1和ρ2进行估计在命令栏输入:
ls m c m(-1) m(-2) gdp gdp(-1) gdp(-2)
利用该辅助回归模型对ρ1和ρ2进行估计得到ρ1和ρ2的估计值分别为0.9382、-0.4687
注:记住这两个值,在后面的讨论中会用到。得到ρ1和ρ2的估计值分别为0.9382、-0.4687
注:记住这两个值,在后面的讨论中会用到。利用0.9382、-0.4687生成新序列利用0.9382、-0.4687生成新序列利用0.9382、-0.4687生成新序列利用0.9382、-0.4687生成新序列利用新序列进行OLS估计结果(这就是最终模型)利用新序列进行OLS估计结果(这就是最终模型)观察DW值=1.5835。样本容量22,解释变量1个,查表得du(上临界值)=1.429,此时序列相关消除。最终模型的公式表达最终模型的公式表达注:记住这里的IIGDP前的系数0.02以及截距项86.08,后面的讨论中会用到这一点。回顾:原始模型的公式表达回顾:原始模型的公式表达回顾原始模型后发现一个问题回顾原始模型后发现一个问题
最终模型与原始模型的变量不一致,为了与原模型进行对比,需要将最终模型的因果变量转化为与原模型的因果变量一致。
怎么转化呢?
利用一下公式:
86.08/[1- 0.9382-(-0.4687)]=162.26
(用162.26作为调整表达形式后的最终模型的截距项,如下所示……)
将最终模型的表达形式调整如下:将最终模型的表达形式调整如下:其中,0.02仍然和未调整表达形式的最终模型解释变量前的系数0.02相等。 重点关注:进而推广到一般,调整表达形式(以便和原模型对比)后的最终模型的截距项估计值=未调整表达形式的最终模型的截距项估计值/(1-ρ1-ρ2-…-ρp),如果只有一阶自回归,分母就只用减去ρ1,如果是二阶自回归,就要减去ρ1和ρ2,依此类推。调整表达形式后的最终模型的解释变量前面的系数和未调整表达形式的最终模型的解释变量前面的相应系数相等。第四种方法:广义差分法 之 科克伦-奥科特迭代法(Cochrane_Qractt)第四种方法:广义差分法 之 科克伦-奥科特迭代法(Cochrane_Qractt)
在Eviews中,可以采用很简单的方法来实现广义差分法参数估计。
原来的广义差分模型通过改写之后(至于如何改写,可不必追究),可以利用OLS法估计参数,选择常数项,X1,X2…,AR(1), AR(2) …作为解释变量,即可得到常数项的估计值、X前面系数的估计值以及ρ的估计值【即AR(1), AR(2)…前面的系数】。
至于选择几阶随机干扰项的自回归项作为解释变量,主要判断依据是DW统计量,逐次引入自回归项,直到满意为止,即没有自相关性为止。
科克伦-奥科特迭代法案例分析 科克伦-奥科特迭代法案例分析 本例主要分析中国商品进口M与国内生产总值GDP的关系,选取了1978年到2001年的国内生产总值GDP,商品进口量M,以M为被解释变量, GDP作为解释变量进行分析 。null 1978—2001年中国商品进口与国内生产总值DW值为0.6279,证明存在严重的自相关。
DW值为0.6279,证明存在严重的自相关。
原模型回归结果先引入AR(1) 进行回归先引入AR(1) 进行回归DW值显示,依然存在自相关DW值显示,依然存在自相关再引入AR(2) 进行回归再引入AR(2) 进行回归回归结果显示,DW=1.853。样本容量22,解释变量3个,因此查表得到的Du(上临界值)=1.664,因此已经不存在自相关了回归结果显示,DW=1.853。样本容量22,解释变量3个,因此查表得到的Du(上临界值)=1.664,因此已经不存在自相关了因此,经过广义差分变换之后的模型表达式如下因此,经过广义差分变换之后的模型表达式如下由于该模型表达式已经和原模型表达式的因果变量一致,因此没必要进一步调整,就可以直接与原模型进行对比了。与原模型的对比可以发现,截距项有差别,GDP前面的系数(基本)没有差别。