向量自回归模型 第十四章 向量自回归模型 本章导读:前一章介绍了时间序列回归,其基本知识为本章的学习奠定了基础。这一章将要介绍的是时间序列回归中最常用的向量自回归,它独有的建模优势赢得了人们的广泛喜爱。 14.1 VAR模型的背景及数学表达式 VAR模型主要应用于宏观经济学。在VAR模型产生之初,很多研究者(例如Sims,1980和Litterman,1976;1986)就认为,VAR在预测方面要强于结构方程模型。VAR模型产生的原因在于20世纪60年代一大堆的结构方程并不能让人得到理想的结果,而VAR模型的预测却比...
DW时,所估计的回归就有可能存在伪回归。在本例中的R2=0.995>DW=0.608,这表明,回归模型很可能是伪回归,因此需要对时间序列LNGDP,LNK和LNL进行单位根检验,以此来判断时间序列是否为非平稳序列。 使用下列模型进行单位根检验: (14.12) 估计的结果如下: 表14.7 LNGDP平稳性检验 Null Hypothesis: LNGDP has a unit root Exogenous: Constant, Linear Trend Lag Length: 1 (Automatic based on SIC, MAXLAG=1) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.223796 0.1110 Test critical values: 1% level -4.571459 5% level -3.690814 10% level -3.286909 *MacKinnon (1996) one-sided p-values. 表14.8 LNK平稳性检验 Null Hypothesis: LOGK has a unit root Exogenous: Constant, Linear Trend Lag Length: 1 (Automatic based on SIC, MAXLAG=1) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -1.690541 0.7131 Test critical values: 1% level -4.571459 5% level -3.690814 10% level -3.286909 *MacKinnon (1996) one-sided p-values. 表14.9 LNL平稳性检验 Null Hypothesis: LOGL has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic based on SIC, MAXLAG=1) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -1.536049 0.7796 Test critical values: 1% level -4.532598 5% level -3.673616 10% level -3.277364 *MacKinnon (1996) one-sided p-values. 通过观测表14.7至表14.9发现时间序列LNGDP,LNK和LNL均是非平稳的时间序列。由此可知模型(14.11)是三个非平稳时间序列间的回归,因而,标准的t值和F检验都是无效的,回归方程是一个伪回归,进一步分析表明,这三个变量的一阶差分序列是平稳的时间序列,这样我们可以用这三个一阶差分后的平稳时间序列来替代LNGDP,LNK和LNL,然后进行回归。如果只是从回归的角度来讲,这样做是允许的。但从经济意义上来讲,这可能会将某些有丰富经济意义的和富含价值变量水平之间的长期关系舍弃。因为,大多数经济理论都是以变量的水平值而不是由一阶差分或者多阶差分形式给出。 这样会出现一个两难的问题:在使用非平稳时间序列建立计量经济模型时,如何既要防止伪回归的出现,同时又不至于因使用差分序列而舍弃变量间的长期关系?Granger和Enger于1987年共同提出了协整模型有效地解决了这一问题。 1)协整检验原理 如果时间序列 都是d阶单整序列,那么存在一个向量 ,使得 ,其中,b>0, ,则认为时间序列 是(d,b)阶协整,记为 为协整向量。 协整检验分为量变量协整检验和多变量协整检验,首先介绍两变量协整检验,检验步骤如下: (1)两变量的Enger-Granger检验 为了检验两变量Yt,Xt是否协整,Enger和Granger于1987年提出了两步检验法。 第一步,用OLS方法估计下列方程: (14.13) 得到 (14.14) (14.15) 称为协整回归。 第二步,检验 的单整性。如果 为稳定序列,则认为变量 , 为(1,1)阶协整;如果 为1阶单整,则认为变量 , 为(2,1)阶协整,检验 单整性的方法为ADF检验。下面举例说明两变量Enger-Granger检验过程。 我们以1999年1月至2006年12月的工业增加值(GDP)与物价消费指数(CPI),GDP作为因变量 ,CPI作为自变量 ,所有变量取对数后用最小二乘法在EVIEWS6.0进行估计得到的结果如表14.10。 表14.10 Dependent Variable:LNGDP Method: Least Squares Variable Coefficient Std. Error t-Statistic Prob. LNCPI 1.754336 0.009713 180.6242 0.0000 R-squared 0.169108 Mean dependent var 8.079913 Adjusted R-squared 0.169108 S.D. dependent var 0.480975 S.E. of regression 0.438425 Akaike info criterion 1.199105 Sum squared resid 18.26055 Schwarz criterion 1.225817 Log likelihood -56.55704 Hannan-Quinn criter. 1.209902 Durbin-Watson stat 0.069641 回归以后点击Quick-Genetate series…在对话框的Enter equation里面输入re=resid,点击OK,然后双击,然后会得到回归以后的残差序列,如图14.8。 图14-8 如图14.8,点击View-Unit Root Test,进行单位根检验得到如下表14.11的结果。 表 14.11 Null Hypothesis: RE has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic based on SIC, MAXLAG=6) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -9.002792 0.0000 Test critical values: 1% level -4.059734 5% level -3.458856 10% level -3.145470 *MacKinnon (1996) one-sided p-values. 表14.11的结果显示,残差序列re是稳定序列,因此工业增加值(GDP)与物价消费指数(CPI)是(1,1) 阶协整。 (2)多变量协整关系的检验。 上述Enger-Granger检验通常用来检验两变量之间的协整关系,对于多个变量之间的协整关系,Johansen于1988年,以及与Juselius于1990年提出了一种极大似然法进行检验的方法,通常为Johansen检验。 协整系统的最大似然估计是对协整系统中的所有独立的协整关系做总体分析,而对系统中的协整个数并没有事先假定,同时也不需要对哪个分量的系数进行规范。由于多变量协整的原理在本章开始就已经介绍,在此不再做过多阐述。仍然根据表14-7的数据进行多元协整的Johansen检验。 在进行Johansen检验时,需要对各个变量进行单位根检验,由于前面已经介绍,所以此节就没有列出详细的操作过程,通过单位根检验发现LNGDP、LNK和LNL满足原序列的一阶单整,因此可以进行协整检验,具体结果如表14.12。 表14.12 单位根检验结果 变量 检验类型(c,t,n) ADF统计量 5% 临界值 结论 LNGDP (c,t,1) -3.223796 -3.690814 不平稳 LNK (c,t,1) -1.690541 -3.690814 不平稳 LNL (c,t,0) -1.536049 -3.673616 不平稳 D(LNGDP) (c,t,1) -3.791138 -3.710482 平稳 D(LNK) (c,t,1) -4.040124 -3.710482 平稳 D(LNL) (c,t,0) -4.559045 -3.690814 平稳 在进行多元变量协整之前必须打开var系统,依次选定LNGDP、LNK和LNL,右击以后通过VAR系统打开,具体操作如果14.9。 图14.9 点击以后屏幕会出现如图14-10的模型定义对话框。对话框的上方是模型的两种类型,在此使用系统默认的非限制性的向量自回归模型(Unrestricted VAR),下面需要填写的是滞后变量区间(lag intervals),它是表示需要估计模型右边内生变量的滞后阶数。必须配对书写,前面已经做过了详细阐述。 图14-10 关于滞后期的选择,本例选择滞后2阶,选择方法本章已经做过阐述。通过点击确定以后,输出的结果包括三大部分,分别见表14.12、表14.13和表14.14。表14.12表示的是模型系数参数估计,表14-12最上面的部分表示的是模型的参数估计结果,系数估计值下面第一个括号内表示估计系数的标准差,中括号内表示的是t统计检验值。如表14-12。由于本例有三个变量,因此有三个方程。 表14.12 VAR模型系数估计 LNGDP LNK LNL LNGDP(-1) 0.933916 0.292469 -1.462406 (0.46690) (0.29053) (0.67745) [ 2.00024] [ 1.00667] [-2.14870] LNGDP(-2) -0.427146 -0.492797 1.408269 (0.37733) (0.23480) (0.54749) [-1.13202] [-2.09882] [ 2.57225] LNK(-1) 0.611654 1.373342 0.547106 (0.60445) (0.37612) (0.87702) [ 1.01192] [ 3.65131] [ 0.62382] LNK(-2) -0.276785 -0.198785 -0.560502 (0.54783) (0.34089) (0.79488) [-0.50524] [-0.58313] [-0.70514] LNL(-1) 0.210734 0.047130 0.332604 (0.14913) (0.09902) (0.23089) [ 1.32431] [ 0.47597] [ 1.44056] LNL(-2) 0.257441 0.100132 0.676419 (0.21109) (0.13135) (0.30628) [ 1.21956] [ 0.76230] [ 2.20847] C -3.925781 -1.499385 0.672978 (1.19872) (0.74591) (1.73928) [-3.27497] [-2.01013] [ 0.38693] 表 14.13 R-squared 0.999167 0.999751 0.965068 Adj. R-squared 0.998712 0.999616 0.946014 Sum sq. resids 0.003251 0.001259 0.006843 S.E. equation 0.017190 0.010697 0.024942 F-statistic 2197.912 7373.952 50.64939 Log likelihood 52.03266 60.57190 45.33282 Akaike AIC -5.003629 -5.952434 -4.259202 Schwarz SC -4.657373 -5.606178 -3.912946 Mean dependent 9.793140 10.70179 11.11108 S.D. dependent 0.478987 0.545772 0.107348 表 14.14 Determinant resid covariance (dof adj.) 4.78E-12 Determinant resid covariance 1.09E-12 Log likelihood 171.2760 Akaike information criterion -16.69733 Schwarz criterion -14.65857 从表14.12中可以发现,从t统计量检验的情况来看,三个方程各自只有三分之一的系数项是显著的。但是在建立VAR模型时,一般不进行筛选。 模型建立好以后,还必须对模型建立的有效性进行检验。首先必须对残差是否服从正态分布就行检验,具体操作步骤,首先点击View-Residual-Normality test,如图14.11。 图14.11 输出的结果如表14.15。从输出的JB统计量检验值的可知,接受原假设,即残差是服从正态分布的。 表 14.15 Component Skewness Chi-sq df Prob. 1 -0.401647 0.483962 1 0.4866 2 0.239602 0.172227 1 0.6781 3 -0.072446 0.014745 1 0.9001 Joint 0.671934 3 0.8798 Component Kurtosis Chi-sq df Prob. 1 1.899600 0.908161 1 0.3406 2 0.960258 3.120412 1 0.0773 3 0.867650 3.410188 1 0.0648 Joint 7.438761 3 0.0592 Component Jarque-Bera df Prob. 1 1.392123 2 0.4985 2 3.292638 2 0.1928 3 3.425934 2 0.1803 Joint 8.110695 6 0.2301 对残差进行了正态检验之后,还必须对残差进行自相关检验,检验结果如表14.16,从检验的结果可知,在1%的显著水平下接受原假设,即残差序列不存在自相关。 表 14.16 Lags LM-Stat Prob 1 17.14399 0.0464 2 17.39842 0.0428 3 9.493134 0.3931 4 16.83222 0.0514 5 1.310452 0.9983 6 6.471455 0.6920 7 3.757127 0.9267 8 2.502819 0.9808 9 3.777643 0.9254 10 2.058163 0.9905 11 3.263052 0.9529 12 2.862390 0.9695 接下来对残差进行残差的怀特异方差检验,检验结果如表14.17,从输出的结果可知,在1%的显著水平下,我们没有理由拒绝原假设,即不存在异方差。 表 14.17 Joint test: Chi-sq df Prob. 82.04165 72 0.1961 因此有足够的理由认为,VAR模型的设定是不存在偏差的,但是从稳定性检验方面可知,有一个单位根在单位圆外,具体见图14.12,因此我们可以判断VAR系统是不稳定的。 图14.12 变量之间虽然建立了VAR模型,但是还必须进一步进行协整检验,根据张晓峒的观点,如果三个变量或者更多个变量之间存在协整关系,那么这种情况要比双变量之间协整关系复杂多了。可以由不同单整阶数的变量组合而成。在这种条件下较高阶单整变量之间必须存在协整关系,其相应非均衡误差序列的阶数应与较低单整序列的阶数相同。以三个变量为例。假设有 (14.16) 其中 , 和 的单整阶数可以不同,但 却有可能是平稳的。例如 , 和 ,则 和 必须具有协整关系,且协整序列的单整阶数为零,也就是 为协整向量,且 。因为已经知道 ,所以 。 协整的提出对于用于非平稳变量建立经济计量模型以及检验经济变量之间的长期均衡关系都具有非常重要的意义。 但是在进行协整之前必须明确的是,一组变量存在协整关系的必要条件是这组变量中的所有变量必须是同阶单整的,如果单整的阶数不相同,那么这组变量不可能存在协整关系。协整理论可以使我们能够直接对非平稳的同阶单整变量在水平上的关系进行分析。同时我们还必须注意:(1)协整关系表明具有具有协整关系的高阶单整变量通过通过线性组合以后可以降低单整阶数。(2)当且仅当若干个非平稳变量具有协整性时,这些变量建立的回归模型才有意义。所以协整性检验也是区别真实回归和虚假回归的有效方法。具有协整关系的非平稳变量可以用来建立误差修正模型。 续前例,在窗口工具栏中选择View/Cointegration Test,屏幕中会出现图14.13所示的对话框。 图14.13 由于处理的是协整检验,所以只有当所有的变量是非平稳的时候,此项功能才有效。在图14-13中首先从描述向量自回归过程是否包含常数项和趋势项的6个选项中选择其一。前5个选项对应着关于数据是否是有确定趋势和协整方程中是否包含截矩项或者趋势项的不同假设。第6个选项中显示上述5组假设下的全部结果。如果要想看到每个假设检验的详细结果,必须选择第1至第5具体的选项。本例采取第三种形式。 然后设定VAR的滞后区间(Lag intervals)。“1 3”表示的是从第一期滞后开始直到第三期结束。