第十四章 非平稳时间序列模型
平稳时间序列的均值为常数,自协方差函数与起点无关,而非平稳时间序列则不满足这
两条
要求
对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗
。对于非平稳时序的分析处理,基本思路是考虑如何转化到平稳时序,或者如何与
平稳时序联系起来。非平稳时序有两个最主要的表现形式,一个是序列带有趋势项,一个是
单位根过程。
对于带有趋势项的时序,处理
办法
鲁班奖评选办法下载鲁班奖评选办法下载鲁班奖评选办法下载企业年金办法下载企业年金办法下载
是从序列里减去趋势项,即减去一个函数;对于单位
根过程,处理办法是作序列的差分,即序列自身前后项相减。还有一个办法,就是找到另外
的有共同趋势的时序相减,即减去另外的序列,几个非平稳的时序组合可以变成平稳的。这
样理解时序的平稳化办法,包括理解协稳(Cointegration)过程,应该比较通俗形象。
本章先研究随机游走和单位根过程。不带常数项的单位根过程,最简单的如:
ttt yy ε+= −1 (14.0.1)
它的均值尽管为常数,可是方差会趋于无穷,不是平稳过程:
22
1 )()( σεε tEyD tt =++= L (14.0.2)
带有常数项的单位根过程:
ttt yy ερμ ++= −1 , 1=ρ (14.0.3)
经反复替代可得:
∑∞
=
+=
0
)(
i
tty εμ (14.0.4)
显然有增长趋势。因此研究单位根过程的性质,推广到一般情形,进行假设检验,就十分重
要。
单位根过程的检验十分复杂,难以掌握,同时存在的问题较多。一是统计量转换比较多,
二是使用极限分布,三是使用随机积分,四是分布表比较粗糙。本书作者使用自己提出的统
计量分布函数表的 M—C 算法,避免了这四个问题,容易掌握,自然也比较精确一些。
如果几个单位根过程组合起来变成了平稳过程,那么这几个单位根过程之间就存在协稳
关系。本章详细研究了协稳过程与协稳向量的性质、参数估计与假设检验,包括最小二乘方
法与最大似然方法。由于利用了我们的统计量分布函数表的 M—C 算法,所以处理假设检
验问题比较轻松。不必推导什么极限分布,写出了参数估计的统计量,知道了模型变量的初
始分布,就可以算出统计量的分布函数表,进行假设检验了。
本章还介绍了 ARCH、GARCH、IGARCH、EGARCH、GARCH-M、VGARCH 等自
回归条件异方差模型,它们的一些主要的统计性质以及参数估计和假设检验的一些基本方
法。. ARCH 一类过程在满足一定的约束条件时是稳定过程,它的无条件期望和方差均为常
数,但是它的条件方差却随时间变化,是过去的随机干扰的函数。这种性质使得这一类模型
适合于描述金融证券等随机变量的变化规律。
本章的计算比较复杂,也比较多,需要不断扩展和更新,除了DASC软件光碟之外,读
613
者可以在我们的网站 http://public.whut.edu.cn/slx/ 上找到最新的程序和算例。
本章继续约定时间变量 取整数,是离散变量,就不一一申明。 t
第一节 非平稳时序与单位根过程
一、随机游走与单位根过程
许多经济指标的时序数据不具备平稳时序特征,它们往往带有趋势性,例如 GDP 的增
长、货币供应量的增长、财政支出的增长,等等。描述增长趋势的时间序列,一条途径是序
列表达式里直接带有趋势项,如
ttt ybtay ερ +++= −1 (14.1.1)
其中 ,0≠b 1|| <ρ 。还有一条途径,序列表达式里并不直接带有趋势项,这就是随机游走
与单位根过程。我们先看不带常数项的随机游走与单位根过程。
设有序列 ,对序列数据取一阶差分: }{ ty
1−−=Δ= tttt yyyx (14.1.2)
如果差分序列 是平稳序列,则称原来的序列 为单位根过程。 }{ tx }{ ty
作为一般的情况,我们先看随机游走过程:
ttt yy ε+= −1 (14.1.3)
其中 }{ tε 是白噪声。这个序列可以理解为直线上的随机游走,每一步的位置 都是在前一
时刻的位置 的基础上随机游走一个量
ty
1−ty tε 。它是一个非平稳过程,虽然 的期望 ty
0210 )()( yyEyE tt =++++= εεε L (14.1.4)
为一常数, 但它的方差
22
1
2
0 )()()( σεε tEyyEyD ttt =++=−= L (14.1.5)
是时间 t的函数,不是常数,而且随 t发散到无穷大。对(14.1.3)取差分,显然差分序列是
平稳过程,因此随机游走是单位根过程。
随机项更一般的单位根过程是
ttt uyy += −1 (14.1.6)
其中 为一平稳过程, 且}{ tu ∞<== + ),(,0)( kttkt uuCovuE γ 。如果采用自回归的形式:
ttt uyy += −1ρ (14.1.7)
那么 1=ρ 。引进滞后算子 L,使得 1−= tt yyL ,则上式成为:
tt uyL =− )1( ρ (14.1.8)
其中 )1( Lρ− 称为滞后多项式,它的特征方程
01 =− zρ (14.1.9)
614
有根 ρ
1=z 。当 1=ρ 时,特征方程有一单位根 1=z ,这就是“单位根过程”名称的由来。
(14.1.5)已经告诉我们,单位根过程不是平稳过程。我们还可以进一步分析单位根过
程参数最小二乘估计的极限性质。对于一阶自回归过程
ttt yy ερ += −1 (14.1.10)
我们考虑其中参数 ρ 的最小二乘估计。 若这时 }{ tε 独立同分布,并有 0)( =tE ε , )( tD ε
,利用样本 构造∞<= 2σ Tyy ,,1 L ρ 的最小二乘估计:
∑
∑
=
−
=
−
= T
t
t
T
t
tt
T
y
yy
1
2
1
1
1
ρˆ (14.1.11)
将(14.1.7)代入分子中的 得 ty
∑
∑
∑
∑
=
−
=
−
=
−
=
−−
+=
+
= T
t
t
T
t
tt
T
t
t
T
t
ttt
T
y
y
y
yy
1
2
1
1
1
1
2
1
1
11 )(
ˆ
ε
ρ
ερ
ρ (14.1.12)
当 1|| <ρ 时, 是平稳过程。因为}{ ty }{ tε 独立同分布,与 不相关,故1−ty 0),( 1 =− ttyCov ε 。
当 时,∞→T Tρˆ 以概率收敛于参数 ρ ,所以最小二乘估计是一致估计。根据中心极限定
理, )ˆ( ρρ −TT 有正态的极限分布
))1(,0()ˆ( 22 ρσρρ −⎯→⎯− NT dT (14.1.13)
这里符号 表示依分布收敛。注意极限分布的方差,当 为平稳过程时,⎯→⎯d }{ ty 1|| <ρ ,
方差 为一大于零的正数,)1( 22 ρσ − )ˆ( ρρ −TT 的极限分布是一正态分布。但当 为
单位根过程时,
}{ ty
1=ρ ,方差 为零, )1( 22 ρσ − )ˆ( ρρ −TT 的极限分布不再是正态分布,
而是一退化分布。显然二者有本质区别。
要描述带有趋势的经济变量,可以用带常数项的随机游走过程。在时间序列
ttt yy ερμ ++= −1 (14.1.14)
中,若 0≠μ , 1=ρ , }{ tε 独立同分布, 0)( =tE ε , ,则称 是带常数项
的随机游走。直接替代一次得
2)( σε =tD }{ ty
tttttt yyy εεμμεμ ++++=++= −−− )( 121 ,反复替代可
得:
∑∞
=
−+=
0
)(
i
itty εμ (14.1.15)
显然它有增长趋势。
模型(14.1.15)的参数μ 和 ρ 的最小二乘估计 μˆ 和 ρˆ 可以联合表示为
615
⎟⎟
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜⎜
⎜
⎝
⎛
⎟⎟
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜⎜
⎜
⎝
⎛
+⎟⎟⎠
⎞
⎜⎜⎝
⎛=⎟⎟⎠
⎞
⎜⎜⎝
⎛
∑
∑
∑∑
∑
=
−
=
−
=
−
=
−
=
−
T
t
tt
T
t
tt
T
t
t
T
t
t
T
t
t
yyy
yT
1
1
1
1
1
2
1
1
1
1
1
1ˆ
ˆ
ε
εεμ
ρ
μ
(14.1.16)
以 2/1T 乘 μˆ , 2/3T 乘 ρˆ ,可以推得估计的极限分布:
),0(
)1ˆ(
)ˆ( 12
2/3
2/1 −⎯→⎯⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
− QN
T
T d σρ
μμ r
(14.1.17)
其中矩阵 为一正定的实对称矩阵: Q
⎟⎟⎠
⎞
⎜⎜⎝
⎛=
3/2/
2/1
2μμ
μ
Q (14.1.18)
由(14.1.2)定义的单位根过程可以推广一般的自回归单位根过程,我们可以从
序列出发考虑。 模型的主要表达式如:
)(AR p
)(AR p
(14.1.19) t
p
j
jtjtptpttt yyyyy ερερρρ +=++++= ∑
=
−−−−
1
2211 L
其中 tε 是白噪声,要求实数 pρρρ ,,, 21 L 使得特征多项式的零点都在单位圆外:
011
1
2
21 ≠−=−−−− ∑
=
p
j
j
j
p
p zzzz ρρρρ L , 1|| ≤z (14.1.20)
如果取消这一限制,但是假设单位圆 1|| =z 上只有一个根 1=z ,单位圆内再无其它根,那
么可以将模型重新表达为差分形式。令
pρρρρ +++= L21~ (14.1.21)
1,,2,1);( 1 −=++−= + pjpjj LL ρρζ (14.1.22)
可将特征多项式改写成
p
pLLL ρρρ −−−− L2211 )1)(()~1( 11221 LLLLL pp −+++−−= −−ζζζρ L
相应地可将序列(14.1.19)改写,注意此时它已不是真正意义上的 序列: )(AR p
tt
p
p yLLLLL εζζζρ =−+++−− −− )}1)(()~1{( 11221 L
重新组织后, 可得
tptptttt yyyyy εζζζρ +Δ++Δ+Δ+= +−−−−− 1122111~ L (14.1.23)
根据假设, 特征多项式有且只有一个单位根, 所以当 1=z 时, 有
0~1)1( 21 =−=−−−− ρρρρ pL (14.1.24)
上式等价于 1~ =ρ 。
如果对模型(14.1.23)加上常数项μ ,可得
tptptttt yyyyy εζζζρμ +Δ++Δ+Δ++= +−−−−− 1122111~ L (14.1.25)
616
要对 ρ~ 作出估计,可令
],,,,~,[ 121 ′= −pζζζρμβ L (14.1.26)
],,,,,1[ 1211 ′ΔΔΔ= +−−−− pttttt yyyyX L (14.1.27)
可将(14.1.23)改写成
ttt Xy εβ +′= (14.1.28)
给定初始值, 参数 β 的最小二乘估计 为 βˆ
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ′= ∑∑
=
−
=
T
t
tt
T
t
tt yXXX
1
1
1
βˆ (14.1.29)
它的第二个分量就是参数 ρ~ 的估计。
有了参数估计的统计量,又知道原始模型的随机分布,我们可以作出 1~ =ρ 的假设检验。
下面我们进一步研究多维时序的单位根过程。在第十三章我们已经建立起m维随机向
量 阶自回归过程: p
∑
=
− +=
p
j
tjtjt XΡX
1
εrrr (14.1.30)
其中 }{ tεr 是 元白噪声 , 是m ),0( 2 mIW σ pPPP ,,, 21 L mm× 实矩阵。当序列的特征方程
的根都在单位圆外时:
1 ,0det
1
≤≠⎟⎟⎠
⎞
⎜⎜⎝
⎛ −∑
=
zzPI
p
j
j
jm (14.1.31)
)(VAR p 模型有其平稳解,即将序列表为白噪声的叠加:
∑∞
=
−+=
0
Φ
j
jtjtX εμ rr
r
(14.1.32)
现在我们讨论将序列表为差分形式。带常数项的自回归序列也可等价地表示为
tt
p
pn XLΡLΡLΡI εμ rr
r
L +=−−−− )( 221 (14.1.33)
其中的 L为滞后算子。令
pΡΡΡΡ +++= L21~ (14.1.34)
][~ 21 psss PPP +++−= ++ Lζ (14.1.35)
其中 1,,2,1 −= ps L 。利用上述记号可将多元时序(14.1.32)表示成下列形式:
t
p
pn XLPLPLPI
r
L ][ 221 −−−−
t
p
pn XLLLLLPI
r
L )]1)(~~~()~[( 11221 −+++−−= −−ζζζ
tptptttt XXXXPX εμζζζ rr
r
L
rrr +=Δ−−Δ−Δ−−= +−−−−− 1122111 ~~~~ (14.1.36)
617
从而有
tptptttt XXXXPX εζζζμ r
r
L
rrrrr +Δ++Δ+Δ++= +−−−−− 1122111 ~~~~ (14.1.37)
若在以上序列中, 随机向量 tX
r
的每一个分量都含有单位根,那么, nIP =~ ,即
np IPPP =+++ L21 (14.1.38)
同样的,只要我们作出了P~ 的估计,那么就可以作出 nIP =~ 的假设检验。
二、单位根过程的检验
对于带有增长趋势的经济时间序列数据,单从图像上我们无法确定数据是带趋势项的平
稳过程,还是带常数项的单位根过程,因此需要进行检验。带趋势项的平稳过程,典型的如
ttt ybtay ερ +++= −1 , )1||,0( <≠ ρb (14.1.39)
带常数项的单位根过程,典型的如
ttt yy ερμ ++= −1 , )1,0( =≠ ρμ (14.1.40)
研究证明,若对带趋势的时序数据进行假设检验,即使数据不是由(14.1.39)产生的, 而
是由带常数项的单位根过程(14.1.40)产生的,我们硬性要将它作为(14.1.39)处理,对线
性趋势项的参数 和 作 t检验, t统计量仍会呈显著性。这样的检验结果显然是不对的。
因此在检验时间趋势之前,需要先确定在时间序列中是否存在单位根。只有在单位根假设被
拒绝后,才采用模型(14.1.39),并对其中的参数作假设检验。
a b
下面我们具体讨论一个例子。设有平稳的一阶自回归过程
ttt yy ερ += −1 (14.1.41)
1|| <ρ , }{ tε 独立同分布,且 0)( =tE ε , ,检验假设 ∞<= 2)( σε tD
0100 :: ρρρρ ≠↔= HH (14.1.42)
其中 10 <ρ ,检验的 统计量由下式给出: t
η
ρρ
ˆ
ˆ 0−=Tt (14.1.43)
其中 ρˆ 为 ρ 的最小二乘估计,ηˆ为 ρˆ 的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差的估计值。当原假设 00 : ρρ =H 为真时,
即数据由 ttt yy ερ += −10 产生,统计量 Tt 有自由度为 1−T 的 t分布。根据显著性水平α ,
可以从 t分布表中查得相应的临界值 ,若2/αt 2/|| αttT < , 接受原假设 00 : ρρ =H ;否则拒
绝原假设 , 接受备选假设0H 01 : ρρ ≠H 。
这种方法不能直接用来检验假设 1:0 =ρH ,因为当假设 1:0 =ρH 为真时,可以证明
不服从 t分布。 Tt
此时参数 ρ 的最小二乘估计 ρˆ 为:
618
∑
∑
=
−
=
−
= T
t
t
T
t
tt
y
yy
1
2
1
1
1
ρˆ (14.1.44)
迪基—福勒方法找到统计量 )1ˆ( −TT ρ 有极限
∫
−→− 1
0
2
2
)(2
1)1()1ˆ(
drrW
WT ρ (14.1.45)
其中 表示布朗运动。以)(tW ηˆ表示统计量 ρˆ 的标准差的估计值,它有表示形式
2/1
1
2
1
2ˆˆ ⎟⎟⎠
⎞
⎜⎜⎝
⎛= ∑
=
−
T
t
tyση (14.1.46)
其中的 为方差 的最小二乘估计: 2σˆ 2σ
∑
=
−−−=
T
t
tt yyT 1
2
1
2 )ˆ(
1
1ˆ ρσ (14.1.47)
由 ρˆ 和ηˆ构造检验原假设的 统计量 Tt
2/1
1
2
122
1
ˆ
)1ˆ(
ˆ
1ˆ
⎟⎟⎠
⎞
⎜⎜⎝
⎛−=−= ∑
=
−
T
t
tT y
T
Tt σ
ρ
η
ρ
(14.1.48)
可以推证 的极限为 Tt
2/11
0
2
2
)(2
1)1(
⎭⎬
⎫
⎩⎨
⎧
−→
∫ drrW
WtT (14.1.49)
迪基—福勒(Dickey-Fuller test)根据这个极限,用随机模拟方法计算出函数表,让用户去
查表检验。有一个算例是检验美国财政部债券 1947 年到 1989 年的季度利息率,168 个数据,
查表用的是样本容量 100 的情况,然后得出检验结果是接受了原假设 1:0 =ρH 。
参数假设检验问题有几个要点,一是要有原假设,二是要有根据样本计算参数的统计量,
三是要有备择假设,四是要有显著性水平,五是要能够根据统计量和参数假设构造出不含任
何参数的分布,该分布有分布表。能够用函数式表达的分布毕竟是少数。用极限分布去近似
是常用的办法,可惜有的统计量连极限分布也推导不出来,即使有了,遇到小样本问题实在
是太勉强。
单位根过程的假设检验遇到了分布函数表问题,我们不能推导统计量的精确分布,统计
量的极限分布也是随机积分的形式。迪基(Dickey)—福勒(Fuller)的单位根检验法,将
参数估计的原始统计量进行变化,再推导出极限分布,然后采用随机模拟的办法,计算出分
布函数表,供用户检验使用。一般参考书列出的样本容量分为 25、50、100 三个档次,自由
度也固定,显然应用起来相当粗糙。
619
算例 14.1.2 基于统计量的分布函数表计算
本书作者在 1993 年研究了统计量的概率分布函数表的 Monte-Carlo 算法,基本思想是,
只要有了统计量的表达式,有了样本的分布,就可以大量发生样本的伪随机数,从而得到大
量的统计量随机数;根据统计量随机数构造经验分布函数,就有了统计量的分布函数表。在
这个过程中,需要解决伪随机数的周期限制问题,可以使用一个随机数发生器去打乱若干个
随机数发生器的办法;需要确认统计数表的有效数字位数,可以采取扩大样本容量一倍,统
计数表不变的数字认同为有效数字;当然,也可以采用数据平滑、插值的办法,改进数表精
度。
我们掌握了根据统计量和随机变量的初始分布直接模拟计算统计数表的方法,就可以根
据实际问题自由地计算出需要的分位点或者概率。本书不附任何统计数表,因为我们有
DASC 的电子统计数表。
本书作者的办法避免了极限分布和随机积分,根据模型假设和 ρˆ 的估计式可以直接计
算出 ρˆ 的分布。在模型中任取序列初值 ,不妨令0y 10 =y ,再给发生伪随机数 tε 的种子初
值 ,就可以根据(14.1.41)得到一个容量为tI T 的序列 ,从而根据(14.1.44)计算出
一个
}{ ty
ρˆ 。继续重复这个计算,只是改变伪随机数 tε 的种子值 ,就能得到 10000 个至 100000
个
tI
ρˆ ,它们是随机的,就形成了分布,就可以用来检验原假设 1:0 =ρH 或者其它的假设。
我们提倡的办法优点在于,一是公式转弯少,使用的是原假设的统计量;二是根据统
计量直接的分布,而不是极限的分布;三是不必进行随机积分;四是可以根据任意的显著性
水平、任意的样本容量进行检验,因此更加合理和精确一些。编程也不困难,DASC 软件已
经实现了这一检验。
迪基—福勒检验法讨论原假设和备择假设情况时,将几个参数的情况同时讨论,也比
较复杂,难以掌握。我们
建议
关于小区增设电动车充电建议给教师的建议PDF智慧城市建议书pdf给教师的36条建议下载税则修订调整建议表下载
一个一个地检验,既简单,又避免了滥竽充数的现象发生。迪
基—福勒检验法的详细讨论见 Hamilton 的《Time Series Analysis》。
三、非平稳过程平稳化
在第十二章,我们研究了含有趋势项和周期项的非平稳过程,使用回归的办法找到趋
势项和周期项,从序列里减去它们,可以实现序列的平稳化。这个办法可以理解为从序列里
减去一个函数。
现在我们研究了单位根过程。单位根过程也能使序列呈现增长趋势,我们可以使用差
分的办法实现序列的平稳化。这个办法可以理解为序列本身前后项相减。
还要什么办法可以实现非平稳过程的平稳化呢?能够想到的自然是再找一个或几个序
列来,减去它们或者它们的线性组合,就是序列与序列相减。这是我们在下一节要研究的协
稳(协整)过程。
620
第二节 协稳(Cointegration)过程
一、协稳过程的概念及表示
对于若干个非随机的变量 ,如果存在着不全为零的常数nyyy ,,, 21 L nααα ,,, 21 L ,
使得
02211 =+++ nn yyy ααα L (14.2.1)
则称这些变量之间存在线性组合的关系。这是我们在线性代数课程里面熟知的常识。
对于一组随机变量,尤其是一组时间序列,我们不大可能使它们组合成常数 0,但是可
能使它们组合成均值为 0 的白噪声或者平稳过程,这是可以理解的和自然推知的。考虑若干
个非平稳的尤其是单位根过程 ,如果存在着常数nttt yyy ,,, 21 L nααα ,,, 21 L ,使得
tntntt yyy εααα =+++ L2211 (14.2.2)
其中 ,或者),0(~ 2σε Wt tε 是平稳过程,则称这些时序变量之间存在协稳(Cointegration)
关系。协稳的含义是通过协同作用,非平稳的变平稳了。
Cointegration,或者 Co-Integration,或者 Co-Integrated,有的著作译为协整,有的著作
译为同积,虽都是意译,但都是字面意译。按本质上的意译,译为协稳似乎更为贴切,一听
就知道是什么意思。如果实在要翻译成协整,建议理解为将非平稳序列协同整合成平稳序列
的含义,是整合,而不是整数。
现实的经济变量确实存在协稳关系。根据购买力平衡的理论,在达到长期均衡状态过程
中,汇率调整会消除不同国家之间的购买力差别。设 和 是两个国家之间的价格水平,1p 2p
E是这两个国家之间的汇率,则均衡状态是
C
p
pE
t
t
tt ==
2
1υ (14.2.3)
C是常数。在短期, tυ 不可能恰好是常数,会有一些随机误差,设 tt ευ =ln , tε 是平稳序
列,则有
tttt ppE εβββ +++= 23121 lnlnln (14.2.4)
其中 Cln1 =β , 12 −=β , 13 =β 。这就揭示了价格水平与汇率之间的一个协稳关系。
这个例子可以推广至一般。设有 个经济变量组成一个系统n ),,,( 21 nttt yyy L tY
r= ,其
中每个分量变量都可能是单位根过程,如果这些变量之间存在长期的均衡关系:
0=′+′ tt XY
rrrr βα (14.2.5)
其中向量 tX
r
可以是常数、外生变量、平稳序列或者关于时间的趋势项,则在短期活动中,
系统会偏离平衡:
ttt XY εβα =′+′
rrrr
(14.2.6)
621
其中 tε 是均值为 0 的平稳过程。此时我们称该系统存在协稳关系,系统为协稳系统, tY
r
也
称为协稳过程,参数αr 为协稳向量。
对于同一个系统,协稳关系可能不止一个。但是对于一个含有 个单位根过程的系统,
它的线性无关的协稳向量至多只能有
n
1−n 个。我们称一个系统的线性无关的协稳向量个数
为系统的协稳秩。
例如,我们考虑四个变量:货币需求 、价格水平 、实际收入 、利率m p y r,它们满
足的基本关系是:
εαααα ++++= rypm 3210 (14.2.7)
将它表示为协稳的标准形式得:
εαααα =−−−− rypm 3210 (14.2.8)
我们看到一个协稳向量:
),,,,1( 32101 ααααα −−−−=r (14.2.9)
而在考虑系统的反馈作用时,可以得到另一个关系:
εααα =−−− ypm 110 (14.2.10)
于是我们看到又一个协稳向量:
)0,,,,1( 1102 αααα −−−=r (14.2.11)
并且它们是线性无关的。
我们来分析单位根过程在什么情况下可能实现协稳。
单位根过程是有增长趋势的,可是如果两个单位根过程是协稳的,那么它们的线性组
合变成平稳的,增长趋势没有了。当然,并不是它们的线性组合创造出一个什么新的神秘变
量,其实是在它们组合时消去了某种共同趋势(Common Trends)。我们考虑两个变量的系
统,每个变量带有线性趋势:
tt utbay 1111 ++= (14.2.12)
tt utbay 2222 ++= (14.2.13)
这里 与 都是白噪声。使用向量tu1 tu2 ),1( θα = 将 与 组合起来,得到一个新的变量: ty1 ty2
ttt uutbbaaz 212121 )()( θθθ +++++=
一般情况下 还是非平稳的。只有当tz 21 /bb−=θ 时,才消去了共同趋势, 成为平稳的。
如果在系统里将线性趋势换成随机游走:
tz
622
ttt uwcay 11111 ++= (14.2.14)
ttt uwcay 22222 ++= (14.2.15)
这里 ttt ww ε+= −1 , tε 是白噪声,那么显然只有当两个随机游走过程是相同的时候,
,即趋势是共同趋势时, 与 才能协稳。进一步考虑系统既有线性趋势又有
随机游走过程:
tt ww 21 = ty1 ty2
ttt uwctbay 111111 +++= (14.2.16)
ttt uwctbay 222222 +++= (14.2.17)
那么除非系数 存在线性关系,即它们有精确的共同趋势,否则我们不能实现系
统的协稳。
2121 ,,, ccbb
我们再来考虑协稳过程的三角表示,它是 Phillips 在 1991 年引入的。
假定有两个变量 和 组成的系统: ty tz
ttt uzy += θ (14.2.18)
ttt zz υ+= −1 (14.2.19)
其中 与tu tυ 是白噪声, 是单位根过程, 也是非平稳的。系统可以实现协稳,协稳向量
是
tz ty
),1( θ− ,即
ttt uzy =−θ (14.2.20)
将(14.2.17)表示成
ttz υ=Δ (14.2.21)
由(14.2.16)与(14.2.19)组成的就是最简单的协稳系统的三角表示。
在一般情况下,考虑一个由 维变量n tY
r
组成的协稳系统,它恰好有 个协稳关系,即
有 个线性无关的协稳向量,将它们组成一个
h
h nh× 的矩阵 A′。由线性代数的知识, A′是
行满秩的,我们可以将 A′通过初等行变换变成:
623
)Γ,(
100
010
001
,2,1,
,22,21,2
,12,11,1
′−=
⎟⎟
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜⎜
⎜
⎝
⎛
−−−
−−−
−−−
=′
++
++
++
h
nhhhhh
nhh
nhh
I
A
γγγ
γγγ
γγγ
LL
LOLLLOLL
LL
LL
(14.2.22)
这里 Γ ′是一个 的系数矩阵,gh× hng −= 。
令 表示协稳关系的残差向量: tz
tt YAz
r′= (14.2.23)
因为 是平稳的,所以其均值 存在,记 tz )(1 tzE=∗μ
∗∗ −= 1μtt zz (14.2.24)
将 tY
r
剖分成两部分:
1
1
2
1
×
×
⎟⎟⎠
⎞
⎜⎜⎝
⎛=
g
h
y
y
Y
t
t
t
r
(14.2.25)
则由(14.2.21)有
⎟⎟⎠
⎞
⎜⎜⎝
⎛′−=+ ∗∗
t
t
ht y
y
Iz
2
1
1 )Γ,(μ (14.2.26)
将上式稍加整理得下式,同时注意由于 tY
rΔ 是平稳的,其最后 个向量也是平稳的,于是又
有一式,一起组成了协稳系统的三角表示式:
g
∗∗ ++′−= ttt zyy 121 Γ μ (14.2.27)
tty 222 μδ +=Δ (14.2.28)
这里 )( 22 tyE=δ , t2μ 是平稳过程。
我们再引入协稳系统的误差修正表示式。
简单的情况还是考虑两个变量 和 组成的系统,如(14.2.16)和(14.2.17)。将系
统的第一个方程两边减去 ,同时将第二个方程代入第一个方程:
ty tz
1−ty
)(111 tttttt uzyyy +++−=− −−− υθθ (14.2.29)
即得协稳关系的误差修正表示式:
624
tttt zyy εθ +−−=Δ −− )( 11 (14.2.30)
之所以称为误差修正式,是因为上式表示, 的增量ty tyΔ 主要是由系统在前一时刻的误差
项 )( 11 −− − tt zy θ 修正的,当误差为正,增量就减一点;当误差为负,增量就加一点。注意
(14.2.18),知道系统满足 111 −−− =− ttt uzy θ ,所以误差修正式就是 ttt uy ε+−=Δ −1 ,是
白噪声的叠加,平稳的。
一般情况下协稳过程的误差修正表示有格兰杰(Granger)表示
定理
三点共线定理勾股定理的证明证明勾股定理共线定理面面垂直的性质定理
:
设 tY
r
为n维单位根随机向量, 它的一阶差分 tY
rΔ 有移动平均表示形式:
tt LY εμ rr
r
)(Φ+=Δ (14.2.31)
其中, }{ tεr 为独立同分布, 0)(
rr =tE ε , Ω)( =tD εr , 中的所有元素列绝对可和。
若
∞
=⋅ 0}Φ{ sss
tY
r
中有 个线性独立的协稳关系,则存在h hn× 维矩阵 A,其秩为 ,使得 h
tt YAZ
rr ′= (14.2.32)
为一 维的平稳过程,这里矩阵h A满足条件
0)1(Φ
r=′A (14.2.33)
若将 tY
r
的向量自回归形式为:
tptpttt YPYPYPY εμ r
r
L
rrrr +++++= −−− 2211 (14.2.34)
则存在 维矩阵hn× B , 使得
ABP ′=)1( (14.2.35)
从而可将协稳过程 tY
r
表示成误差修正形式
ttptptt YABYYY εμζζ r
rrrL
rr +′−+Δ++Δ=Δ −+−−− )( 11111 (14.2.36)
其中
)( 21 psss PPP +++−= ++ Lζ , 1,,2,1 −= ps L
式中 )( 1−′− tYAB
rrμ 表达了前一时刻变量滞后的误差修正。注意上述表达中白噪声 tεr 彼此可
以不同。
针对协稳过程的不同表示形式,有不同的参数估计和假设检验方法。
二、协稳过程的参数估计
1、协稳过程参数的最小二乘估计。
若 tY
r
为n维随机向量,各分量之间存在协稳关系,αr 为协稳向量,那么 ttY εα =′
rr , tε
625
是一单变量的平稳过程, 。于是当+∞<)( 2tE ε ∞→T 时,
+∞<⎯→⎯=′ ∑∑
=
−
=
− )()( 2
1
21
1
21
t
P
T
t
t
T
t
t ETYT εεα
rr
(14.2.37)
但若αr 不是协稳向量,那么 tY
rrα′ 还是非平稳过程,上式不能得到满足, 将
趋于无穷。根据以上分析,可知协稳向量
∑
=
− ′T
t
tYT
1
21 )(
rrα
αr 将使 达到最小值。设∑
=
− ′T
t
tYT
1
21 )(
rrα αr 的估计
值为 ,则有 αˆr
∑∑
=
−
=
− ′=′
T
t
t
T
t
t YTYT
1
21
1
21 )(min)ˆ(
rrrr
r αα α (14.2.38)
这样的 称为协稳向量的最小二乘估计,它是个一致估计。 αˆr
一个 维系统的协稳秩至多只有n 1−n ,因此可以设协稳向量αr 有以下形式:
),,,1( 2 nγγα −−=′ Lr (14.2.39)
从目标函数(14.2.36)去掉 1−T 得:
∑∑
==
−−−=′
T
t
ntntt
T
t
t yyyY
1
2
221
1
2 )()( γγα Lrr (14.2.40)
上式可以看作是 对 作回归的误差平方和式,求最小值是一个多元线性回
归,将 视作因变量, 视作自变量,即可得到最小二乘解 。
ty1 ),,2( niyit L=
ty1 ),,2( niyit L= αˆr
但是我们也可以在αr 中将别的分量设为 1,这样得到的最小二乘解αˆr 在样本量有限的情
况下,会有完全不一样的结果。这样有利也有弊。有利的是,如果该系统存在多个协稳关系,
或者说存在多个线性无关的协稳向量,那么不排除用这种方法就能找到它们。尤其是,如果
用这种方法找到的 个协稳向量是线性无关的,那么肯定就是最终结果了。不利的是,
我们可能不好确定究竟哪个结果是符合一致性的估计。下面叙述的最大似然估计,则能够同
时准确地获得全部协稳向量的估计。
1−n
2、协稳过程参数的最大似然估计
最大似然估计需要构造似然函数,要找到含有待估参数的随机变量的分布。以 tY
r
表示
维单位根过程,
n
tY
rΔ 为一阶差分, tY
r
的误差修正形式为
tt
p
i
itit YYY εμ r
rrrr +++Δ=Δ −
−
=
−∑ 11
1
ΠΦ (14.2.41)
其中矩阵 和 都是 维参数矩阵,iΦ Π nn× }{ tεr 为独立同分布的随机向量,且有 0)(
rr =tE ε ,
Ω)( =′iiE εε rr , 0)( =′jiE εε rr , ji ≠ 。
626
矩阵 的秩 等于系统中独立的协稳关系的个数,我们假定系统中至少存在一个协稳
关系,因此 。此时 维矩阵 有分解形式
Π h
11 −≤≤ nh nn× Π
AB ′−=Π (14.2.42)
其中 A和B为列满秩的 维矩阵。 hn×
考虑样本的 pT + 个观察 ),,,( 21 Tpp YYY
r
L
rr
+−+− ,进一步假定 )Ω,0(~ Nεr ,则变量
),,,( 21 TYYY
r
L
rr
在观察 ),,,( 021 YYY pp
r
L
rr
+−+− 给定下的条件分布可以写出,取对数得对数似
然函数为:
∑
=
−
− ′−−−=
T
t
ttk
TTnL
1
1
11 Ω2
1|Ω|ln
2
)2ln(
2
)Ω,Π,,Φ,,Φ( εεπμ rrrL (14.2.43)
其中
1
1
1
ΠΦ −
−
=
− −−Δ−Δ= ∑ tp
i
ititt YYY
rrrrr με (14.2.44)
Ω− ,Π,Φ,,Φ 11 pL 均为未知参数矩阵。Johansen 的算法可以使(14.2.41)取得最大值,他
的算法分为三个步骤。我们叙述他的算法时,再次明确三个参数的含义: 是向量n tY
r
所含
分量的个数,T 是 tY
r
的样本观察数, 是向量自回归的阶数。 p
第一步:计算辅助回归。
因为 tY
r
是 阶自回归关系,所以p tY
rΔ 应该是 1−p 阶自回归关系。我们在第一步估计出
tY
rΔ 的自回归关系。对于 tY
rΔ 的每一个分量 itY
rΔ , ni ,,2,1 L= ,借助于普通最小二乘计算
出它与差分向量 ),,,( 121 +−−− ΔΔΔ pttt YYY
r
L
rr
的回归关系,然后形成下式:
t
p
i
itit uYY ˆˆΨˆ 1
1
1
rrrr ++Δ=Δ ∑−
=
− μ (14.2.45)
这里 是 系数矩阵的估计,iΨˆ nn× tuˆr 是 1×n 的残差向量的估计。同样的,我们再对 1−tY
r
的
每一个分量 1, −tiY
r
,借助于普通最小二乘计算出它与 ),,,( 121 +−−− ΔΔΔ pttt YYY
r
L
rr
的回归关
系, 。然后形成下式: ni ,,2,1 L=
t
p
i
itit vYY ˆˆΘˆ 2
1
1
1
rrrr ++Δ=∑−
=
−− μ (14.2.46)
这里 是 系数矩阵的估计,iΘˆ nn× tvˆr 是 1×n 的残差向量的估计。
第二步:计算典型相关。
利用第一步估计出来的 tuˆ
r 与 tvˆ
r ,构造样本方差和协方差矩阵:
∑
=
′=
T
t
ttvv vvT 1
ˆˆ1Σˆ rr (14.2.47)
627
∑
=
′=
T
t
ttuu uuT 1
ˆˆ1Σˆ rr (14.2.48)
∑
=
′′=
T
t
ttvuuv vuT
Σ
1
ˆˆ1ˆΣˆ rr (14.2.49)
∑
=
′=
T
t
ttvu uvT 1
ˆˆ1Σˆ rr (14.2.50)
将它们组成 的典型相关阵: nn×
1111 ΣˆΣˆΣˆΣˆ −−−− uvuuvuvv (14.2.51)
计算出典型相关阵的特征根并排序为 。如果我们已知系统有 个协稳关
系,那么对数似然函数(14.2.41)的最大值为
nλλλ ˆˆˆ 21 >>> L h
∑
=
∗ −−−−−=
h
i
iuu
TTTnTnL
1
)ˆ1ln(
2
|Σˆ|ln
22
)2ln(
2
λπ (14.2.52)
如果我们只是打算对协稳关系的个数 进行检验,那么到第二步就已足够。如果要计算
参数的最大似然估计,那么可以进行第三步。
h
第三步:计算参数的最大似然估计。
假定对应 的特征向量依次为hλλλ ˆˆˆ 21 >>> L hααα ˆ,,ˆ,ˆ 21 rLrr ,每个特征向量都是 维。
这些特征向量构成了协稳关系矩阵空间的一组基,任何一个协稳向量都是它们的线性组合:
n
hhbbb αααα ˆˆˆ 2211 rLrrr +++= (14.2.53)
Johansen 的算法建议将向量 iαˆr 按照 1ˆˆˆ =′ ivvi Σ αα rr 的要求进行单位化。具体做法是,对
于标准程序计算出来的满足 1=′ ii αα rr 的特征向量,再计算
ivvi
i
i Σ αα
αα rr
rr
ˆ
ˆ
′= (14.2.54)
将它们组成 矩阵hn× Aˆ:
)ˆˆˆ(ˆ 21 hA ααα rLrr= (14.2.55)
则对数似然函数中各参数矩阵或向量的估计如下:
AAuv ′Σ=Π ˆˆˆˆ (14.2.56)
iii ΘˆΠˆΨΦˆ −= (14.2.57)
21 ˆΠˆˆˆ μμμ −= (14.2.58)
∑
=
′−−=
T
t
tttt vuvuT 1
])ˆΠˆˆ)(ˆΠˆˆ[(1Ωˆ (14.2.59)
三、协稳过程与协稳向量的检验
628
一个系统是否存在协稳关系,需要检验;估计出来的协稳向量是否确实能够使系统成
为稳定,也需要检验。假设检验离不开统计量,离不开估计,而协稳向量的估计方法有最小
二乘法与最大似然法,所以对应有不同的检验方法。
1、基于最小二乘估计的协稳过程的检验
先在系统向量 ),,,( 21 ntttt yyyY L
r = 中指定一个变量(不妨是 )为因变量,将其余
变量视为自变量,进行多元线性回归,使误差平方和达到最小:
ty1
min)(
1
2
221 →−−−∑
=
T
t
ntntt yyy γγ L (14.2.60)
这里实际是指定协稳向量αr 形式为 ),,,1( 2 nγγα −−=′ Lr 。得到αˆr 后,计算残差:
ntnttt yyyu γγ ˆˆˆ 221 −−−= L (14.2.61)
如果系统 tY
r
是协稳的,那么残差向量 应该是平稳的。如果 是非平稳的,那么它要么有
非常数的趋势,要么是单位根过程。我们可以先对 作一元线性的趋势项分离:
tuˆ tuˆ
tuˆ
tt btau ε++=ˆ (14.2.62)
并对系数 进行假设检验,b 0:0 =bH 。如果 成立,那么不认为 有非常数的趋势,再
进行单位根检验。设
0H tuˆ
ttt uu ερ += −1ˆˆ (14.2.63)
tε 为正态白噪声。根据(14.1.44)计算 ρ 的估计,
∑∑
=
−
=
−=
T
t
t
T
t
tt uuu
1
2
1
1
1 ˆˆˆρˆ (14.2.64)
以样本值代入,上式计算出来的是统计量 0ρˆ 。单位根的假设检验是 1:0 =ρH 。在 1=ρ 时,
给定初值 ,发生T 个正态伪随机数10 =u tε ,可以得到 序列,从而可以根据上式得到一
个
tu
ρ 的值 iρ 。改变伪随机数的种子,重复 tε → tu → iρ 的过程,可以得到充分多的 iρ 的
值, ,从而得到Ni ,,2,1 L= ρ 的分布。再根据本书作者提出的方法计算出 ρˆ 的分布函数
表,然后根据显著性水平和备择假设,确定 1:0 =ρH 的拒绝域,决定是否接受原假设。
2、基于最小二乘估计的协稳向量的检验
如果是已知向量αr ,需要检验αr 是否为协稳向量,那么可以按照上述办法进行,只是
从计算残差 开始就可以了。 tuˆ
3、基于最大似然估计的协稳过程的检验
假设系统 tY
r
存在h个协稳关系,基于最大似然估计的检验方法考虑误差修正形式
tt
p
i
itit YY