首页 空间自回归模型及其估计

空间自回归模型及其估计

举报
开通vip

空间自回归模型及其估计 空间自回归模型及其估计 3 李序颖 顾 岚 ABSTRACT In this paper we discuss the spatial autoregression models. We can use the models to study the data from regions which with spatial dependence. We discuss maximum likelihood estimation (MLE) for the model and the methods of t...

空间自回归模型及其估计
空间自回归模型及其估计 3 李序颖 顾 岚 ABSTRACT In this paper we discuss the spatial autoregression models. We can use the models to study the data from regions which with spatial dependence. We discuss maximum likelihood estimation (MLE) for the model and the methods of test based on MLE. We also give some results of spatial autoregression models for the fifteen cities of Yangtze River Delta.   关键词 : 空间相关 ; 空间自回归模型 ; 极大似然估计 3 资助项目 :上海市教委科技项目 (合同号 03IK13) 。   一、概述 在经济问题研究中 ,处理的数据分为时间序列数据、 截面数据以及截面时间序列数据 (panel data) 。应用回归 模型研究变量之间的关系时 ,假设模型满足 Gauss-Markov 条件 ,当研究的数据是时间序列时 ,通常会存在序列相 关 ,针对这类数据的问题可以结合时间序列分析的方法 加以处理 ;如果研究的数据为截面数据时 ,若数据是取自 某一时点 (或时期)的不同区域 (或点 ,以下统称区域) ,如 不同的省份、市、县等 ,数据中通常包含区域所处位置的 特性 ,因此 ,各区域之间的数据也会存在相关 ,这种相关 性与时间序列的相关对应 ,称为空间相关。 处理空间相关问题与时间序列相关相比 ,其特殊之 处在于序列相关只有时间维一个方向 ,而空间相关的方 向是多维的。研究空间相关时 ,基本想法是相邻的区域 比较“相似”,较远的区域不太“相似”,即假定相邻的区域 有较强的相关 ,距离远的区域相关性较弱 ,因此 ,在研究 过程中 ,涉及空间相邻、空间加权矩阵等概念 ,张尧庭 (1996)对这些问题进行了讨论。与处理序列相关问题时 类似 ,处理空间相关问题的一种方法是空间自回归模型 , Cliff 和 Ord(1981)对其一般模型、参数估计和检验技术进 行了开拓性的工作 ,本文将着重介绍空间自回归模型及 其估计问题 ,并给出一个案例。   二、模型及参数的极大似然估计 (一)模型 针对截面数据的空间自回归模型的一般形式为 : y = ρW1 y + Xβ+ u u = λW2 u +ε ε~ N (0 ,σ2εIn ) (1) 其中 y 是所研究区域的被解释变量 , X 是解释变量 , u 是 空间模型的残差。 一般形式的空间自回归模型可以派生出其他几种的 模型。 当ρ=λ= 0 时 ,为传统的回归模型 ,它意味着模型 中 ,没有空间特性的影响。 当ρ≠0 ,β=λ= 0 时 ,为一阶空间自回归模型。这个 模型类似时间序列分析中的一阶自回归模型 ,反映了变 量在空间上的相关特征 ,即所研究区域的被解释变量如 何受到相邻区域被解释变量的影响。 当ρ≠0 ,β≠0 ,λ= 0 时 ,为混合回归与空间自回归模 型。在这个模型中 ,所研究区域的被解释变量不仅与本 区域的解释变量有关 ,还与相邻区域的被解释变量有关。 当ρ= 0 ,β≠0 ,λ≠0 ,为残差空间自回归模型。注意 到这个模型可以改写为 : ( In - λW) y = ( In - λW) Xβ+ε 也即所研究区域的被解释变量 ( Y) 不仅与本区域解释变 量 ( X)有关 ,还与相邻区域的被解释变量 (表现为 WY) 以 及解释变量 (表现为 WX)有关。 (二)参数估计 各种空间自回归模型中的空间相关性从形式上看与 时间序列问题中时间方向上的相关非常类似 ,因此人们 希望将用于滞后相关和序列相关的最小二乘估计 ( OLS E) 的性质直接用于空间的情形。然而 ,空间相关具有多方 向的特性 ,因此时间序列分析方法中一些有效的方法不 能直接用于空间模型。下面分别考察空间自回归模型的 最小二乘估计、极大似然估计 ,以及在极大似然估计时的 84   统计研究 Statistical Research                2004 年第 6 期 No. 6   2004 统计检验问题。 11 最小二乘估计 (1)空间自回归的最小二乘估计 经典经济计量学中 ,既使模型中存在滞后因变量 ,只 要残差项不存在序列相关 , OLS E 仍是一致估计 ,因此 ,尽 管估计量的小样本性质受到影响 (不再是无偏估计) ,但 估计量是一致的 ,仍可用于渐近推断。 对于空间自回归模型 ,这个结论不成立。考虑一阶 空间自回归模型 : y = ρWy +ε (2) 式中 y 已经中心化 ,ε是 iid 的残差 ,尽管这个模型相当简 单 ,没有多少实用性 ,但却包含了存在空间滞后相关变量 时对 OLS E 的所有影响 ,因此以它为例不失一般性。 ρ的 OLS E 为 : ρ^ = ( y′L yL ) - 1 y′L y (3) 式中 yL = Wy 为空间滞后相关变量。 将式 (2)代入式 (3) ρ^ = ρ+ ( y′L yL ) - 1 y′Lε (4) 与在时间序列情形时一样 ,第二项的期望不等于 0 ,因此 OLS E是有偏的。OLS E 的一致性依赖于下面的两个条 件 : Plim[ n - 1 ( y′L yL ) ] = Q (5) Plim[ n - 1 ( y′Lε) ] = 0 (6) Q 是有限非奇异阵。 对于第一个条件 ,只要对 W 的结构加以适当限制就 可以满足。第二个条件在空间情形时不满足。这时 : Plim[ n - 1 ( y′Lε) ] = Plim[ n - 1ε′W ( I - ρW) - 1ε] (7) 表式中 W 的存在 ,导致除非ρ= 0 , Plim ≠0。 因此 ,对于空间自回归模型 , OLS E 是有偏的 ,而且不 论残差的性质如何 ,都不一致。 (2)残差空间自回归的最小二乘估计 残差空间自回归对 OLS E 的影响与时间序列的结果 一样 ,参数估计仍是无偏的 ,但不有效 ,因为这时扰动项 协差阵不是对角阵。那么能否利用广义最小二乘估计法 ( GLS)进行参数的估计 ,如普遍用于残差具有序列相关和 异方差性的各种两步 GLS 方法。 基于前述一阶空间自回归模型 OLS E 有偏 ,而且不论 残差的性质如何 ,都不一致的结论 ,对于回归残差存在空 间自回归结构 , OLS E 不能得到空间自回归参数的一致估 计 ,因此 GLS 不适合于空间情形 ,在经典经济计量学中常 用的 Cochrane-Orcutt 迭代法也不适合于空间情形。 21 极大似然估计 (1)似然函数 Cliff 和 Ord (1981) 研究了针对空间 AR 模型的 ML 方 法。Anselin (1988)给出了一般空间模型的 ML E 及其性质。 引入符号 A = I - ρW1 ,  B = I - λW2 (8) 于是一般空间自回归模型为 : Ay = Xβ+ u ,  Bu = ε (9) y 的 log 似然函数为 : L = - n2 log(π) - n 2 logσ 2 + log | B | + log | A | - 1 2σ2ν′ν (10) 其中 ν′ν = ( Ay - Xβ)′B′B ( Ay - Xβ) (11) 且要求 : | I - ρW1 | > 0 ,   | I - λW2 | > 0 为求参数β,ρ,λ,σ2 的 ML E ,通常通过构造集中似然 函数 (concentrated likelihood function) ,将 β = ( X′B′BX) - 1 ( X′B′BAy) σ2 = 1 n ( Ay - Xβ)′B′B ( Ay - Xβ) (12) 代入似然函数 ,估计ρ和λ,然后再估计β,σ2 。 (2)极大似然估计的渐近协差阵 在通常的正则条件下 , ML E 是渐近有效的 ,这意味着 它们达到 C - R 下界 ,以信息阵的逆的形式给出 : [ I (θ) ] - 1 = - E[ 92 LΠ( 9θ9θ′) ] - 1 (13)   信息阵的元通过对参数θ的二阶偏导得到。将 ML E 的结果代入 ,并对信息阵求逆 ,得到渐近协差阵。因为这 个方阵的维数是 3 + p ,没有解析解。Anselin (1988)给出了 信息阵对应于各参数的子矩阵的结果 : Iββ′= X′β′BXσ- 2 Iβρ = ( BX)′BW1 A - 1 Xβσ- 2 Iβλ = 0 Iρρ = tr( W1 A - 1 ) 2 + tr[ ( BW1 A - 1 B - 1 )′( BW1 A - 1 B - 1 ) ] + ( BW1 A - 1 Xβ)′( BW1 A - 1 Xβ)σ- 2 Iρλ = tr[ ( W2 B - 1 )′BW1 A - 1 B - 1 ] + tr[ W2 W1 A - 1 B - 1 ] Iλλ = tr( W2 B - 1 ) 2 + tr[ ( W2 B - 1 )′W2 B - 1 ] (14) 由这个结果 ,可以求得信息阵中的各元素 ,从而得到极大 似然估计的渐近协差阵 ,它可用于参数的假设检验。 31 基于极大似然估计的假设检验 空间自回归模型中基于 ML E 的渐近检验方法仍是常 用的 Wald ( W) 、似然比 ( LR) 和拉格朗日乘子 ( LM) 检验。 在一般空间自回归模型中 ,最关注的问题在于是否存在 空间自相关 ( H0 :ρ= 0 或λ= 0) 、回归参数β是否显著。 对模型参数的检验为 : H0 : g (θ) = 0 ;  H1 : g (θ) ≠0 这里 g 是 q 维向量 ,在对应于感兴趣参数的位置元为 1 , 其余全为 0。例如 ,考虑模型中空间自回归参数ρ的显著 性检验 ,对应的约束表为 : 94李序颖 顾岚 : 空间自回归模型及其估计 H0 : (1 ,0′) (ρ,β′,λ,σ2 )′= ρ = 0 Wald 检验 ,要对全模型进行估计 ; LM 检验只需要估 计较简单的约束模型 ;对于 LR 检验 ,需要同时估计约束 和无约束模型。 Wald、LR 和 LM 检验渐近等价 ,在零假设下成立的条 件下均渐近服从χ2 ( q) , q 对应于约束的个数。在有限样 本时 ,它们得出不同的值 ,检验统计量的值符合下述不等 式 : W ≥LR ≥LM 这意味着在有限样本时 , Wald 检验比 LM 更易于否定 H0 。 除了利用 Wald ,LR ,LM 统计量对回归模型残差是否具有 空间自回归结构进行检验外 ,还可以利用 Moran I 统计量 进行检验。Moran I 统计量类似于经济计量学模型中的 Durbin-Watson 检验统计量。Moran I 统计量为 : 若 W 是 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化的 : I = e′We e′e (15) 若 W 不是标准化的 : I = nS e′We e′e (16) 式中 : e 为回归模型 OLS E 的残差 , W : n ×n 矩阵 , S =ρ i , j wij 。 Cliff 和 Ord (1981) 给出了基于最小二乘方法时 ,当残 差服从正态 , I 统计量服从正态分布 ,如果 W 是标准化 的 ,则 I 统计量的期望和方差 : E( I) = tr( PW)Π( n - k) V ( I) = [ tr( PWPW′) + tr( MW) 2 + ( tr( PW) ) 2 ]Πd - E( I) 2 P = I - X ( X′X) - 1 X′ d = ( n - k) ( n - k + 2) (17) k 为回归模型参数的个数。   三、案例 长江三角洲地区作为我国经济最具活力的地区之 一 ,经济发展水平与居民收入水平的关系如何 ,是人们密 切关注的问题。为此 ,我们以人均 GDP(单位 :元) 代表经 济发展水平 ,以居民人均可支配收入 (单位 :元) 代表居民 收入水平 ,选择长三角 15 个城市 (上海、杭州、嘉兴、湖州、 宁波、绍兴、舟山、南京、苏州、无锡、常州、镇江、南通、扬 州、泰州) 2001 年的数据 (数据来源 :上海市、浙江省、江苏 省 2002 年统计年鉴) : X :人均 GDP ;   Y :居民人均可支配收入。 为研究城市经济发展水平与居民生活的关系 ,我们 使用的传统回归模型为 : Y = β0 +β1 X + u 在这个模型中 ,我们再引入空间滞后项 ,以考察本问题是 否存在空间特性 ,在一般空间自回归模型中 ,我们采用的 空间加权矩阵为 W1 = W2 = W。 首先构造空间加权矩阵。我们利用各城市所处的位 置 ,根据相邻与否构造出它们的相邻结构 ,从而得到空间 加权矩阵 ,在空间加权矩阵中 ,相邻的城市对应的元素为 1 ,否则为 0。具体构造城市之间的相邻关系时 ,除了考虑 有共同边界的城市有相邻关系 ,如上海与苏州、嘉兴等 , 还综合考虑了城市的交通联系 ,如上海与南通、舟山与宁 波的联系。 表 1 上 海 南 京 镇 江 苏 州 无 锡 常 州 南 通 扬 州 泰 州 杭 州 嘉 兴 湖 州 宁 波 绍 兴 舟 山 上海 南京 镇江 苏州 无锡 常州 南通 扬州 泰州 杭州 嘉兴 湖州 宁波 绍兴 舟山 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0   对这个矩阵进行标准化 ,分别使每一行的和为 1 ,得 到标准空间加权矩阵 W。 利用一阶空间自回归模型分别研究两个变量是否具 有空间相关 ,结果为表 1 中的模型 (1) 、(2) ,然后估计两个 变量之间普通的回归模型 ,结果为表 1 中的模型 (3) ,最后 估计空间自回归模型 ,结果为表 1 中的模型 (4)~ (6) 。 由表 2 的估计结果 ,我们可以得到如下结论 : (1)模型 (1) 、(2) 估计的结果表明 ,长江三角洲 15 个 城市居民人均可支配收入有显著的空间相关 ,反映出邻 近城市之间居民收入具有相似性 ,相关程度较高。但模 型 (2)中参数ρ的估计值不显著 ,说明人均 GDP 没有显著 的空间相关。 (2)从模型 (3)~ (6) 的估计结果看 ,参数β1 均在 1 % 水平下显著 ,说明地区经济发展水平对居民收入有显著 的影响 ,且参数满足 0 <β^1 < 1。 (3)对于线性回归模型 (3) ,我们利用 Moran I 统计量 对其残差是否具有空间特性进行检验 ,结果为 : I = 015760 p 值为 010015 ,表明残差存在空间相关结构。因此只用普 通线性回归模型 (3)描述是不充分的 ,必须引入空间变量。 05 统计研究 表 2 模型估计结果 模   型   β0 β1 ρ λ R2 (1) Y 一阶空间自回归 01605207(010262) 014517 (2) X 一阶空间自回归 01055807(018916) 010034 (3) 普通回归模型 70061767(010000) 01134486(010041) 014823 (4) 一般空间自回归 12321340(016289) 01108179(010000) 01645397(010327) - 01157552(018221) 017920 (5) 混合回归空间自回归 17771390(012379) 01112116(010000) 01581003(010002) 017782 (6) 残差空间自回归 76751470(010000) 01100841(010000) 01647805(010001) 017585 注 :括号内为参数估计显著性检验统计量的 p 值。 (4)用模型 (4)拟合得到的 R2 有明显改进 ,说明居民 收入存在“空间特性”,这与 Moran I 统计量检验结果一 致。我们注意到 ,在模型 (4)的估计结果中 ,空间自回归参 数ρ显著 ,但残差滞后项参数λ不显著。 (5)将模型 (4) 的λ剔除 ,得到只考虑一阶空间滞后 影响的模型 (5) ;将模型 (4) 的ρ剔除 ,得到只考虑一阶空 间残差滞后影响的模型 (6) 。在模型 (5)和 (6)中空间参数 ρ和λ都分别是显著的 ,两个模型的 R2 都比模型 (3) 有明 显改进。在模型 (5)和 (6)中 ,参数β1 的估计值与模型 (3) 的结果相比都略有降低 ,但 p 值都更小 ,这意味着模型 (5)和 (6)的估计精度比模型 (3)更高。 (6)我们对模型 (5) 和 (6) 作进一步比较。模型 (5) 和 (6)中空间参数ρ和λ都分别呈现显著 ,这意味着本问题 中 ,分别利用模型 (5) 或模型 (6) 描述是否存在空间特性 时 ,都显示存在显著的一阶空间滞后特征。但模型 (4) 中 同时包括空间滞后 (体现为参数ρ)和残差空间滞后项 (体 现为参数λ)时 ,空间特性主要由模型中的空间滞后项描 述 ,而残差空间滞后项的作用就不显著了。这表明在影 响居民收入的空间变量中 ,邻近地区居民收入的影响起 主要作用。 综合模型的拟合优度以及模型参数均为统计显著的 要求 ,我们认为模型 (5) 的效果最好 ,即长三角 15 个城市 居民收入水平除了受到当地经济发展水平的影响 ,还受 到周边城市居民收入水平的影响 ,且这种影响是正向的 , 城市人均 GDP增加 1 元 ,当地居民收入增加约 0111 元 ,而 非普通回归模型估计的约 0113 元。   四、讨论 空间自回归模型使用过程中 ,受到空间相邻关系 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的影响 ,本文案例中采用的是有相邻边界为主的方法 ,在 某些时候 ,区域的相关不一定是根据地理上相邻来定义 的 ,不同的相邻关系定义 ,模型会得到不同的估计结论。 由于空间自回归模型的统计推断是基于渐近性质 的 ,而且极大似然估计基于正态分布的假设与实际情况 可能并不相符 ,所以必须有足够的样本量才能使估计及 推断的结果可靠。在本文的案例中 ,如能加大样本量预 期会有更好的效果。为了加大样本量 ,一种做法是扩大 研究区域的范围 ,即除了这 15 个城市以外 ,加入其他邻近 的城市 ,另一种做法是将数据汇总的区域细分 ,即对 15 个 城市按县级汇总数据 ,则样本量将大大增加。 人类活动是在时空范围进行的 ,因此对于时间序列 数据中普遍存在的序列相关问题 ,在取自区域的截面数 据中也会存在。随着我国统计工作的不断深入 ,以时间 和区域汇总的数据将大量出现 ,而且研究人员将很容易得 到这些数据 ;其次 ,随着我国统计手段的提高 ,例如将遥感 技术纳入到统计工作中来 ,利用空间相关进行空间估值的 问题将越来越多。因此 ,研究经济问题中存在空间相关性 问题的空间自回归模型乃至空间经济计量学模型将逐步 受到人们的重视 ,成为研究工作中的一种重要工具。 参考文献 [ 1 ] Anselin , L. 19881 Spatial Econometrics : Methods and Models ,Dordrecht Kluwer Academic Publishers1 [ 2 ]Cliff ,A. D1and J1K1Ord1 19811 Spatial Processes : Models and Applications ,Pion1 [ 3 ]张尧庭. 空间统计学简介. 统计教育 ,1996. 1. [ 4 ]庄大方、刘明亮、罗建国. 遥感和空间分析支持下的 耕地、城镇动态变化空间采样方法研究. 统计研究 , 1999. 10. 作者简介 李序颖 ,男 ,毕业于中国人民大学统计学系 ,博士 ,上 海交通大学管理科学与工程博士后流动站博士后 ,上海 海运学院教授。 顾岚 ,女 ,中国人民大学统计学系教授 ,博导。 (责任编辑 :石庆焱) 15李序颖 顾岚 : 空间自回归模型及其估计
本文档为【空间自回归模型及其估计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_675628
暂无简介~
格式:pdf
大小:354KB
软件:PDF阅读器
页数:4
分类:
上传时间:2012-07-14
浏览量:115