首页 空间自回归模型及其估计

空间自回归模型及其估计

举报
开通vip

空间自回归模型及其估计空间自回归模型及其估计 3 空间自回归模型及其估计 李序颖 顾 岚 ABSTRACT In this paper we discuss the spatial autoregression models. We can use the models to study the data () from regions which with spatial dependence . We discuss maximum likelihood estimation ML Efor the model and the...

空间自回归模型及其估计
空间自回归模型及其估计 3 空间自回归模型及其估计 李序颖 顾 岚 ABSTRACT In this paper we discuss the spatial autoregression models. We can use the models to study the data () from regions which with spatial dependence . We discuss maximum likelihood estimation ML Efor the model and the methods of test based on ML E. We also give some results of spatial autoregression models for the fifteen cities of Yangtze River Delta . 关键词 : 空间相关 ; 空间自回归模型 ; 极大似然估计 其中 y 是所研究区域的被解释变量 , X 是解释变量 , u 是一 、概述 空间模型的残差 。 一般形式的空间自回归模型可以派 生出其他几种的 在经济问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 研究中 ,处理的数据分为时间序列数据 、 模型 。 () 截面数据以及截面时间序列数据 panel data。应用回归 ρλ当= = 0 时 , 为传统的回归模型 , 它意味着模型 模型研究变量之间的关系时 ,假设模型满足 Gauss- Markov 条件 ,当研究的数据是时间序列时 , 通常会存在序列相 中 ,没有空间特性的影响 。 关 ,针对这类数据的问题可以结合时间序列分析的方法 ρβλ当?0 ,= = 0 时 ,为一阶空间自回归模型 。这个 模 加以处理 ;如果研究的数据为截面数据时 ,若数据是取自 型类似时间序列分析中的一阶自回归模型 , 反映了变 () ( ) 某一时点 或时期的不同区域 或点 ,以下统称区域,如 量在空间上的相关特征 , 即所研究区域的被解释变量如 不同的省份 、市 、县等 ,数据中通常包含区域所处位置的 何受到相邻区域被解释变量的影响 。 特性 ,因此 ,各区域之间的数据也会存在相关 ,这种相关 ρβλ当?0 ,?0 ,= 0 时 ,为混合回归与空间自回归模 性与时间序列的相关对应 ,称为空间相关 。 型 。在这个模型中 ,所研究区域的被解释变量不仅与本 处理空间相关问题与时间序列相关相比 , 其特殊之 区域的解释变量有关 ,还与相邻区域的被解释变量有关 。 处在于序列相关只有时间维一个方向 , 而空间相关的方 ρβλ当= 0 ,?0 ,?0 ,为残差空间自回归模型 。注意 向是多维的 。研究空间相关时 ,基本想法是相邻的区域 到这个模型可以改写为 : 比较“相似”,较远的区域不太“相似”,即假定相邻的区域 ( λ) λ) β ε ( I- Wy = I- WX+ 也即所研究区域的被解n n 有较强的相关 ,距离远的区域相关性较弱 ,因此 ,在研究 ( ) ( ) 释变量 Y不仅与本区域解释变 量 X有关 ,还与相邻过程中 , 涉及空间相邻 、空间加权矩阵等概念 , 张尧庭 ( ) (区域的被解释变量 表现为 WY以 及解释变量 表现为 () 1996对这些问题进行了讨论 。与处理序列相关问题时 ) WX有关 。 类似 ,处理空间相关问题的一种方法是空间自回归模型 , () Cliff 和 Ord 1981对其一般模型 、参数估计和检验技术进 () 二参数估计行了开拓性的工作 , 本文将着重介绍空间自回归模型及 各种空间自回归模型中的空间相关性从形式上看与 其估计问题 ,并给出一个案例 。 时间序列问题中时间方向上的相关非常类似 , 因此人们 ( ) 希望将用于滞后相关和序列相关的最小二乘估计 OLS E二 、模型及参数的极大似然估计 的性质直接用于空间的情形 。然而 ,空间相关具有多方 () 一模型 向的特性 ,因此时间序列分析方法中一些有效的方法不 能直接用于空间模型 。下面分别考察空间自回归模型的 针对截面数据的空间自回归模型的一般形式为 : 最小二乘估计 、极大似然估计 ,以及在极大似然估计时的 ρβ y = Wy + X+ u 1 λε u = W u + ()1 统计检验问题 。 ρλ()A = I - W, B = I - W8 1 2 11 最小二乘估计 于是一般空间自回归模型为 : () 1空间自回归的最小二乘估计 β ε ()A y = X+ u , B u = 9 经典经济计量学中 ,既使模型中存在滞后因变量 ,只 y 的 log 似然函数为 : 要残差项不存在序列相关 , OLS E 仍是一致估计 ,因此 ,尽 n n 1 2 π) σνν(L = - log - log+ log | B | + log | A | - ′22 2σ 2( ) 管估计量的小样本性质受到影响 不再是无偏估计, 但 估计量是一致的 ,仍可用于渐近推断 。 ()10 其中 对于空间自回归模型 , 这个结论不成立 。考虑一阶 空间自回归模型 : νν β) ( β) ()( ′= Ay - XB′B ′Ay - X11 且要求 : ρε () y = Wy + 2式 ερλ中 y 已经中心化 ,是 iid 的残差 ,尽管这个模型相当简 单 ,| I - W| > 0 , | I - W| > 0 1 2 2 没有多少实用性 ,但却包含了存在空间滞后相关变量 时ρλσβ为求参数,,,的 ML E ,通常通过构造集中似然 函对 OLS E 的所有影响 ,因此以它为例不失一般性 。 () 数 concentrated likelihood function,将 - 1 ρ的 OLS E 为 : β ) ( )( = XB′B X′XB′BAy′ - 1ρ)()( 1 ^ = y′y y′y 3 2 L L L σβ) ( β) ()( = Ay - XB′B ′Ay - X12 n式中 y= Wy 为空间滞后相关变量 。 L 2 σρλβ代入似然函数 ,估计和,然后再估计,。 () ()将式 2代入式 3 () 2极大似然估计的渐近协差阵- 1ρρ )ε ()( ^ = + y′y y′4 L L L 在通常的正则条件下 , ML E 是渐近有效的 ,这意味着与在时间序列情形时一样 ,第二项的期望不等于 0 ,因此 C - R 下界 ,以信息阵的逆的形式给出 : 它们达到 OLS E 是有偏的 。OLS E 的一致性依赖于下面的两个条 - 1 2 - 1 (θ) ( ) () θθ[ I ] = - E[ 9LΠ99′] 13件 : θ信息阵的元通过对参数的二阶偏导得到 。将 ML E 的结- 1 ( ) ()Plim[ n yy ′] = Q 5 L L 果代入 ,并对信息阵求逆 ,得到渐近协差阵 。因为这 个- 1 ( ) ()εPlim[ n y′] = 0 6 () L 方阵的维数是 3 + p ,没有解析解 。Anselin 1988给出了 Q 是有限非奇异阵 。 信息阵对应于各参数的子矩阵的结果 : - 2对于第一个条件 ,只要对 W 的结构加以适当限制就 βββσI ′= X′′B X可以满足 。第二个条件在空间情形时不满足。这时 : - 2- 1 βρ ) βσ( I = B X′BWA X 1 - 1 - 1- 1( ) ε( ρ) εε()Plim[ n y′] = Plim[ n ′W I - W] 7 L βλ I = 0 ρ 表式中 W 的存在 ,导致除非= 0 , Plim ?0 。 - 1 2 ) ρρ ( I = tr WA 1 因此 ,对于空间自回归模型 , OLS E 是有偏的 ,而且不- 1 - 1- 1 - 1) ) ( ( B ] + tr[ BWA B ′BWA 1 1 论残差的性质如何 ,都不一致 。- 1- 1- 2β)σβ) ( ( + BWA X′BWA X1 1 () 2残差空间自回归的最小二乘估计- 1 - 1 - 1 ρλ ) ( I = t r[ WB BW′A B ]2 1 残差空间自回归对 OLS E 的影响与时间序列的结果- 1 - 1 + tr[ WWA B ] 2 1 一样 ,参数估计仍是无偏的 ,但不有效 ,因为这时扰动项 - 1 - 1- 1 2) ()λ ( ) λ( ] 14 I = t r WB + tr[ WB W′B 协差阵不是对角阵 。那么能否利用广义最小二乘估计法 2 2 2 ( ) GLS 进行参数的估计 ,如普遍用于残差具有序列相关和 ,可以求得信息阵中的各元素 ,从而得到极大由这个结果 似然估计的渐近协差阵 ,它可用于参数的假设检验 。 异方差性的各种两步 GLS 方法 。 31 基于极大似然估计的假设检验 空间自回归模型中基于前述一阶空间自回归模型 OLS E 有偏 ,而且不论 基于 ML E 的渐近检验方法仍是常 残差的性质如何 ,都不一致的结论 ,对于回归残差存在空 ( ) ( ) ( ) 间自回归结构 , OLS E 不能得到空间自回归参数的一致估 用的 Wald W、似然比 L R和拉格朗日乘子 LM 检验。 计 ,因此 GLS 不适合于空间情形 ,在经典经济计量学中常 在一般空间自回归模型中 , 最关注的问题在于是否存在 ( ρλ) β用的 空间自相关 Cochrane- Orcutt 迭代法也不适合于空间情形 。 H:= 0 或= 0、回归参数是否显著 。 0 21 极大似然估计 对模型参数的检验为 : () 1似然函数 (θ) (θ) H: g = 0 ; H: g ?0 0 1 () Cliff 和 Ord 1981研究了针对空间 AR 模型的 ML 方 这里 g 是 q 维向量 ,在对应于感兴趣参数的位置元为 1 , () 法 。Anselin 1988给出了一般空间模型的 ML E 及其性质 。 ρ其余全为 0 。例如 ,考虑模型中空间自回归参数 的显著 引入符号 性检验 ,对应的约束表为 : 2 否存在空间特性 ,在一般空间自回归模型中 ,我们采用的 ) (ρβλσ) ρ (H : 1 ,0′,,′,′= = 0 0 空间加权矩阵为 W= W= W 。 1 2 Wald 检验 ,要对全模型进行估计 ; LM 检验只需要估 首先构造空间加权矩阵 。我们利用各城市所处的位 计较简单的约束模型 ; 对于 L R 检验 ,需要同时估计约束 置 ,根据相邻与否构造出它们的相邻结构 ,从而得到空间 和无约束模型 。 加权矩阵 ,在空间加权矩阵中 ,相邻的城市对应的元素为 Wald 、L R 和 LM 检验渐近等价 ,在零假设下成立的条 2 χ( ) 1 ,否则为 0 。具体构造城市之间的相邻关系时 ,除了考虑 件下均渐近服从 q, q 对应于约束的个数 。在有限样 本时 ,它们得出不同的值 ,检验统计量的值符合下述不等 有共同边界的城市有相邻关系 ,如上海与苏州 、嘉兴等 , 式 : 还综合考虑了城市的交通联系 ,如上海与南通、舟山与宁 W ?L R ?LM 波的联系 。 这意味着在有限样本时 , Wald 检验比 LM 更易于否定 H。 0 上 南 镇 苏 无 常 南 扬 泰 杭 嘉 湖 宁 绍 舟 表 1除了利用 Wald , L R , LM 统计量对回归模型残差是否具有 海 京 江 州 锡 州 通 州 州 州 兴 州 波 兴 山 空间自回归结构进行检验外 ,还可以利用 Moran I 统计量 上海 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 进行检验 。Moran I 统计量类似于经济计量学模型中的 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 南京Durbin- Watson 检验统计量 。Moran I 统计量为 : 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 镇江 若 W 是标准化的 : 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 苏州 e′We 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 ()无锡15 I = ee′ 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 常州若 W 不是标准化的 : 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 南通 n e′We 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 I = ()扬州16 S ee′ 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 泰州式中 : e 为回归模型 OLS E 的残差 , W : n ×n 矩阵 , S = 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 杭州 ρ w。ij i , j 1 0 0 1 0 0 0 0 0 1 0 1 0 0 0 嘉兴 () Cliff 和 Ord 1981给出了基于最小二乘方法时 ,当残 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 湖州 差服从正态 , I 统计量服从正态分布 , 如果 W 是标准化 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 宁波的 ,则 I 统计量的期望和方差 : 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 绍兴 ( ) ( ) ( )E I= tr PWΠn - k 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 舟山 ( ) ( )V I= [ t r PW PW′ 对这个矩阵进行标准化 ,分别使每一行的和为 1 ,得 2 2 2( ) ( ) ) ( ) ( + tr MW+ tr PW]Πd - E I 到标准空间加权矩阵 W 。 - 1 利用一阶空间自回归模型分别研究两个变量是否具 ( ) P = I - X XX′X′ () () 有空间相关 ,结果为表 1 中的模型 1、2,然后估计两个 ) ( ( ) ()d = n - kn - k + 217 () 变量之间普通的回归模型 ,结果为表 1 中的模型 3,最后 k 为回归模型参数的个数 。 三 、案例 长江三角洲地() () 估计空间自回归模型 ,结果为表 1 中的模型 4, 6。 区作为我国经济最具活力的地区之 由表 2 的估计结果 ,我们可以得到如下结论 : () () () 1模型 1、2估计的结果表明 ,长江三角洲 15 个 一 ,经济发展水平与居民收入水平的关系如何 ,是人们密城市居民人均可支配收入有显著的空间相关 , 反映出邻 ) ( 切关注的问题 。为此 ,我们以人均 GDP 单位 : 元代表经 近城市之间居民收入具有相似性 ,相关程度较高 。但模 ( ) 济发展水平 ,以居民人均可支配收入 单位 : 元代表居民 () ρ型 2中参数的估计值不显著 ,说明人均 GDP 没有显著 (收入水平 ,选择长三角 15 个城市 上海 、杭州 、嘉兴 、湖州 、 的空间相关 。 宁波 、绍兴 、舟山 、南京 、苏州 、无锡、常州 、镇江 、南通 、扬 () () () β2从模型 3, 6的估计结果看 ,参数 均在 1 % 1 ) ( 州 、泰州2001 年的数据 数据来源 : 上海市 、浙江省 、江苏 水平下显著 ,说明地区经济发展水平对居民收入有显著 ) 省 2002 年统计年鉴: β的影响 ,且参数满足 0 <^ < 1 。 1 X :人均 GDP ; Y :居民人均可支配收入 。 为研究 () () 3对于线性回归模型 3,我们利用 Moran I 统计量 城市经济发展水平与居民生活的关系 , 我们 对其残差是否具有空间特性进行检验 ,结果为 : 使用的传统回归模型为 : I = 015760 ββY = + X + u 0 1 p 值为 010015 ,表明残差存在空间相关结构。因此只用普 在这个模型中 ,我们再引入空间滞后项 ,以考察本问题是 () 通线性回归模型3描述是不充分的 ,必须引入空间变量。 表 2 模型估计结果2ββ ρ λ 模 型R01 01605207 () 1Y 一阶空间自回归 014517 ()010262 () 2X 一阶空间自回归 01055807 010034 ()018916 () 3普通回归模型 70061767 01134486 014823 (())010000 010041 () 4一般空间自回归 12321340 01108179 01645397 - 01157552 017920 (((())))016289 010000 010327 018221 () 5混合回归空间自回归 17771390 01112116 01581003 017782 ((()))012379 010000 010002 () 6残差空间自回归 76751470 01100841 01647805 017585 ((()))010000 010000 010001 注 :括号内为参数估计显著性检验统计量的 p 值。 2 () () 的 ,而且极大似然估计基于正态分布的假设与实际情况 4用模型 4拟合得到的 R有明显改进 ,说明居民 收入存在“空间特性”, 这与 Moran I 统计量检验结果一 可能并不相符 , 所以必须有足够的样本量才能使估计及 () 致 。我们注意到 ,在模型 4的估计结果中 ,空间自回归参 推断的结果可靠 。在本文的案例中 ,如能加大样本量预 ρλ期会有更好的效果 。为了加大样本量 ,一种做法是扩大 数显著 ,但残差滞后项参数不显著 。 () ( ) λ 研究区域的范围 ,即除了这 15 个城市以外 ,加入其他邻近 5将模型 4的 剔除 , 得到只考虑一阶空间滞后 () () ρ的城市 ,另一种做法是将数据汇总的区域细分 ,即对 15 个 影响的模型 5;将模型 4的剔除 ,得到只考虑一阶空 () () () 城市按县级汇总数据 ,则样本量将大大增加 。 间残差滞后影响的模型 6。在模型 5和 6中空间参数 2 ρλ() 人类活动是在时空范围进行的 , 因此对于时间序列 和都分别是显著的 ,两个模型的 R都比模型 3有明 () () () 数据中普遍存在的序列相关问题 , 在取自区域的截面数 β显改进 。在模型 5和 6中 ,参数的估计值与模型 31 据中也会存在 。随着我国统计工作的不断深入 ,以时间 的结果相比都略有降低 , 但 p 值都更小 , 这意味着模型 和区域汇总的数据将大量出现 ,而且研究人员将很容易得 () () () 5和 6的估计精度比模型 3更高。 到这些数据 ;其次 ,随着我国统计手段的提高 ,例如将遥感 () () () ( ) 6我们对模型 5和 6作进一步比较 。模型 5和 技术纳入到统计工作中来 ,利用空间相关进行空间估值的 () ρλ6中空间参数和都分别呈现显著 ,这意味着本问题 问题将越来越多。因此 ,研究经济问题中存在空间相关性 ( ) ( ) 中 ,分别利用模型 5或模型 6描述是否存在空间特性 问题的空间自回归模型乃至空间经济计量学模型将逐步 ( ) 时 ,都显示存在显著的一阶空间滞后特征 。但模型 4中 受到人们的重视 ,成为研究工作中的一种重要工具。 () ( ρ同时包括空间滞后 体现为参数和残差空间滞后项 体 λ) 现为参数时 ,空间特性主要由模型中的空间滞后项描 参考文献述 ,而残差空间滞后项的作用就不显著了 。这表明在影 1 ] Anselin , L . 19881 Spatial Econometrics : Methods and 响居民收入的空间变量中 , 邻近地区居民收入的影响起 Models ,Dordrecht Kluwer Academic Publishers1 主要作用 。 2 Cliff ,A. D 1and J1 K1Ord1 19811 Spatial Processes : Models 综合模型的拟合优度以及模型参数均为统计显著的 and Applications ,Pion1 () 要求 ,我们认为模型 5的效果最好 ,即长三角 15 个城市 居民收入水平除了受到当地经济发展水平的影响 , 还受 3 ]张尧庭. 空间统计学简介. 统计教育 ,1996. 1. 4 ]庄大方 、刘明亮 、罗建国. 遥感和空间分析支持下的 到周边城市居民收入水平的影响 ,且这种影响是正向的 , 耕地 、城镇动态变化空间采样方法研究. 统计研究 , 城市人均 GDP 增加 1 元 ,当地居民收入增加约 0111 元 ,而 非普通回归模型估计的约 0113 元。 1999. 10. 作者简介 四 、讨论 李序颖 ,男 ,毕业于中国人民大学统计学系 ,博士 ,上 海交通大学管理科学与工程博士后流动站博士后 , 上海 空间自回归模型使用过程中 ,受到空间相邻关系设计 海运学院教授 。 的影响 ,本文案例中采用的是有相邻边界为主的方法 ,在 顾岚 ,女 ,中国人民大学统计学系教授 ,博导 。 某些时候 , 区域的相关不一定是根据地理上相邻来定义 ()责任编辑 :石庆焱 的 ,不同的相邻关系定义 ,模型会得到不同的估计结论。 由于空间自回归模型的统计推断是基于渐近性质
本文档为【空间自回归模型及其估计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_079973
暂无简介~
格式:doc
大小:53KB
软件:Word
页数:11
分类:生活休闲
上传时间:2017-09-20
浏览量:212