为了评定回归结果的精确性和可信度,有很多统计检验方法可以使用。从几个方面来看这些检验是必需的,第一,检测地区之间的相互作用;第二,检查残差是正态分布的,并且同方差;第三,辨识参数估计值在空间中的不稳定性。两种检验空间自相关依赖性(空间依赖性)的类型:空间滞后依赖和空间误差自相关。
格林菲思(GRIFFITH,1987)把社会现象的地理相互作用称之为“空间自相关”,安瑟兰和贝拉(ANSELIN AND BERA,1998)把空间自相关定义为“THE COINCIDENCE OF VALUE SIMILARITY WITH LOCATIONAL SIMI-LARITY”。当一个随机变量的相似值在一个地方集聚时空间自相关就会出现,而当一个随机变量不相似的值在一个明确的地方集聚时空间负相关就会发生。或者可以这样理解:当相邻地区随机变量的高值或低值在空间上出现集聚倾向时为正的空间自相关,当随机变量的高值(低值)地区被邻近的低值(高值)区域所包围时为负的空间自相关。在社会生活中行政上的边界与功能经济边界的不匹配,可能导致空间度量误差和邻近单元误差之间的空间自相关(MIRON,1984;ANSELIN AND BERA,1998;LESAGE,1997)。因此,像知识溢出、跨地区贸易等经济活动都存在不同程度的空间依赖,在分析时有必要考虑空间依赖对模型的影响。
一、空间自回归(滞后)模型
空间滞后通常被假定是空间自回归过程,可用以下方程表示:
其中,Y是因变量,X是解释变量(自变量),W是空间权重矩阵,β是X的参数向量,λ是空间滞后项WY的参数,μ是白噪音干扰项。一个地区的因变量被假定依赖于其附近的因变量,而不是无法解释的成分。对空间滞后依赖的检验是检查一个地区的残差和来自该地区相邻近地区的因变量之间的关系。检验方法是两个拉格朗日乘数(LAGRANGE MULTIPLIER)检验,即LMLAG和稳健的LMLAG(R-LMLAG),两者的区别是后者只有当空间自相关呈现时才有效。详细的方法细节可查阅安瑟兰(ANSELIN,1988),安瑟兰等人(ANSELIN ET AL。,1996)。
二、空间误差模型(SEM)
空间误差自相关通常被假定为如下形式的残差自回归过程:
其中ε是回归残差向量,W是空间权重矩阵,ρ是自回归参数,ν是白噪音干扰项。一个地区的因变量被假定为依赖于其附近的地区因变量中无法解释或无法预期的成分。对空间自相关进行检验就是检查一个地区的残差和来自该地区相邻近地区的残差之间的关系。同样,也有两个拉格朗日乘数(LAGRANGE MULTIPLIER)检验:LMERR和稳健的LMERR(R-LMERR)。
由于事先无法根据先验经验推断上述两种空间依赖是否在所分析的模型中,或者说,哪种空间依赖更符合所分析的模型,因此有必要寻找一个判别规则。安瑟兰和弗洛拉斯(ANSELIN AND FLORAX,1995)给出了如下判别规则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间自回归模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。此时,采用最小二乘法(OLS)进行回归分析会导致估计值有偏,因此采用极大似然法(ML)来估计,模型模拟数据好坏的判别准则不再主要依靠 R2,而转为下列几个指标:似然值的自然对数(LOG LIKELIHOOD),AKAIKE INFORMATION CRITERION(AIC),SCHWARTZ CRITERION(SC)。似然值的自然对数越大,模型模拟的效果越好;AIC的值越小,模型模拟的效果越好,这个时候比较R方的大小已经不妥了。这几个指标也用来比较标准回归模型(没有考虑空间相互作用时的模型)和SAR、SEM,似然值的自然对数最大的模型最好(有时需要权衡参数估计值的显著水平)。
三、空间杜宾模型(SDM)
模型(4.3)就是安瑟兰(ANSELIN,1988)提出的空间杜宾模型:
模型(4.3)经过整理后,得到:
模型(4.3)的一种无约束的形式如下:
模型(4.3)可以被视为模型(4.5)加了一个约束 β2 =-ρβ1.通常判别SEM模型和SDM模型的零假设H0∶β2 = -ρβ1也称为空间共同要素假设(SPATIAL COMMON FACTOR HYPOTHESIS)。零假设的检验方法有WALD检验和LR检验(似然比检验)。本书将用LR检验:通过没有约束的模型(4.5)和有约束的模型(4.3)的似然值的自然对数(LOG LIKELIHOOD)计算一个似然比,该似然比近似服从χ2分布。