一、R&D活动布局
1990年代初,全国的R&D中心集中在少数几个省市,北京市作为全国政治、经济、文化的中心,理所当然是R&D活动的中心,天津、上海两个直辖市及老工业基地辽宁省排在第二梯队;R&D活动水平较低的省、自治区有贵州、海南、安徽等。到了1990年代中期,各省、自治区、直辖市R&D活动水平有所提高,表现在每十万人的专利数都有提高,有些省、自治区、直辖市提高幅度大,而有些省、自治区、直辖市提高幅度较小。
每十万人年均专利数的变异系数(CV)由1990年代初的1.657498下降到1990年代中期的1.395859,下降了15.8%,表明中国省域R&D活动水平的相对差异有所缩小。经过几年的发展,北京还是R&D活动的中心,天津和上海居次。辽宁已经开始走下坡路了,位于第三组。辽宁省每十万人的专利数排名从1990年代初的第4位下降到1990年代中期的第5位,到了21世纪初继续下降到第6位。
21世纪初技术活动继续扩散,北京和上海成为了中国的两个R&D活动中心,并且上海的技术活动已经扩散到浙江,浙江从1990年代中期的第6名上升到第4名。广东异军突起,和天津并列第二组,由1990年代的第10名,上升到第3名。随着技术活动向内地扩散,中西部的R&D活动也日趋活跃。广东有可能成为R&D活动的第三中心。
综观各省、自治区、直辖市R&D活动的时空演变,可以作如下几点评论:第一,省际R&D活动水平相对差异在1990~2002年期间有所缩小,每十万人年均专利数的变异系数在20世纪90年代初为1.657498,90年代中期为1.395859,21世纪初为1.26684;第二,各省、自治区、直辖市在这十几年的时间里R&D活动水平都有相当大的提高,这可能和中国的科教兴国战略、FDI以及地方政府加大R&D投入等因素有关;第三,R&D活动在局部区域发生了扩散。如,上海的R&D活动已经扩散到浙江;最明显的是广东省,由20世纪90年代初的第10名上升到21世纪初的第3名,在它的影响下,海南省也由20世纪90年代的第28名上升到21世纪初的第19名。
二、R&D活动的ESDA分析
一方面,由于经济发展、知识发展、开放程度和政府作用等原因,导致各地区R&D活动水平的差异是存在的;另一方面,由于各地之间经贸往来日益频繁,R&D知识以各种有形或者无形的方式溢出,因而R&D空间依赖性有可能存在。所以需要有新的技术来识别这些差异。
安瑟兰(ANSELIN,1995,1999)指出ESDA是一系列空间数据分析方法和技术的集合。具体来说,就是描述数据的空间分布并加以可视化,识别空间数据的异常值(OUTLIER),检测社会现象和经济现象的空间集聚,以及展示数据的空间结构,揭示现象之间的空间相互作用机制。ESDA本质是“数据驱动”,除了传统的直方图、散点图、频率分布表、概括性统计量,还包括全局空间自相关统计量(GLOBAL MORAN'S I、GLOBAL GEARY'S C)、局部空间自相关统计量LISA(G、LOCAL MORAN'S I、LOCAL GEARY'S C)以及 MORAN散点图、散点地图等方法。此外,ESDA与GIS技术相结合,将分析结果以地图可视化的形式表现,不仅增强了分析的视觉效果,而且还可以更好地揭示空间分布规律,分析工具可以采用安瑟兰(ANSELIN)的SPACESTAT、GEODA或者R程序库。
ESDA的核心在于度量事物或现象之间的空间关联程度。ES-DA空间关联分析分为全局和局部两种。其中,全局空间关联分析是通过全局空间自相关统计量的估计,表明事物或现象总体在空间上的平均关联程度。而局部空间关联分析则利用局部空间自相关统计量,进一步揭示事物或现象在局部空间位置上的关联程度及其分布格局。基于ESDA的区域空间差异分析,就是通过全局和局部空间自相关统计量的估计与检验,定量分析区域R&D总体或局部在空间上的差异变化状况。在分析之前,先介绍全局空间自相关和局部空间自相关。
(一)方法
1.全局空间自相关分析
全局空间自相关分析可以衡量区域之间整体上的空间关联与空间差异程度。GLOBAL MORAN'S I统计量是常用的全局空间自相关度量指标,用向量形式表示如下(CLIFF AND ORD,1981):
其中Z是观测值与均值的离差向量,W是行标准化的空间权重矩阵,S0 =∑∑WIJ,对应于所有权重的和,N为地区总数。空间权重矩阵的构造有很多方法,笔者在分析省域、地级市R&D活动差异时拟采用基于共同边界的一阶ROOK权重矩阵,即:区域I与J相邻,则WIJ =1,否则WIJ =0;区域I与其自身不属于邻居关系,即WII=0.
若各地区间为空间正相关,I的数值应当较大;若各地区为空间负相关则较小。具体到R&D的空间依赖性问题上,当R&D的目标区域数据(如每十万人年均专利数)在空间区位上相似的同时也有相似的属性值时,空间模式整体上就显示出正的空间相关性;而当在空间上邻接的目标区域数据不同寻常地具有不相似的属性值时,就呈现为负的空间相关性;零空间自相关性出现在当属性值的分布与区位数据的分布相互独立时。
在MORAN指数的显著性检验中,采用一个标准化的Z统计量来推断。
其中,E(I)是理论上的均值,SD(I)是理论上的标准方差。
最常用的方法是假设变量服从正态分布,在大样本情况下,正态统计量Z值服从标准正态分布,显著性水平可由正态分布表来判断。还有一种检验方法是随机分布检验,假设地域单元的观测值与位置完全无关,观测值以相同概率出现在任何空间位置之上,根据统计学原理可知,正态统计量 Z值渐进地服从标准正态分布,显著性水平也可由正态分布表来判断。
在给定置信水平时,若MORAN'S I显著且正,则表示R&D发展水平较高的区域在空间上集聚,或表示R&D发展水平较低的区域在空间上集聚。值越趋近于1,区域 R&D的总体空间差异越小。反之,若MORAN'S I显著且负,则表明区域与其周边地区的R&D发展水平具有显著的差异。值越趋近于-1,区域R&D的总体空间差异越大。当且仅当MORAN'S I接近期望值-1/(N-1)时,观测值之间才相互独立,服从于空间随机分布。此时,区域R&D差异才能用传统的方法度量。
GLOBAL MORAN'S I统计量只说明区域R&D在空间上的平均差异程度,不反映区域R&D的局部空间差异。为了全面分析区域R&D的局部空间差异,可以采用局部空间自相关度量方法。
2.局部空间自相关分析
笔者采用安瑟兰(ANSELIN,1995,1996)的 MORAN散点图、LOCAL MORAN'S I统计量来分析每个区域与周边地区之间的空间差异程度。
MORAN散点图
MORAN散点图用散点图形式,描述变量Z与其空间滞后(即该观测值周围邻居的加权平均值)向量WZ间的相关关系。该图的横轴对应变量Z,纵轴对应空间滞后向量WZ。它被分为四个象限,分别识别一个地区及其与邻近地区的关系。第一象限(高 -高,记为HH):表示高R&D水平的区域被高R&D水平的其他区域所包围;或者说,该区域R&D水平较高,并且区域R&D的空间差异程度较小;第二象限(低-高,记为LH):表示低R&D水平的区域被高R&D水平的其他区域所包围,意味着该区域R&D水平较低,并且区域R&D的空间差异程度较大;③第三象限(低-低,记为LL):表示低R&D水平的区域被低R&D水平的其他区域包围,或者说该区域的R&D水平较低,并且区域R&D的空间差异程度较小;④第四象限(高-低,记为HL):表示高R&D水平的区域被低R&D水平的其他区域所包围,意味着该区域的R&D水平较高,并且区域R&D的空间差异程度较大。第一象限、第三象限正的空间自相关关系表示相似观测值之间的空间联系,暗示相似值的集聚,而第二象限、第四象限负的空间自相关关系表示不同观测值之间的空间联系,暗示着空间异常(SPATIAL OUTLIERS),如果观测值均匀地分布在四个象限,则表明地区之间不存在空间自相关性。总的来说,用MORAN散点图表示区域R&D的空间差异,缺乏统计含义。
LOCAL MORAN'S II统计量
LOCAL MORAN'S II统计量可以度量区域I与其周围地区R&D在空间上的差异程度及其显著性。它是全局空间自相关统计量GLOBAL MORAN'S I的分解。对第I个区域而言,其形式为:
其中ZI和ZJ是标准化的观测值,WIJ是空间权重。
在给定置信水平下,若II显著>0且ZI >0,则区域I位于HH象限;若II显著>0且ZI<0,则区域I位于LL象限;若II显著<0且ZI>0,则区域I位于HL象限;若II显著<0且ZI <0,则区域I位于LH象限。四个象限的含义与 MORAN散点图中象限的解释相同。II显著性的判断可以采用邦费罗尼(BONFERRONI)标准,即当总的显著性水平设定为P,则每一个区域的显著性应采用P/N来进行判断(ANSELIN,1995)。在GEODA里有一个专门的工具来表示不同区域的显著水平。
(二)R&D的总体空间差异
可以发现从1990年到2002年,中国省际R&D的总体差异主要表现为以下各点:
第一,在5%的显著性水平下,中国省级区域R&D在三个时间段上均存在显著的空间正相关,这说明省际R&D之间存在着空间相互作用。
第二,在1990~2002年期间,随着时间的不断推移,GLOBAL MORAN'S I估计值在三个时间段先减少后增加。这说明省际R&D的总体空间差异在1990年代中期之前是随时间而扩大,之后又开始缩小,大体呈倒“V”型。需要指出的是,该结论针对省级空间尺度而言。
第三,从最后一行和第二列可以看出,MORAN'S I估计值与变异系数的趋势是不一致的。变异系数显示中国省际R&D差异在不断缩小,但是MORAN'S I估计值显示中国省际R&D空间差异先扩大后缩小。变异系数仅仅反映区域R&D的数量差异,与区域的地理位置无关。
区域R&D的总体空间差异有可能掩盖局部空间上差异的变化,因为GLOBAL MORAN'S I估计值只是区域总体在空间上差异的平均值。因此,还需要其他的ESDA方法,如MORAN散点图、LOCAL MORAN'S I统计量以及MORAN散点图等,进一步识别局部空间差异。
(三)R&D的局部空间差异
在5%的显著水平下,P_90_92的局部空间自相关显著的省、自治区、直辖市包括:北京、天津、河北、海南、新疆、青海、云南、四川、陕西、湖南和福建11个。1990年代初,中国R&D活动的地域性极为明显,首先,北京和天津的 R&D水平最高(HH象限),相互之间的差异不大;其次,河北接近北京和天津,但是R&D水平却较低(LH象限),说明北京和天津的R&D并没有向外溢出,可能只有两市之间的相互溢出,正如摩根(MORGAN,2004)指出的那样“很多知识是高度区域化的”;第三,空间差异较小,但 R&D发展水平较低的省、自治区、直辖市(LL象限)主要有:新疆、青海、云南、四川、陕西、湖南和福建。
到了1990年代中期,中国R&D水平有了一些变化。在5%的显著水平下,P_95_97的局部空间自相关显著的省、自治区、直辖市包括:北京、天津、新疆、四川、广西、海南。虽然北京和天津还位于HH象限,但是位于LL象限的省、自治区、直辖市只有:新疆、四川、广西,说明经过几年的发展,青海、云南、陕西、湖南和福建的R&D水平有了提高。海南省还是和1990年代初一样,位于LH象限。到了21世纪初,在5%的显著水平下,P_00_02的局部空间自相关显著的省、自治区、直辖市只有5个。位于LL象限的同样是新疆、四川、广西,天津位于HH象限,海南位于LH象限。
综上所述,20世纪90年代初和21世纪初省级R&D的局部空间差异发生了变化。1990年代初分布在 LL象限的省区市约占23%,到了21世纪初分布在LL象限的省区市占10%,这说明经过十几年的发展,中国省际间R&D水平总体差异在空间上确实有不同程度的减少。因为在5%的显著水平下,每十万人年均专利的局部空间自相关值不显著的省、自治区、直辖市在不断地增多。