在实证文献中,分析R&D活动的最有影响力的方法是知识生产函数,该函数是由格里利谢斯(GRILICHES,1979)最先提出来的,用来估计和 R&D相关的不同的要素对产出的影响。它使用COBB-DOUGLAS生产函数的框架把一个公司或者地区的创新产出的度量与物质R&D投入、知识存量相联系起来。通常,产出和知识存量之间的正相关被解释为知识溢出。之后,PAKES AND GRILICHES(1984),JAFFE(1989)利用知识生产函数研究了知识溢出的地理范围。奥德里奇和费尔德曼(AUDRETSCH AND FELDMAN,2003)对地理空间中的知识生产和溢出做了一次综合的评价。在本书中,笔者也是在地理空间中研究R&D溢出。研究结果是在GEODA和MATLAB中计算得到的。
一、模型构建
本节讨论R&D活动的区域过程的主要决定要素,采用MORENO ET AL。(2003)的模型。为了评价影响R&D的产出的不同要素的重要性,假定一个地区的R&D投入和有用新知识的产出有一定的关系。尽管很难观察到新知识,但是可以通过专利来代替。通过把知识生产函数作为基本模型,把一个地区的R&D投入和R&D的产出联系起来,知识生产函数是由格里利谢斯(GRILICHES,1979)首先提出来的,5年之后,佩克斯和格里利谢斯(PAKES AND GRILICHES,1984)发展了知识生产函数。我们对知识生产函数做了一点修改,得到如下的基本知识生产函数:
其中I是创新产出,?1,?2分别是RD和Z1的弹性系数,RD是研究与发展的支出,Z1是反映其他额外影响的一个变量向量,E代表一个随机误差项,下标I表示地区单元。
MORENO ET AL。(2003)认为,影响创新过程的额外因素通常是生产要素(劳动力、资本),以及区域内部诸如人力资本、社会与公共资本、网络外部性、集聚经济等。特别地,在考虑创新活动与它的知识密集特性时,一些人倾向于认为隐性知识在创新活动中扮演了主要角色。基于个人亲密接触,特别是面对面相遇的知识溢出用局部水平来研究更容易些。
然而,许多理论和实证的文献(如,COE AND HELPMAN,1995;KELLER,2002;JAFFE ET AL,1993;AUDRETSCH AND FELDMAN,1996)似乎表明一个地区知识的生产不仅依赖于自身研究努力,而且还依赖于整个经济中可获得的知识存量。来自区域之外,对技术活动有决定性作用的因素有很多,如:跨地区的贸易、外商R&D投资、机器与设备的进口、熟练劳动力与最终商品的共同市场等等。此外,“金钱的外部性(PECUNIARY EXTERNALITY)”也可能导致公司在大范围里集聚,由此把公司层次的外部性转变为更高地区层次的外部性。因此,我们可以在模型(4.6)的基础上考虑加进一个额外的变量Z2,用它来反映一个地区产生的知识可能向外溢出,同时帮助其他地区形成知识,调整后的模型如:
基于上述的知识生产函数,笔者在研究中国省域R&D的溢出时,假定一个地区在某个时期新知识的产生和过去一期的R&D努力与一个内在的要素Z′1 =(GDP,SECTER)相关,得到一个修改过的COBB-DOUGLAS知识生产函数:
因变量I用一个地区人均授予专利数来代替,RD是创新活动的投入,用研究与发展的总支出占国内生产总值的比例来代替。在其他潜在相关的内在要素中,需要考虑诸如地区的经济是否富裕和专利倾向等因素对知识生产的影响,专利倾向在地区之间可能是不同的。笔者在选题背景中已经指出工矿企业已经成为我国专利权人的主体,第二产业比第三产业发明更多的专利,而地区的富裕程度也直接影响到研究与发展的投入。为了验证这个事实,笔者在研究中选择人均国内生产总值GDP作为地区的经济财富的经济指标,取第二产业从业人数与第三产业从业人数之比SECTER作为专利倾向。此外,为了检验参数的稳定性,书中将考虑地区虚拟变量的影响。
因为我们是对横截面数据进行估计,所以每个变量都是三年数据的平均值,这是为了平滑掉可能的短暂的影响(特别是专利数和R&D的费用)。为了适当地捕捉R&D的努力和各自的专利,一年的时滞是容许的(BODE,2004;MORENO ET AL。2003)。故笔者取I是2000~2002年人均发明专利的平均值,RD是1996~1998年研究与开发总支出占国内生产总值的份额的平均值,GDP是以1978年为基年的1993~1995年人均国内生产总值的平均值,SECTER是1993~1995年第二产业从业人数与第三产业从业人数之比的平均值。
另外,将要用空间计量学的方法对创新过程中可能产生的外部性进行实证研究,一方面研究周边地区的专利对本地区专利生产的影响,即空间滞后的依赖性;另一方面,研究周边地区的研究努力对本地区产生的溢出(BOTTAZZI,PERI,2003;MORENO ET AL。,2003)。即,下面两个模型:
其中,WLNII,T表示周边地区专利的加权和,如果它的参数估计值为正,表示正的溢出,反之表示负的溢出;WLNRDI,T-1表示周边地区研究努力的加权和,如果它的参数估计值为正,表示周边地区研究努力对本地专利的产出有促进作用,反之则有抑制作用。
二、实证分析
因为没有一条可获得的先验信息来指导确定空间权重矩阵,所以在研究溢出中笔者考察以下几个空间权重矩阵:一个是由DELAU-NAY三角形构成的一阶邻接矩阵,4个基于K个最近邻居的邻接矩阵。K个最近邻居的邻接矩阵是指与地区I地理距离最近的K个地区的权重被赋予1,其他地区的权重则为0,根据这个规则可以定义2、3、4、5个邻居的邻接矩阵。
(一)知识溢出:邻居专利对本地区专利的影响
模型(4.8)最小二乘法估计的结果。在没有引入虚拟变量之前,专利对 R&D支出、GDP的弹性分别是 0.67、0.69,LNSECTER的参数估计值是不显著的。当引入虚拟变量后,专利对R&D支出的弹性降为0.47,LNSECTER的参数估计值在5%的显著水平下变得显著了,模型的拟和度也有所提高,说明模型(A)高估了R&D支出对专利的影响;地区富裕程度和专利倾向的参数估计值都是正的,说明两者都对专利的产出有促进作用;虚拟变量BEIJING是高度显著的,表明北京的创新活动水平很高。下面的分析都是在模型(B)的基础上进行的。
为了核查知识溢出效应,需要检验空间依赖性,即空间滞后依赖或空间误差依赖。笔者从5个空间权重矩阵来检验空间依赖性,即由DELAUNAY三角形构成的一阶邻接矩阵和基于距离的2、3、4、5最近邻居的邻接矩阵。检验结果(在GEODA程序包计算得到的结果)。如果LMLAG显著而LMERR不显著,则用空间滞后模型;如果LMLAG不显著而LMERR显著,则用空间误差模型;如果LMLAG和LMERR在统计上都显著,就由R-LMLAG和R-LMERR的显著性决定空间依赖模型。在 5个空间权重矩阵下所有 LMLAG都比LMERR显著,而且所有的R-LMERR都不显著,因此笔者选择空间滞后模型来研究知识的溢出,即周边地区的专利对本地区专利的影响。
当知识溢出的潜力用同期专利的空间滞后(W_LNI)表示时,显示最佳的空间权重矩阵是基于5个最近邻居的权重矩阵。模型(G)的似然值的自然对数(LOG LIKELIHOOD)最大,AIC值和SC值最小,而且最后一行表明SAR模型的残差没有空间自相关(P值为0.85,高度不显著)。
续表
模型(G)解释了地区的专利总变异的91.96%,模型(B)解释了跨地区的专利总变异的89.67%,说明在分析知识生产中,SAR模型比OLS模型有了明显的改善。模型(G)的点估计表明所有的参数在5%的显著水平下都是显著的,而且除了 LNSECTER(专利倾向)外,其余几个参数均高度显著。R&D支出对地区知识生产有显著的贡献,专利对R&D支出的弹性变为0.49,意味着,在其他条件不变的前提下,R&D支出每增加1%,专利产出多增加0.49%。代表地区经济富裕的GDP的弹性为0.6,说明它对地区知识的生产也是有显著的贡献,R&D活动需要财力上的支持,有些活动还是具有高风险的,没有足够的财力是无法进行下去的。专利倾向的估计值为正,而且在5%的显著水平下是显著的,说明第二产业从业人员比第三产业从业人员生产更多的专利。虚拟变量BEI-JING和模型(B)的估计差不多,同样说明北京创新活动水平很高。此外,代表跨地区的知识溢出的参数W_LNI的估计值(0.22)高度显著且大于0,表明在知识生产中邻近地区的R&D活动对本地R&D活动有重要作用,预示与创新活动水平高的地区相邻的地区在知识生产中受益,这也证实知识溢出是存在的。
如果模型(G)表示的空间滞后模型是正确的,那么残差不应该有空间依赖性存在。SAR模型的残差在所有空间权重矩阵的拉格朗日乘数检验(LAGRANGE MULTIPLIER TEST),所有的P值都是明显不显著的,说明经过空间滞后回归分析后,残差已经没有空间依赖性了。此外,空间自回归移动平均(SPATIAL AUTO-REGRESSIVE AND MOVING AVERAGE,SARMA)模型的拉格朗日乘数检验是高度显著的(P值为0.0073180),预示空间杜宾模型(SDM)可能是存在的。
空间杜宾模型(SDM)的分析,从中可以发现除了参数W_LNRD以外其余的参数在4%的显著水平下都是显著的,甚至有 7个参数是高度显著的;此时,LOG-LIKELIHOOD为22.732365,比模型(C)的LOG-LIKELIHOOD都大很多,而且拟和度有显著的提高,约为0.95,这在横截面分析中是很高的;另外,ρ高度显著且为负,说明与创新活动水平高的地区相邻的地区在知识生产中得不到帮助,没有溢出现象发生,相反有“极化效应”,这和模型(G)的结论相反。通过LR检验分析得到:LR=29.1671,自由度 = 4,P值 = 7.2295 E - 006,SDM模型的 LOG-LIKELIHOOD =22.732365,SEM模型的 LOG-LIKELIHOOD =8.148815.LR高度显著,由此可以拒绝空间共同要素零假设,可以确认SDM模型是比较合适的。但是,SDM模型由于变量增多,需要考虑变量之间的多重共线性的影响,本书采用方差分解的方法来判别。根据BELSLEY等人(1980)和勒萨热(LESAGE,1999)给出的判别准则:方差分解系数大于0.5,表明有一定的线性依赖,如果K(X)>30,πIJ >0.5,就可以确认变量I和J有很强的共线性。可以知道当K(X)=254时,变量W_LNRD和W_BEIJING的方差比例超过0.5,说明这两个变量有很强的共线性,因此SDM模型的结果是有偏的。最后可以知道,模型(G)的自变量之间是没有多重共线性的,结合上面的分析,笔者认为模型(G)表示的空间滞后依赖模型是最佳的。
(二)检验邻居R&D的努力对本地专利生产的影响
上面的分析结果说明来自邻近地区的知识溢出是很重要的,下面笔者研究来自邻近地区R&D的努力(W-LNRD)的影响。结果是OLS分析而来的,第二列显示邻居的研究与发展活动支出的弹性是0.19,在5%的显著水平下是显著的,说明来自邻近地区研究与发展的努力确实对本地知识生产有重要的作用;此外,LM空间依赖性检验表明空间滞后依赖和空间误差依赖都不存在。笔者比较在5个空间权重矩阵下的空间依赖性,检验结果同样表明空间依赖不存在,空间依赖性检验是基于2个最近邻居的权重矩阵。因此,模型的结果在经济上和计量上都是有说服力的。
为了检验创新溢出的衰减效应,可以通过使用一个比2个最近邻居更高阶的权重矩阵的LNRD滞后来分析(BOTTAZZI,PERI,2003;MORENNO ET AL。,2003),因此基于模型(4.10),笔者考虑了2个最近邻居和3个最近邻居的LNRD空间滞后。第三列显示:考虑两个LNRD空间滞后(WD2-LNRD和 WD3-LNRD)后,这两个参数估计值虽然为正数,但是都变得不显著了。据此可以推断:溢出在2个最近邻居的水平下是显著的,但是,在3个最近邻居的水平下就停止了。这进一步说明溢出的地理范围是局部的、有界的,不是无界的。