一、投入指标与绩效指标的选取
由于客观上所获取的上市公司和北京市样本数据来源不同,故研究时所使用的变量有所区别。首先,北京市样本只是2004年度末的截面数据,即没有前后时期的比较数据,由于衡量发展能力的资本积累率指标需要有2002年、2003年等若干年的截面数据通过计算才能得到,故在衡量产出时无法研究发展能力。其次,由于北京市统计局提供的样本中没有技术资产指标,故本文在进行北京市样本分析时采用无形资产比率代替技术资产比率。
具体说来,选取的投入指标和绩效指标可用以下框架表示:
自变量(投入):
(1)物质资本投资指标:研发费用投入强度。
(2)人力资本投资指标:技术人员比例。
(3)政府支持力度指标:政府支持度。
因变量(产出):
(1)盈利能力指标:主营业务利润率。
(2)技术创新能力指标:无形资产比率。
二、数据来源及样本的确定
1.北京市样本的数据来源
北京市样本由北京市统计局提供。由于本文的实证检验结果正是基于对以上数据的分析后形成的,不真实的数据必然会导致分析结果的偏差,所以本文必须假定全国经济普查对象所填报的这些数据是真实、客观的。根据我国有关法律的规定,本文的这一假定在很大程度上是成立的。
本文按照引言部分对高新技术企业的界定选取了以下10个行业的企业作为样本,涉及10个行业,共计9509个样本。
2.模型中具体数据计算方法
根据原始资料中的指针代码,本文通过以下计算方法得到各变量的具体数值。其中:
3.北京市样本数据的最终确定将数据做以下筛选处理,得到最终样本数据
首先,选取研发费用投入强度在(0~1)之间的样本(不包括0,但可以包括1)。这样做的目的是剔除主营业务收入为0而使此指针计算无意义的样本以及研发费用投入强度太大的异常值避免模型受到异常值的影响。
其次,在第一步的基础上再选取政府支持度大于零的样本。考虑到高新技术企业是否得到政府的支持可能会有区别,所以在回归分析时应分别考虑。如果不加区别一视同仁,可能会大大降低模型的精确度和真实性,因此,为了方便研究,本文在使用北京市样本进行回归分析时均只考虑有政府支持的样本。
最后,在第二步的基础上再选取主营业务利润率大于零的样本。考虑到主营业务利润率小于或等于零的样本通常是非正常经营的企业,为避免异常值影响模型,故进行此步处理。
三、研究方法
若得到的数据符合实证要求,即样本在30个以上可以视为大样本,此时可进行多元或一元回归分析;否则,只进行简单的统计分析,比如样本均值计算等用来与其他行业横向比较分析。
本文采用SPSS13.0版本统计分析软件进行实证研究,对输出结果进行分析。如各行业样本的指针均值比较、模型的 F检验、变量的 t检验等,最后解释变量及模型是否通过检验的原因。
在进行投入产出的滞后期分析,即某一年的投入究竟在第几年后见效时,假定当某一年的投入与若干年的产出均具有显著的相关关系时,决定系数R2最大的那年与初始投入的那年年数之差即为滞后期,因为此时产出效果最为明显。
在确定最终的回归模型时,本文使用了逐步回归法(stepwise)以消除多重共线性,使用加权最小二乘法(WLS)以消除异方差。同时,检验D。W。值以确保无一阶序列相关性。通过以上方法,可以确保回归方程没有违背基本假定,不需要再进行违背假设的检验即可得到较为精确的回归模型。
按照统计学的一般常识,经济和管理类研究以5%的显著性水平作为模型和变量是否通过检验的标准是比较合理的。但是,我们也经常会看到学术论文中同时也以10%作为标准。本文认为,5%的显著性水平比较严格,10%的显著性水平比较宽松。本文采用的是更为严格的5%的显著性水平作为判断标准。
四、北京市样本的模型假设
根据罗默的R&;D模型,即知识积累(研发费用投入)与产出水平(利润、资本积累等)的函数关系。结合第四章我国高新技术上市公司部分的模型假设依据,本部分可做类似假设:
H1:研发费用投入强度X1与主营业务利润率Y1有显著的正相关关系。
H2:研发费用投入强度X1与无形资产比率Y2有显著的正相关关系。
H3:技术人员比例X2与主营业务利润率Y1有显著的正相关关系。
H4:技术人员比例 X2与无形资产比率 Y2有显著的正相关关系。
H5:政府支持度 X3与主营业务利润率 Y1有显著的正相关关系。
H6:政府支持度X3与无形资产比率Y2有显著的正相关关系。