经济新常态下的中国经济增长:路径与机制(中国经济问题丛书;“十一五”国家重点图书出版规划)
上QQ阅读APP看书,第一时间看更新

三、实证策略与数据说明

(一)计量模型的设定

利用计量模型来有效检验金融发展对创新的作用,首先面临两个基本的计量问题:一是由金融发展和创新活动之间的逆向因果关系导致的内生性问题;二是由重要变量的遗漏导致的内生性问题。为了有效解决以上两个问题,在充分借鉴Rajan和Zingales(1998)、Hsu等(2014)等构建的设定固定参照系的固定效应模型的基础上,我们设定计量模型如下:

式(2.1)中,各变量的下标i、k、t分别代表二分位行业、省份和年份。因变量innovationik,t+1是用来测度不同省份的不同二分位行业中创新活动的代理变量,主要是从研发投入、专利存量和专利质量这三个综合角度来进行衡量。重点关注的解释变量包括中国各省份的金融发展指数financedevelopkt和行业外部融资依赖特征指数industrydep,i,下标dep指企业外部融资依赖特征指数。本章的研究逻辑是,金融发展通过作用于外部融资依赖行业的融资需求来影响行业创新活动,因而将financedevelopk,tindustrydep,i的交互项纳入式(2.1)中。

式(2.1)中控制变量集Z中的变量包括企业的工业增加值(valueadded)、企业的出口额与行业销售收入的比值(export)、各行业的工业产值与行业工业总产值的比值(state)、企业的政府补贴总额与行业销售收入的比值(subsidy)。具体说明如下:valueaddedik,t表示不同省份的二分位行业中所有企业工业增加值数额在不同年份的中位数[1],该变量用来控制行业自身规模差异对创新活动的影响。exportik,t表示不同省份的二分位行业中所有企业在不同年份的出口额与行业销售收入比值的中位数,该变量用来控制中国的对外开放以及出口行为对创新活动的影响。stateik,t表示不同省份的二分位行业在不同年份的国有性质的工业产值与行业工业总产值比值的均值,该变量用来控制所有制差异对创新活动的影响。subsidyik,t表示不同省份的二分位行业中所有企业在不同年份的政府补贴总额与行业销售收入比值的中位数,该变量用来控制政府扶持政策差异对创新活动的影响。我们还对省份(province)、年份(year)和二分位行业(industry)进行了控制处理。式(2.1)中,ηprovince×year,t+1表示的是省份虚拟变量和年份虚拟变量的交互项,加入该交互项是为了控制不同省份的创新政策差异冲击、经济发展水平趋势等因素对行业创新活动的影响,加入该交互项还可以在一定程度上解决由遗漏重要变量导致的内生性问题。μindustry表示二分位行业的虚拟变量,该变量用来控制行业自身的差异性因素,比如技术水平、竞争程度、成长空间等因素对创新活动的影响。

(二)内生性问题的讨论与解决

式(2.1)面临的最大问题就是,如何解决由金融发展和创新活动之间的逆向因果关系导致的内生性问题。Robinson(1980)指出,金融发展和创新活动之间可能存在“企业发展导致金融发展”的现象,企业和行业的发展将带来对外部融资需求的增加,引致逐利的金融机构的规模扩张和数量增加,从而导致金融发展。从中国的现实情形来看,由于不同省份之间的经济发展水平、制度完善程度、高技术行业的发展基础存在显著差异,这些差异必然导致位于不同省份的不同行业的外部融资需求存在很大差异,进而造成中国不同省份的金融发展存在较大差异。而且,中国的金融发展背景仍然偏向以银行机构为主导的金融中介发展模式和“条块分割”式的金融利益格局,各省份银行机构的对外融资业务存在明显的地域分割性和不可流动性,即本地的金融机构偏向对本土企业贷款,金融需求引致金融供给的现象可能更为突出。我们在式(2.1)中纳入的交互项ηprovince×year,t+1虽然在一定程度上可以吸收由不同省份之间的经济发展水平、制度完善程度、高技术行业发展基础的差异带来的影响,但是,这未必能很好地解决由金融发展和创新活动之间的逆向因果关系导致的内生性问题。

众多研究表明,金融发展是通过影响那些依赖外部融资的传导渠道来影响行业创新活动的(Rajan和Zingales,1998;Brown等,2012)。在这种情形下,解决思路就在于式(2.1)中专门构造的交互项financedevelopk,t×industrydep,i,其中,industrydep,i并不是反映所有省份的二分位行业外部融资依赖特征的变量,而是将某个特定省份的二分位行业的外部融资依赖特征设定为一个固定的参照系,也就是将这个作为参照系的特定省份的二分位行业外部融资依赖特征信息,作为划分所有省份外部融资依赖特征的统一依据,这就将不同省份的外部融资依赖行业做了外生性的设定,从而能较好地解决二者之间可能存在的内生性问题。此外,式(2.1)中针对各解释变量所做的滞后一期的处理,也可以缓解相应的内生性问题。

接下来,我们介绍作为固定参照系的外部融资依赖行业的选定方法。借鉴Rajan和Zingales(1998)、Hsu等(2014)等文献的基本思路,本章选择我国市场化程度发展最快、政府对市场干预相对较少、金融市场摩擦相对较轻的省份作为基准的固定参照系,来设定各省份中外部融资依赖特征行业的界定与排序。我们对由樊纲和王小鲁等(2011)测算的各省份在1997—2009年的市场化指数进行排名,2009年市场化进程从快到慢的排名依次是浙江(11.8)、江苏(11.54)、上海(10.96)和广东(10.42)。考虑到上海作为世界金融中心的定位,其制造业发展可能相对不够全面。而浙江的经济发展多以中、小、微民营企业为主,因此在一定程度上不具有代表性。江苏是1997—2009年市场化进程进步最快的省份,其市场化指数从1997年的5.25增长到2009年的11.54。有鉴于此,本章拟采用江苏的二分位行业的外部融资依赖特征信息作为各省份二分位行业的固定参照系。

(三)重要变量的定义

1.各省份各行业创新能力的测量与界定

(1)研发投入。

考虑样本数据的现实特征,本章采用在样本观察期内不同省份的二分位行业中所有企业研发投入密集度(企业研发投入额/企业销售额)的全概率形式来表示,即采用各省份的二分位行业中有研发投入的企业占行业所有企业的数量比值,与该类企业研发投入密集度的中位数的乘积来表示。该代理变量不仅包含行业中有研发活动企业的信息,也包含该类企业研发投入密集度差异的信息,因此,相对于使用单个指标信息的代理变量,该变量更能包含行业创新研发活动水平的特征信息。需要注意的是,为了保证作为因变量的各省份的各行业之间的研发投入具有可比性,需要对各省份二分位行业中的研发投入进行合适的去规模化处理,具体的处理方法是采用的形式。其中,表示在除了我们所选定的固定参照系之外的其他省份中各二分位行业在不同年份的研发投入,表示我们所选定的作为固定参照系的二分位行业的研发投入。本章的研究样本需要剔除作为固定参照系的江苏的样本数据,以避免样本选择效应导致的估计偏差问题。

表2-1展示了按照全概率形式所计算的固定参照系(江苏)的行业研发投入活动的特征指数,表2-1最后两列报告的是我们按照中华人民共和国工业和信息化部(简称工信部)发布的国家高新技术产业划分标准(2006)以及江苏省发布的高新技术产业划分标准。可以发现,我们计算所得的作为固定参照系(江苏)的研发投入的行业排序与工信部发布的国家高新技术产业划分标准(2006)以及江苏省发布的高新技术产业划分标准,具有相当程度的一致性,由此说明我们以江苏作为固定参照系具有很大的合理性。

表2-1 固定参照系(江苏)的行业研发投入活动的特征指数

(2)专利存量。

参照既有文献的做法,同时考虑中国的现实情况,本章使用各省份的二分位行业中企业在不同年份的发明专利、实用新型专利和外观设计专利(简称三种专利)的存量来表示行业创新能力。上述三种专利有效存量的计算公式如下:

在式(2.2)中,Inpatstockij,tPracpatstockij,t和Despatstockij,t分别表示位于行业j中的企业i在第t年的发明专利、实用新型专利和外观设计专利的存量,Inpatij,tPracpatij,tDespatij,t分别表示位于行业j中的企业i在第t年的发明专利、实用新型专利和外观设计专利的有效授权量。δ是三种专利的折旧率,取值为15%。Jaffe(1986)、Griliches和Mairesse(1981)的研究均指出了将三种专利的折旧率设定为15%的合理性。此外,需要特别交代的是,我们利用中华人民共和国国家知识产权局(简称国家知识产权局)1985—2013年的企业专利数据和国家统计局1999—2007年规模以上工业企业数据的合并数据库,来计算企业三种专利的存量。这样的做法避免了本章需要对三种专利期初存量进行估算的难题,从而保证了估算结果的合理性。

为了获得各省份不同二分位行业层面的三种专利存量,需要将企业层面的三种专利存量加总得到行业层面的三种专利存量。加总的方式仍然是使用全概率形式,即采用各省份各二分位行业中有三种专利的企业占行业所有企业的数量比值,与有专利活动企业专利存量的中位数的乘积形式来表示。为了保证各省份各二分位行业之间不同类型专利存量具有可比性,需要对各省份各二分位行业中不同类型专利活动进行恰当的去规模化处理,具体的处理方法是采用的形式。其中,表示我们所选定的固定参照系(江苏)的二分位行业的三种专利存量的信息,表示其他省份各二分位行业的三种专利存量信息。

(3)专利质量的测算:专利知识宽度法。

专利知识宽度主要指某项专利所包含知识的复杂程度。专利知识宽度从专利所含知识的复杂性和广泛性角度反映专利质量,有利于克服仅利用专利的数量维度来测度企业创新活动的不足。一方面,专利作为具有重大经济价值的创新知识的重要载体,其所含知识的复杂程度必然影响专利质量。另一方面,专利知识宽度作为反映企业专利价值的一个变量,专利所包含的知识越复杂,模仿和改善该专利产品的难度越大,相关替代产品越少,就越影响企业依靠专利保护制度获得创新产品的垄断力量,进而影响企业绩效。因此,专利知识宽度成为衡量专利质量和创新活动质量的重要指标。最近一些关于技术进步的文献开始注意和强调产业或企业知识库的不同性质和特征对企业专利质量的作用和影响。例如,Nesta和Saviotti(2005)对医药行业的分析发现,企业知识库的多元化(或广度)和连贯性与企业创新质量有着显著的正向关系。

为了测度专利质量,我们使用国家知识产权局企业专利文件中专利分类号的数量信息。依据三种专利的分类,其分类号格式有所不同。在发明专利和实用新型专利中,专利分类号格式一般采取“部大类小类大组小组”的格式,如“A01B01/00”。具体而言,专利分类号的第一个字母取值范围为A-H,以表示8个大部[A部:生活必需(农、轻、医);B部:作业、运输;C部:化学、冶金;D部:纺织、造纸;E部:固定建筑物;F部:机械工程、照明、采暖、武器、爆破;G部:物理;H部:电技术]。第2个至第3个数据表示大类。第4个字母表示小类。大组和小组之间用“/”隔开。在外观设计专利中,专利分类号则为“大类小类”的格式,如“01-00”。

为了充分利用每一种专利分类号的信息,本章定义了专利知识宽度以反映专利质量。我们认为,仅采用专利分类号的数量并不能准确区分一项专利所包含分类号之间的内部差异,而且可能会对专利质量的测度产生偏误。例如,一项专利共有三个分类号:A01B02/00、A01B02/10、A01B02/20,另一项专利也有三个分类号:A01B02/00、A02B13/00、B35D13/20。这两项专利虽然分类号的数量相同,但由于第一项专利只利用了A01B02一个大组的信息,而第二项专利利用了A01B02、A02B13、B35D13三个大组的信息,显然第二项专利所运用的知识宽度要大于第一项专利,其专利质量也更高。因此,为尽量减少这一偏误,本章参照产业集中度的测算思路,采取大组层面的赫芬达尔赫希曼指数(HHI)对其进行加权[2],专利知识宽度(width_hhi)的具体计算方法为:width_hhi=1-∑a2,其中,a表示在专利分类号中,各大组分类所占比重。可以看出,专利知识宽度的值越大,各大组层面的专利分类号之间的差异越大。即专利所运用的知识宽度越大,专利质量越高。

在计算基于专利层面的专利知识宽度后,本章根据“企业年份专利类型”这三个维度将专利层面的专利知识宽度加总到企业层面。其中,加总的专利只包括当年处于有效保护期内的专利(即剔除了申请被驳回、专利主动撤回、未交年费终止、有效期届满等失效专利)。[3]加总方法主要有两种:一是算术平均值,二是中位数。按上述两种方法,加总后的专利知识宽度分别被记为width_hhi_mean、width_hhi_median。表2-2展示了分别采用上述两种方法,根据“企业年份专利类型”加总后的专利知识宽度的描述性统计分析。从中可以看出,在企业层面上,三种专利的知识宽度width _hhi_mean (width _hhi_median)的平均值分别为0.2693(0.2653)、0.1204(0.1042)、0.0001(0.0001)。两种方法衡量的专利知识宽度在整个样本观察期内均呈现逐年上升的趋势。此外,我们仍然按照加总思路,将企业层面三种专利的知识宽度所代表的企业专利质量,加总到各省份二分位行业的三种专利质量上。同样,我们对各省份二分位行业的三种专利质量也采取了类似的去规模化处理。[4]

表2-2 企业层面三种专利的知识宽度的变化趋势

2.金融发展指数的估算

金融发展可被概括为金融中介和金融市场两方面的发展过程。考虑到中国省份面板数据的可得性,及银行主导的金融体系可能带来的低效率的资源分配和垄断竞争格局,本章在以规模指标为主的研究基础上,通过测算中国各省份三个层次的金融发展指标,来分别刻画金融发展规模、金融发展效率及金融业市场化程度。

衡量金融发展规模的代表性指标有麦氏指标和戈氏指标。前者为McKinnon(1973)运用货币[用广义货币(M2)衡量]存量与国内生产总值(GDP)的比重作为指标,衡量一国的经济货币化程度。后者是由Goldsmith(1969)提出的金融相关比率,指某一时点上现存金融资产总额与国民财富之比,用于衡量一国的金融化程度。由于受到中国各省份数据资料的限制,我们无法得到完整的中国各省份的货币存量数据。国内许多研究都采用戈氏指标来度量区域金融发展规模。有鉴于此,对于金融发展深度(DEPTH)指标,本章采用各省份金融机构贷款余额来替代当地金融资产的价值,并以其占GDP的比重来衡量区域金融发展规模。对于金融相关比率(FIR)指标,本章用金融机构存款总额与名义GDP的比值来表示,以进一步考虑存款对金融发展规模的可能影响。

对于金融发展效率,本章采用以下两个方面的细分指标:储蓄投资转化率(FUE)和存贷比(FDE)。资本是实体经济运行的基础,统计上包括固定资产和存货的投资,金融机构融资获取的储蓄只有被转化为资本,进入生产领域运行后才能带来价值的增值。在高储蓄率的前提下,储蓄向投资转化效率的高低体现地区金融创造财富的能力,是金融发展效率的重要方面。因此,本章用资本形成总额[5]与各地区金融机构存款余额的比值来表示储蓄投资转化率。该比值越高,说明转化为资本形成总额的金额越多,地区金融创造财富的能力则越强。考虑中国是银行主导型的金融体系,所以银行贷款对各地区投资的增长的影响最为直接,信贷体系对地区财富创造的作用十分重要。因此我们采用各省份金融机构年末贷款余额与各省份金融机构年末存款余额的比值来反映银行体系(间接融资渠道)的存贷比。

我们使用樊纲等(2011)计算出的各省份在1997—2009年的“金融业的市场化”指数,作为衡量中国不同省份金融业市场化程度(MARKET)的代理指标。进一步地,我们将金融业市场化程度区分为金融业的竞争(COMP)和信贷资金分配的市场化(CREDIT)两个子项目,以观察金融业市场化的不同方面对创新活动可能产生的影响。

3.行业外部融资依赖特征指数的界定

依据Hsu等(2014)的具体做法,我们使用不同省份的二分位行业中所有企业外部融资需求代理变量在不同年份的中位数来表示企业外部融资依赖特征指数(dep),其计算方法为:

其中,企业现金流cashflowijkt的计算方法为:

式(2.3)中,capitalexpendijkt表示企业的资本投资支出,采用的具体估计方法是:capitalexpendijkt=本年固定资产净值-(1-折旧率)×上年固定资产净值,其中,折旧率取10.96%的数值(单豪杰,2008)。rdexpenseijkt表示企业的研发投入。profitijkt表示企业净利润(税后利润)。discountijkt表示企业当年的折旧额。Δinventoryijkt表示企业存货的增加额。receivableijkt表示企业应收账款。payableijkt表示企业应付账款。

表2-3展示了固定参照系(江苏)制造业的外部融资依赖特征指数,从该表中大体可以看出江苏外部融资依赖行业所具有的一般特征。具有垄断性质的烟草制品业的外部融资依赖特征指数最低,劳动密集型产业的外部融资依赖特征指数相对较低,而资本密集型产业的外部融资依赖特征指数相对较高。

表2-3 固定参照系(江苏)制造业的外部融资依赖特征指数

(四)样本数据处理与说明

本章使用的研究样本数据主要来源于三大数据库:一是历年《中国金融年鉴》和《中国统计年鉴》中各省份的金融发展指数。客观来看,我国各省份之间金融发展在各个方面存在的巨大差异为研究我国金融发展对创新活动的影响提供了一个很好的实验环境。二是国家知识产权局发布的1985—2013年所有工业企业的专利数据库。三是国家统计局发布的1999—2007年规模以上工业企业数据库中13~46共34个二分位制造业行业的企业样本数据。之所以剔除6~12的二分位制造业行业的企业样本数据,是因为这些行业均是依赖自然资源禀赋的采矿业相关行业,而很多省份由于缺乏自然资源,并不存在采矿业相关行业,因此,为了保证研究样本的可比性,我们只选用13~46共34个二分位制造业行业的企业样本数据。

对于本章研究所需样本数据的合并和处理步骤需要加以说明的是:一方面,我们利用国家统计局发布的1999—2007年规模以上工业企业数据库所有企业的中文名称作为匹配工具,来对国家知识产权局数据库中的所有样本数据进行匹配。对于部分中文名称存在误差、错漏现象的25000多个样本企业而言,我们通过手工和网上信息查询对之加以处理识别配对,以提高匹配效率和样本的可靠性。另一方面,针对1999—2007年规模以上工业企业数据库的基本特征及存在的一系列问题,既有文献已经做了大量探讨与相应处理。比如,可参见Brandt等(2012;2014)的研究文献,本章对1999—2007年规模以上工业企业数据库样本企业数据的处理,也参考与遵循了相关文献的处理程序。


[1]采用中位数的理由在于,在企业三种专利数量存在极端值的情形下,采用均值显然不能很好地捕捉行业专利活动的有效信息。

[2]专利分类号在小组层面所利用的知识信息基本一致,而在大组及以上层面有显著差异。因此,我们在发明专利和实用新型专利中对大组层面的专利分类号进行加权;而在外观设计专利中,由于仅有“大类小类”这两级分类,因而对整个专利分类号进行加权。

[3]实质上是对企业当年三种专利存量的知识宽度分别进行加总,并不考虑已经失效的专利。

[4]由于外观设计专利中分类号的数量超过90%为1,因而其知识宽度基本为0,其结果可由表2-2验证。因此,从采用专利知识宽度作为专利质量的代理指标来看,外观设计专利质量均较低,且区分度不大,因而下文并未检验金融发展对外观设计专利质量的影响。

[5]资本形成总额是常住单位在一定时期内的固定资本形成总额和存货变动价值之和。