二、方法及数据说明
(一)Alkire-Foster方法
多维贫困分析方法借鉴了Alkire和Foster(2011)提出的AF方法。该方法运用两次贫困门槛来识别多维贫困人口,因此又称“双界法”。第一层贫困界限用于识别个体在各维度上是否经受着能力剥夺,表明样本的单维度贫困状况;第二层贫困界限通过对比设定的多维贫困临界值和个体的被剥夺份额大小来判断样本是否经受着多维贫困。
第一步,识别个体的单维度贫困。设定XN, D为一个N×D的矩阵,矩阵元素xij表示个体i 在j指标上的生活水平。随后,定义每个维度的贫困标准值z。当xij< zj时,个体i在j维度就处于贫困状态。用剥夺矩阵g0来表示:=1,否则。矩阵g0总结了个体的单维贫困情况。
第二步,将单维的贫困聚合加总。令w=(w1, w2, …, wd)表示指标权重,其中0< wj< 1并且j 。用ci表示加权剥夺分数,。接着设置多维贫困临界值K,表示个体被认定为多维贫困群体时所需要的最低剥夺分数。用函数ρk来表示多维贫困,如果ci≥k,则将多维贫困识别函数定义为ρk=1;否则,定义多维贫困识别函数ρk=0。ρk为1表示个体i现阶段正经受着多维贫困,ρk为0表示个体i现阶段处于非多维贫困状态。
设定删除矢量矩阵 g0(k)。矩阵元素表示为,如果 ρk= 1,那么;如果ρk=0,那么。此时计算出的ci(k)表示多维剥夺临界值为K时的剥夺得分,,当ρk等于0时,ci(k)也为0。所以,ci(k)也表示多维贫困人口的剥夺得分。
式(1)至式(3)是多维贫困指数的几个计算公式。贫困发生率H的计算如式(1)所示,q 是使用AF 方法识别的多维贫困人口数,n 表示样本人口。式(2)中,A表示平均贫困份额,也就是贫困人口的平均剥夺得分,表示多维剥夺得分。式(3)中,M0代表多维贫困指数(MPI),也是调整后的贫困人口发生率,等于所有人口的剥夺计数与总人口的比值。
(二)PSM倾向得分匹配方法
仅按照家庭是否接受公共转移性支出将流动家庭分为两组衡量转移性支出的作用会出现由选择性偏误引起的结果偏差,因此文章利用倾向得分匹配方法(PSM)消除内生性,估计公共转移性支出对多维贫困的影响。
倾向性得分是指在控制不相关变量的条件下,个体接受干预(公共转移性支出)的条件概率,表示为式(4)。
其中,D表示个体是否接受转移性支出,D=1表示接受,D=0表示未接受。X表示一系列影响家庭获得转移性支出的控制变量。p(x) 倾向得分越高,个体接受干预的概率也就越高。模型中包含的协变量不仅影响倾向得分的正确性,也影响最终的估计效果(Weitzen, 2004)。因此,在选取协变量时,不仅要考虑与公共转移性支出相关的因素,而且需考虑与干预效果相关的因素以降低方差(Brookhart, 2006)。
对于接受公共转移性支出的处理组,我们从未接受的对照组中寻找和它得分值最为接近的一个或多个样本进行匹配,直至所有处理组样本匹配完毕。未匹配的样本会被舍弃,使得原本差异较大的两组数据得到了统计上的平衡,使之近似满足平行趋势。文章采用最邻近匹配方法进行匹配,以倾向值p(xi) 为依据,在控制组中寻找最接近实验组样本个体倾向值的对象,并将两组中的数据配对。匹配后,数据得到近似随机化的分布,若第i个人的倾向性得分为p(xi), Yi1、Yi0分别表示个体在接受公共转移性支出和未接受公共转移性支出情况下的多维贫困,那么公共转移性支出的平均处理效应(ATT)计算方法如下:
(三)数据说明
1.数据来源
文章使用了2016年的中国家庭追踪调查数据(简称CFPS)。该调查是由北京大学中国社会科学调查中心实施的一项大型社会、经济、人口变迁的全国性重大社会科学项目。CFPS调查目前覆盖了全国除港澳台以外的31个省、自治区、直辖市,目标样本规模达到14000多户,调查对象包含家户中的全部家庭成员。问卷分为个人、家庭及社区三个层面,询问了家庭收入、支出以及家庭接受转移支付的情况。
2.指标设定
流动人口多维贫困是本文的研究重点,选择恰当的维度和指标不仅是指数构建的核心,也能更准确地反映流动人口的贫困状况。文章选取收入、医保、健康、教育以及生活状况5个维度、12个指标,按照维度等分权重法方式(每个维度权重占比为0.2)构建了如表1所示的指标体系。
表1 流动人口多维贫困指标
2011年国家公布的官方贫困线为2300元/(人·年)文章以2011年为基期,通过CPI指数进行消胀处理。
文章以流动家庭“上一年度是否收到过政府补助”的问卷回答作为公共转移性支出的代理变量,并将其简记为政府补助。其他控制变量包括个人及家庭层面的特征,参见表2。
表2 PSM方法变量描述