首页 计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究

计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究

举报
开通vip

计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究秦雪征庄晨杨汝岱北京大学经济学院工作论文编号:C-2015-0012015年3月1日版权归作者所有1计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究DoesBirthControlPolicyImproveChildren’sQuality?AStudyBasedonRegressionDiscontinuityDesign秦雪征*北京大学经济学院XuezhengQINSchoolofEconomics,PekingUniversity...

计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究
计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 生育提高了人口质量吗?基于断点回归 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 (RDD)的研究秦雪征庄晨杨汝岱北京大学经济学院工作论文编号:C-2015-0012015年3月1日版权归作者所有1计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究DoesBirthControlPolicyImproveChildren’sQuality?AStudyBasedonRegressionDiscontinuityDesign秦雪征*北京大学经济学院XuezhengQINSchoolofEconomics,PekingUniversity庄晨北京大学经济学院CastielChenZHUANGSchoolofEconomics,PekingUniversity杨汝岱北京大学经济学院RudaiYANGSchoolofEconomics,PekingUniversity本文得到国家自然科学基金青年项目(71103009)、教育部哲学社会科学研究重大课 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 (12JZD036)、北京高等学校青年英才计划(YETP0039)和北京大学经济学院科研种子基金的资助。*通讯作者:秦雪征,北京市海淀区北京大学经济学院,邮编:100871。Tel:86-10-6275-7237;Fax:86-10-6275-1460;MobilePhnoe:86-138-1040-5962;Emailaddress:qin.econpku@gmail.com.Correspondingauthor:XuezhengQIN,SchoolofEconomics,PekingUniversity,Beijing,100871.Tel:86-10-6275-7237;Fax:86-10-6275-1460;MobilePhone:86-138-1040-5962;Emailaddress:qin.econpku@gmail.com.2计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究DoesBirthControlPolicyImproveChildren’sQuality?AStudyBasedonRegressionDiscontinuityDesign摘要:人口数量与质量的替代(Quantity-QualityTradeoff)是人力资本理论的重要命题,然而经济学文献中对该命题的实证检验却常常受到家庭生育决策内生性的困扰。我国在1980年前后实施的“一胎化”政策对家庭生育决策具有较强的外生冲击作用,可以被视为影响人口数量的自然实验。本文基于2005年全国1%人口抽样调查数据,选取在“一胎化”政策实施前后出生的样本,利用断点回归设计(RDD)对我国人口数量与质量之间的因果关系进行识别。结果显示:第一,该计划生育政策明显增加了家庭生育独生子女的概率,人口数量的减少显著提高了子女的教育水平;第二,Q-Q替代的作用机制包括经济发展水平、信贷市场的健全程度、性别偏好等几个方面;第三,随着经济发展水平的提高,Q-Q替代关系不再显著,而加强信贷市场建设、培育性别平等意识有利于降低这种替代性。本文的研究对于我国现阶段如何实现人口质量提升与缓解老龄化压力的双重目标有一定的政策含义,并对我国进一步增强落后地区的人力资本投资、崇尚男女平等理念、加强信贷市场建设以及推进教育均等化改革等政策提供了初步的微观理论支持。关键词:人口数量与质量的替代;计划生育;断点回归设计;人力资本JEL分类码:J13,D13,I24Abstract:The“quantity-qualitytradeoff”isanimportanthypothesisinthehumancapitaltheory.However,theexistingstudiesaimingtotestthishypothesisareconstantlychallengedbytheendogeneityoffamilybirthdecisions.China’sOne-childPolicylaunchedaround1980generatesanexternalshocktothisfamilydecision,andcanbeconsideredasa“naturalexperiment”onthesizeofthepopulation.Basedonthe2005inter-census1%populationsurveydata,thispaperselectsasampleofpeoplebornaroundthestartingpointoftheOne-childPolicy,andusestheregressiondiscontinuitydesign(RDD)toidentifythecausalrelationshipbetweenquantityandqualityofthepopulationinChina.Theresultsshowthat:(i)thebirthcontrolpolicysignificantlyincreasesthetendencyofhavingasinglechildamongtheChinesefamilies,andthedecreaseinpopulationsizesignificantlyincreasestheeducationalattainmentamongthechildren;(ii)thedeterminantsoftheQ-Qtradeoffincludethelevelofeconomicdevelopment,creditmarketaccessibilityandchildsexpreference;(iii)theQ-Qtradeoffmaybeamelioratedwiththeeconomicgrowth,thestrengtheningofcreditmarketsandthepromotionofgenderequality.TheaboveresultsmayprovidepolicyimplicationstomeettheagingpopulationchallengeandimprovethehumancapitallevelinChina.Keywords:Quantity-QualityTrade-off;BirthControlPolicy;RegressionDiscontinuityDesign;HumanCapital;JELClassification:J13,D13,I243一、引言近年来,随着我国人口老龄化问题的加剧,关于人口管控政策是否应该全面放松的话题备受热议。国内部分学者主张,继续执行严格的计划生育政策将加重人口老龄化负担,并对我国的经济增长带来负面影响(周俊山和尹银,201;马骁骁,2010)。面对人口老龄化的压力,党中央在十八届三中全会通过的《关于全面深化改革若干重大问题的决定》中提出启动“单独二孩”的政策,标志着我国自20世纪70年代以来的人口政策首次在全国得到放松。然而,国内也有一些学者认为,如果放松当前的人口控制政策,我国经济增长仍将承受较大的“人口负担”,并面临可持续发展问题的挑战(刘永平和陆铭,2008;黄少安和孙涛,2013)。从理论层面上来看,以上两种观点的争论焦点是人口数量与质量之间是否存在权衡取舍的替代关系:如果人口数量的大幅度增长将导致人口质量的下降,那么全面放松人口政策将可能对我国“以人为本”的创新型经济增长模式带来不利影响;反之,如果人口数量与质量之间不存在这样的负相关关系,甚至人口数量的提升还会导致人口质量的改善,那么当前人口政策的放松将很可能会促进我国经济的长期增长。人口数量与质量的替代(Quantity-QualityTradeoff)是经济学和人口学领域长期关注的重要命题。这一命题最早由“人力资本学说”的创始人GaryBecker在BeckerandLewis(1973)中正式提出(Willis(1973)也在同一时期对这一命题有所阐述)。根据经典理论,在父母对子女一视同仁、家庭面临预算约束(budgetconstraint)和信贷市场失灵(creditmarketfailure)这三条假定下,由于家庭资源的稀缺性,子女数量的增多必然意味着父母只能对每个子女进行更少的人力资本投资,从而家庭中子女的数量与质量(人力资本)之间便会存在负向关系。为检验这一理论,文献中往往使用子女的教育水平或健康水平作为人力资本的代表,用实证研究 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 来考察家庭中子女的平均数量与平均质量的关系。大部分文献发现,两者之间确实存在负向关系(Glicketal.,2005;Lietal.,2008;RosenzweigandZhang,2009;HattonandMartin,2010;Liu,2014),但也有一些文献发现两者之间没有显著关系(Blacketal.,2005;ParkandChung,2012)或它们存在正相关关系(Qian,2009;LordanandFrijters,2013)。经验证据与理论预测的背离往往是因为现实条件不符合理论假设。例如,Blacketal.(2005)基于挪威全国人口数据发现,在考虑子女的出生顺序之后,家庭中子女的数量对其教育水平的影响不再显著,并且子女的出生次序与其教育水平存在负相关关系;这表明父母对其子女可能不是“一视同仁”的,父母有可能对部分子女投入了更多的时间与资源,或者说某些子女在家庭中受到了特殊的偏爱(例如父母可能对长子寄予更高期望或对女孩存在性别歧视)。ParkandChung(2012)通过对孟加拉国MHSS数据的实证研究发现,家庭规模对教育水平的负向影响只在前两个子女中显著,而对于第三个及以后的子女不再显著;其原因可能是,当家庭达到一定规模时,预算约束或信贷约束可能不再成为家庭的限制因素,多生育的决策恰恰是父母收入或能力提高的结果,从而那些来自大规模家庭的子女在人力资本积累方面未必低于小规模家庭的子女(事实上,这也说明家庭内部生育决策存在内生性)。Qian(2009)利用CHNS数据对中国农村地区进行的实证研究同样发现了这一现象;其研究表明,家庭中子女数量增加将显著提高长子或长女的入学率,并且在所有子女的性别相同时这一效应更大。LordanandFrijters(2013)则利用秘鲁数据发现,只有在家庭意外生育的情况下,子女的数量与质量(身高)之间才存在负向关系,而在家庭主动生育的情况下,子女数量与质量的关系变为了正向。家庭内部生育决策的内生性是相关实证研究所面临的重要挑战。一方面,子女的数量与质量往往同时受到不可观测因素的影响,例如父母的社会地位或对子女特殊的偏好有可能同时影响子女的数量和质量;另一方面,子女的数量与质量之间还可能存在反向因果关系,即子女质量的提高可能导致父母偏好生育更多的子女。由于内生性的存在,在检验人口数量与质量的关系时,普通最小二乘法(OLS)将导致偏误,因此文献中往往采用工具变量(IV)的方法。国外文献经常选取的IV包括“是否生育双胞胎”(Glicketal.,2005;Lietal.,2008;Angristetal.,2010;HattonandMartin,2010)或“是否实施人口政策”(Qian,2009;ParkandChung,2012;Cameronetal.,2013),因为这些变量一般外生于家庭内部4的生育决策,并且会直接影响家庭规模。然而,由于人口政策只在部分国家得到实施,并且实施力度、时间和范围不同,因此并非所有政策都适合用于IV方法,这使得基于人口政策的研究受到限制,因而“是否生育双胞胎”便成为多数文献的首选IV。然而,该变量作为家庭规模的IV也可能存在问题:一方面,尽管双胞胎的出生会“意外”增大家庭规模,然而基因等不可观测的因素也可能同时对人口质量和双胞胎生育带来影响,从而削弱工具变量的有效性;另一方面,父母后续生育决策和对子女的态度也可能受到双胞胎意外出生的影响而发生改变,比如在我国双胞胎家庭无法享受独生子女家庭奖励或优待,并且同时增加多个子女往往会在短期和长期给家庭带来更大的经济压力,这可能使父母放弃后续的生育计划或对双胞胎子女采取不同的态度。以上两方面问题都对工具变量方法带来了一定的限制。在对该理论命题的检验方面,国内的研究还显得相对不足:一方面,国内文献主要从宏观经济角度探讨人口数量的影响,而忽视了微观层面上的家庭内部生育决策和人力资本投资决策机制;另一方面,多数文献在研究方法上主要局限于描述统计归纳或普通OLS回归,而忽视了家庭规模和生育决策的内生性问题,从而使其结论受到内生性偏误的干扰。当然,无论是国内还是国外文献,相关实证研究在数量和方法上仍相对有限。目前主流的研究方法仍然依赖于对工具变量的使用,而断点回归设计(RegressionDiscontinuityDesign,RDD)作为近年来兴起的计量经济学方法还未被应用于该问题的研究中。RDD的基本思想是,在制度的外生变化环境中寻找合适的驱动变量,使其能够导致人口数量发生“跳跃”,但不直接影响人口质量和其他相关因素,由此便可估算出人口质量的变化在多大程度上是由人口数量的外生变化所引起,即验证了两者的因果关系。相对于传统的IV方法而言,RDD的优势是能够充分利用政策冲击所带来的“跳跃”效应,而对变量本身的外生性要求则较为温和,从而有利于解决家庭生育决策的内生性问题,进而得到对两者因果关系的无偏估计。本文是RDD方法在相关实证研究中的一次尝试。由于我国是一个社会主义人口大国,历史因素和制度特点导致我国的人口控制政策在实施力度上显著大于其他国家,这就为RDD的实现提供了可能性。计划生育政策在全国范围内的实施为研究人口数量与质量的关系提供了很好的自然实验(naturalexperiment)机会,而2005年全国1%人口抽样调查数据则满足了RDD对大样本量的需求。基于此,本文利用我国上世纪80年代开始推行的“一胎化”强制计划生育政策,对“Q-Q替代”这一理论命题进行RDD实证检验。本文的贡献主要集中于以下几个方面:(1)本文首次尝试使用断点回归设计(RDD)方法解决家庭内部生育决策的内生性问题,为相关领域的研究提供了一个示范性的参考;(2)本文对BeckerandLewis(1973)和Willis(1973)提出的人口质量与数量替代的相关前提假设进行了检验,为理解该经典理论提供了更为全面的视角;(3)我们的实证模型基于具有全国代表性的大样本数据,为重新评估我国计划生育政策的实施效果提供了最新的估计结果;(4)我们得到的经验结果还有助于深刻认识我国人力资本的投资与决定机制,为我国当前和未来人口政策的制定提供微观理论基础和政策启示。本文安排如下:第二部分简单介绍我国计划生育政策和“一胎化”政策的背景与制度安排;第三部分介绍本文的研究方法和模型设定;第四部分介绍数据选择及样本描述统计;第五部分汇报实证结果并对结果进行稳健性检验和安慰剂(placebo)检验;第六部分通过分样本回归对经典理论的前提条件进行系统的验证;第七部分总结全文并提出政策建议。二、计划生育与“一胎化”政策计划生育是我国的一项基本国策,也是一个长期以来不断发展的政策。这一人口管控政策自建国以来大体经历了六个阶段。表1是对这六个阶段基本情况的总结。表1建国以来我国计划生育政策的主要历史沿革阶段年份内容文件第一阶段1949-1961计划生育概念提出,引发了关注与争论《避孕及人工流产办法》(1953年8月11日)、《中共中央对卫生部党组关于节制生育问题的报告5的批示》(1955年3月1日)、《关于发展国民经济的第二个五年计划的建议》(1956年9月16日)第二阶段1962-1978计划生育政策提出,计划生育机构成立《关于认真提倡计划生育的指示》(1962年12月18日)、《关于第四个五年国民经济计划纲要》(1970年5月20日)、《关于1975年国民经济计划的报告》(1974年12月29日)、《关于全国计划生育工作汇报会的报告》(1978年2月24日)第三阶段1979-1991计划生育成为国策,“一胎”数量抽紧《中华人民共和国宪法》(1978年3月5日,1982年12月4日)、《关于控制我国人口增长问题致全体共产党员、共青团员的公开信》(1980年9月25日)、《中共中央、国务院关于进一步做好计划生育工作的指示》(1982年2月9日)第四阶段1992-2000计生体制逐步 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 ,组织机构更加健全《中国计划生育工作纲要(1995-2000)》(1995年1月14日)、《关于加强人口与计划生育工作稳定低生育水平的决定》(2000年3月2日)第五阶段2001-2012低生育水平的稳定,人口问题统筹解决《中华人民共和国人口和计划生育法》(2001年12月29日)、《中共中央国务院关于全面加强人口和计划生育工作统筹解决人口问题的决定》(2006年12月17日)第六阶段2013至今计划生育政策放松,“单独二孩”启动《中共中央关于全面深化改革若干重大问题的决定》(2013年11月15日)注:本表中的部分资料转引自杨发祥(2003)和徐剑(2010),阶段划分稍有区别,主要根据“文件”的内容和性质进行划分,有学者也将我国的政治特征总结为“文件政治”(documentalpolitics)。可以看到,我国的人口控制经历了“先松、再紧、又松”的曲折发展过程:前两阶段是计划生育的预备和起步阶段,第三、四阶段是计划生育的加强和深化阶段,而后两阶段则是计划生育的成熟与放宽阶段。人口控制政策的变化将引起独生子女率在政策转折点附近发生“跳跃”:当政策从“先松”转变为“再紧”时,独生子女率有可能发生向上的“跳跃”;而当政策从“再紧”转变为“又松”时,独生子女率可能发生向下的“跳跃”。变量在政策断点附近发生“跳跃”是使用断点回归设计的基础条件,有效的RDD需要独生子女率在断点处发生“足够”的跳跃;而如果政策实施力度不够大*,那么RDD方法将很难得到显著的估计结果。由于大多数国家的人口政策实施力度有限,其政策引发的变化往往不足以被识别,这或许也是目前几乎没有文献使用RDD方法进行相关实证研究的原因之一。从上世纪70年代末开始,计划生育全面转向“一胎化”的强制性生育管制(ZhangandSpencer,1992;Li,1995;杨发祥,2003;徐剑,2010;Cameronetal.,2013)。该政策在半数以上的省份(郭志刚等,2003)†通过法规严格规定我国的城镇居民和国家干部、职工除特殊情况外只能生育一胎,而不少夫妇也自发响应政府号召在生育一个子女后便领取“独生子女光荣证”并不再继续生育。该政策的实施采取了“胡萝卜加大棒”的方式:一方面,“独生子女光荣证”为遵从“一胎化”政策的父母及其子女提供了诸多福利(如住房分配和子女入学的优先权、现金和医疗补贴等);另一方面,对不服从政策的“超生”父母,将收取相当于地方年人均可支配收入的3-10倍的罚金(Banister,1987;Cooneyetal.,1991;LiandCooney,1993)‡。由于“独生子女光荣证”大致在1979年底开始大范围发行,而“超*这将导致只有少部分人成为顺从者(complier),即实施“一胎化”政策后只有少部分人放弃生育多胎而只生育一胎,那么断点前后的独生子女率就不会发生实质性的变化。†实行或基本实行“一胎化”的省份大致是上海、江苏、北京、天津、四川、重庆、辽宁、黑龙江、广东、吉林、山东、江西、湖北、浙江、湖南、安徽、福建和山西。‡1980年前后,各地均陆续开始出现“超生罚款”的相关规定,根据各地经济水平的不同,“超生罚款”也有所差异。然而,对于大多数父母而言,“超生罚款”力度不轻。6生罚款”也在1980年初相继在各个省份推行,考虑到“怀胎十月”的孕期,我们预测1980年10月前后可能会出现一个人口生育的“断点”。上述“一胎化”政策代表了我国计划生育史上的一次重大制度变革:区别于此前相对缓和并以自愿为主的人口政策,它在实施上具有强制性和较高的贯彻力度。考虑到该政策在短时间内对城镇*父母生育决策具有较强的冲击性,我们认为该政策推出后我国城镇人口的独生子女率会发生向上的“跳跃”。为了证实此预测,图1基于2005年全国1%人口抽样调查数据画出了在1980年10月前后出生的人口中独生子女率的变化情况。从图中可以发现,独生子女率在该政策“断点”处的跳跃是比较明显的†。.3.35.4.45.5独生子女率-1-.50.51距离1980年10月的年数月份平均断点前拟合断点后拟合断点前后拟合图1独生子女率在断点前后的跳跃(带宽为1年)注:图中散点表示每个月的独生子女率,通过计算各月出生的样本中独生子女所占比例而得到;图中的三条曲线分别代表对断点前后两个时期的散点和对总样本时期所有散点进行非线性回归所得到的拟合线。三、断点回归设计断点回归设计(RDD)的思想最早由ThistlethwaiteandCampbell(1960)正式提出,但由于当时还缺乏严密的统计证明,加之IV方法在处理内生性的思路和范式上具有更广阔的适用范围,因此在随后的几十年间,RDD方法一直没有得到经济学者的重视。直到上世纪90年代末,随着该方法的理论基础得到进一步发展,大量经济学文献才开始使用RDD方法对变量之间的因果关系进行识别。目前,国外实证研究文献中对这一方法的应用已经有了较大的发展(LeeandLemieux,2010),然而国内的相关文献还非常缺乏(余静文和王春超,2011)。计量经济学文献一般认为,RDD相比其它因果推断策略具有更大优势:一方面,它对变量本身的外生性要求没有那么苛刻,我们只需假定个体无法精确操控(imprecisecontrol)变量指派‡;另一方面,其研究设计更接近随机可控试验,因此估计结果更加可信(Hahnetal.,2001;Lee,2008;LeeandLemieux,2010)。断点回归设计大体可以分为两种类型:确定型断点回归(SharpRD)和模糊型断点回归(FuzzyRD)。对于前者,个体在临界值的一边接受处理效应(treatmenteffect)的概率为0,而在临界值另一边的概率则为1;对于后者,个体在临界值两边接受处理效应的概率均*城市地区基本做到了“一胎化”,而农村地区在贯彻该政策时受到较大阻力,农民往往以非正常办法(如隐瞒户口)抵制该政策的执行。†限于空间,这里只展示带宽为1年的情况。带宽为2-3年时,在图形中同样能看出明显的“断点”。为了体现独生子女率变化趋势的“非线性”特征,这里采取了二次项回归(quadraticregression)。‡在RDD中,我们不需要假定处理(treatment)的分布是随机的,因为其随机分布的性质恰恰产生于个体在断点附近无法精确操控指派(assignment),如果个体能够对指派进行自主操控,则RDD就可能失效。IV方法则要求工具变量只通过关键解释变量影响被解释变量,而这种苛刻的排除限制要求(exclusionrestrictions)则使IV方法的应用受到局限。7在0到1之间,但有所差别。根据上面的讨论,“一胎化”政策只是使独生子女率在断点处(本文指1980年10月)发生一个外生的“跳跃”,而不是完全从0到1的变化,因此应将其视为模糊型的断点回归设计,这也是不少相关文献所使用的类型(AngristandLavy,1999;VanderKlaauw,2002;雷晓燕等,2010;Chenetal.,2013)。指派变量(assignmentvariable)*、处理变量(treatmentvariable)和结果变量(outcomevariable)是模糊型RDD中的三个核心变量。所谓指派变量,简单理解就是将个体“分配”到临界值左边或右边(即处理组与非处理组)的变量,文献中往往用字母X表示,而本文的指派变量就是样本个体的出生月距离断点(定义为1980年10月)的时间†;结果变量,简单来说就是我们重点关注的受影响变量,文献中一般用字母Y表示,在本文中指的是样本个体的人力资本水平(用受教育年限衡量);而处理变量,简单来说就是对结果产生影响的关键变量,文献中一般用字母D表示,本文中即指样本个体是否为独生子女(是独生子女则取1D,否则取0D)。我们可以用一个简单的模型说明个体的独生子女状态(人口数量)与其受教育年限(人口质量)之间的因果关系在RDD中如何进行识别。假定独生子女的受教育水平为1Y,而非独生子女的受教育水平为0Y,则子女的受教育水平Y可以表示为:100101YYDYDYYYD(1)如果我们假定独生子女和非独生子女这两个群体各自内部的个体是同质的,即对于所有ij假定11ijYY且00ijYY(同质性假设),那么两个群体受教育水平的差异可表示为:101010||lim|lim|iixcxcYYEYXEYXEYXEYX(2)如果我们进一步假定两种状态(独生与非独生)下的受教育水平在临界值(记为c)处各自都是连续的,即假定1EYX和0EYX在Xc处是连续的(局域连续性假设),则可以得到00lim|lim|0xcxcEYXEYX。进而根据(1)式和(2)式,子女的受教育水平在临界值(断点)处的“跳跃”可以表示为:lim|lim|lim|lim|xcxcxcxcEYXEYXEDXEDX(3)此时,只要处理变量D发生足够的“跳跃”,即lim|lim|0xcxcEDXEDX,我们即可利用上式对独生子女与非独生子女之间受教育水平的差异(处理效应)进行估计:lim|lim|lim|lim|xcxcxcxcEYXEYXEDXEDX(4)文献中一般将(4)式称为Wald估计量。其中,分母是处理变量的期望值在断点c处发生的“跳跃”(由驱动变量的变化所导致),分子则表示结果变量在断点c处发生的“跳跃”。我们一般选取断点c附近的样本进行估计,相当于进行一个局部试验设计(localexperimentdesign)。可以证明,在异质性假设(10iiiYY)之下,(4)式是对顺从者(complier,指完全按“一胎化”政策进行生育决策的个体,即在“一胎化”政策实施之前打算生育两个或多个子女,但该政策实施后转而只生育一个子女的个体‡)的局部平均处理效应(localaveragetreatmenteffect,LATE)的估计,即:10|complierEYDYD(5)*也有些文献称之为驱动变量(forcing/runningvariable)。†由于数据的出生时间信息仅仅具体到出生月,因此本文中“箱体”(bin)的最小单位是一个月。‡顺从者不包括原本就打算生育独生子女或政策推行后仍生育多个子女的个体。本文认为,样本中不存在“一胎化”政策实施前打算生育一个子女而政策实施后却打算生育多个子女的叛逆者(defier),也即样本是满足单调性(monotonicity)假定的;并且,由于我国的制度特点,顺从者在人群中的比例不低,这就使得结果具有一定的普遍意义。8对于(4)式所涉及的四个期望值,我们可以借助非参数方法中的核密度估计法(kerneldensityestimation)通过单边核回归(one-sidedkernelregression)实现对它们的“点预测”或点估计(pointestimate),从而得到Wald估计量:::/lim|/iiiiiXcxciiXcYKXxhEYXKXxh(6)::/lim|/iiiiiXcxciiXcYKXxhEYXKXxh(7)::/lim|/iiiiiXcxciiXcDKXxhEDXKXxh(8)::/lim|/iiiiiXcxciiXcDKXxhEDXKXxh(9)(6)-(9)式分别从断点两侧对结果变量和处理变量的期望值进行点估计。其中,h表示RDD估计中对断点两边样本的限定范围,即核密度估计中的局部带宽(bandwidth)。文献中有多种方法选择最佳带宽opth,而本文依照ImbensandKalyanaraman(2012),将最小化均方误差(meansquarederror)作为选择最佳带宽的准则。K为内核函数(kernelfunction),文献一般认为,三角内核(trianglekernel)是对局部线性回归进行边界估计的最优选择(FanandGijbels,1996;LeeandLemieux,2010),因而本文将使用三角内核进行基准的非参数估计,同时在稳健性检验中选用矩形内核(rectangularkernel)作为参考。在RDD的框架下,只要其它控制变量(或称为协变量,covariate,记为W)在断点处不发生“跳跃”,我们在获得LATE的一致估计值时便无需控制协变量(LeeandLemieux,2010)。然而,文献中在进行RDD估计时加入协变量主要出于两点考虑:一方面,加入协变量可以对RDD结果的稳健性提供检验,即如果协变量满足连续性条件,那么加入协变量将不会显著改变RDD的估计结果;另一方面,在RDD估计中加入协变量将有助于减少估计值的抽样变异性(samplingvariability),即令估计值更接近“真实”值。本文将参照文献中的传统做法,将不加入协变量的估计结果作为基准结果,而将加入协变量的估计结果作为稳健性检验*。与上述非参数方法相对应,RDD估计也可以通过参数方法实现(ImbensandLemieux,2008;LeeandLemieux,2010)。参数方法实际上就是利用工具变量(IV)的原理,首先基于RDD中的指派变量构造分组指代变量(记为T,如果指派变量将个体分配到断点右边的处理组则1T,否则0T),然后将T作为D的IV,利用传统的两阶段最小二乘法(2SLS)来估计D与Y之间的因果关系。该参数估计可以用以下回归等式刻画†:YDfXc(10)DTgXcu(11)(10)式和(11)式分别为2SLS估计中的二阶段和一阶段回归等式。其中,反映了顺从者的比率;和是截距项;f和g分别是指派变量对处理变量和结果变量的影*在非参数估计中控制协变量的办法是:先用结果变量Y对协变量W进行回归,然后计算预测值Yˆ,再用结果变量减去预测值得到新的结果变量*ˆYYY。根据LeeandLemieux(2010),如果协变量W不受处理变量D的影响(即W在断点处连续),则由协变量W引起的Y的变化不会影响对的一致性估计。然而,如果W在断点处发生“跳跃”,那么RDD的估计结果将发生偏误。据此,我们将在本文第五部分对协变量的连续性进行验证,从而为基准RDD结果提供稳健性检验。†可以证明,在确定型RDD中,0,0,而1。9响函数,可以采用线性和非线性设定;文献中为了缓解X与T和D之间的多重共线性,一般对f和g采用二次型设定;u和则是随机误差项。可以证明,当“工具”T为二值变量时,我们对处理效应的估计等价于:11||||NiiiNiiiTTYYEYcXchEYchXcEDcXchEDchXcTTXX(12)对比(12)与(4)式可以看出,当核密度估计中所选的内核函数为均匀内核(uniformkernel,即对于11u有1/2Ku,否则0Ku)时,我们对处理效应的非参数估计在数值上等价于参数估计。可见,在RDD模型中,参数估计(IV/2SLS估计量)是非参数估计(Wald估计量)的特殊形式,它是利用局部线性回归对非参数点估计的近似估计量(并不一定是最优估计量)。尤其是当核密度估计中的内核函数选取更一般形式的非均匀内核(如已被文献证实能够提供最优边界估计的三角内核)时,参数与非参数估计量在数值上将不再相等。鉴于此,本文将使用非参数方法对RDD模型进行基准估计,并将参数(IV/2SLS)估计结果作为稳健性检验供读者参考。根据文献惯例,稳健性检验是RDD方法中不可或缺的部分。除了上文提到的协变量的连续性以及内核函数的选择以外,RDD的稳健性检验往往还包括改变带宽和断点位置、考察指派变量在断点两侧的密度连续性等。本文将在第五部分报告相关检验的结果。四、数据与统计描述本文所使用的数据来自2005年全国1%人口抽样调查。该调查是在国务院和地方各级政府的领导和组织协调下进行的,国家统计局负责落实相关调查工作并制定具体计划,调查经费由中央和地方政府共同承担,这使数据的样本量和质量获得了较好的保证。该调查的样本以2000年全国人口普查为基础,从中抽取全国1%人口作为调查对象,采取分层次(省级、县级、乡级和社区)、按概率比例、整群随机抽样的方法,最终获取来自全国31个省、自治区和直辖市(除港、澳、台地区外)的1,300多万个样本。本文所使用的数据为总体样本量的五分之一,即从总样本中随机获得的260多万个观测个体。该调查的家庭和个人问卷分别收集受访家庭和受访个体的信息,包括家庭构成和住房情况、人口学特征(出生年月、兄弟姐妹个数等)、社会经济状况以及婚姻、教育、就业、收入、迁移流动等情况。本文首先将研究样本限定在1980年10月前后5年内出生于中国大陆地区的汉族人口*,并在主回归中根据郭志刚等(2003)排除在当时没有普遍推行“一胎化”政策的地区†;其次,由于政策主要针对城镇居民和国家干部、职工,因此本文进一步将样本限定在城市地区并根据职业和行业信息排除了农业从业者样本;最后,为了排除干扰,本文还根据户口所在地、五年前常住地等信息将部分流动人口排除在外,因为我们无法确定这些流动人口的出生地从而无法确认他们在出生时是否受到“一胎化”政策的影响。最终,本文获得30,660个研究样本,其中出生日期距离1980年10月在3年以内的样本有20,174个(它们将被用于带宽为3年的基准模型分析,而其余样本将参与稳健性检验)。表2主要变量的样本描述统计变量定义全样本断点前断点后*这里保留断点前后5年的样本是为了满足稳健性检验的需要。由于在稳健性检验中断点位置的移动会导致带宽范围的相应变化,因此如果仅保留断点前后3年的样本则会导致稳健性检验中所涵盖的数据不足。但是,在主回归中(即以1980年10月为断点),我们将样本限定在断点前后的3年内。†根据郭志刚等(2003),这些地区包括河南、陕西、广西、甘肃、河北、内蒙古、贵州、云南、青海、宁夏、海南、新疆。由于这些地区大都施行“允许二孩或二孩以上”的生育政策,因此不属于本文所研究的范围。在后文的安慰剂检验中,我们将使用这部分被剔除的样本进行“证伪”检验。10eduyear受教育年限(年)12.6712.7812.54*(2.872)(2.954)(2.778)yhat补偿受教育年限(年)12.6912.5912.80*(2.866)(2.954)(2.766)nosibs是否为独生子女(是=1,否=0)0.3870.3330.444*(0.487)(0.471)(0.497)healthy是否健康(是=1,否=0)0.9970.9970.997(0.057)(0.055)(0.059)married是否有配偶(是=1,否=0)0.3840.5510.206*(0.486)(0.497)(0.404)male是否为男性(是=1,否=0)0.5040.5210.487*(0.500)(0.500)(0.500)N样本量20,17410,3979,777注:*表示1980年10月前后的样本均值在10%的置信水平上有显著的区别;括号内为标准差。表2是对带宽为3年的研究样本进行的描述统计,分为总体样本、断点前和断点后出生的样本。其中,主要回归中的结果变量为受访个体的受教育年限*,由问卷所反映的教育程度信息所得,该变量反映了个体的人力资本水平。可以看到,1980年10月以后出生的样本平均受教育年限显著更低(样本均值为12.54年,在统计意义上显著低于1980年10月以前出生的样本均值12.78年)。这与本文选取的样本较为年轻有关(22-28岁),这个年龄段的人有可能会选择工作一段时间以后再重返学校,因而其连续受教育的时间可能相对更短。为了消除该“时间趋势”以及可能的“季节性”(AngristandKrueger,1991)的影响,我们通过线性回归去掉了由年龄和季节性导致的受教育年限的变化和波动。我们将消除了这一时间趋势和季节波动的受教育年限称为“补偿受教育年限”(CompensatedYearsofEducation)。图2以1年带宽为例,选取了1个月为箱体(bin),描绘了在断点前后出生的样本其“补偿受教育年限”的变化趋势。可以看到,在1980年10月,“补偿受教育年限”发生了较大的向上“跳跃”。值得注意的是,“时间趋势”不会对断点处的“跳跃”产生影响,但“季节性”则有可能对“跳跃”产生影响,因此“补偿受教育年限”相比原始受教育年限更能体现“一胎化”的政策冲击,因为一些与季节性相关的潜在干扰因素已经在很大程度上被消除了。相应地,在主要回归中,我们仍然使用原始受教育年限作为结果变量,但是在控制变量中我们将引入年份和季节指示变量,以对时间趋势和季节波动进行控制。12.412.612.81313.2补偿受教育年限-1-.50.51距离1980年10月的年数断点前拟合断点后拟合断点前后拟合*这里实际上是“连续”受正规学校教育的年限,根据最高学历对应年数计算。对于肄业、辍学的样本,我们在计算受教育年限时减去其最高学历阶段对应年限的一半(如大学本科辍学教育年限算为14年)。值得注意的是,我们考量一个变量的连续性并不是看变量的取值是否连续,而是看这个变量随指派变量的变化在每个“箱体”所对应的平均水平上是否连续。11图2样本“补偿受教育年限”在断点前后的变化(带宽为1年)从表2还可以看到,在断点前后,样本独生子女率从33.3%显著提高到44.4%,这在一定程度上说明1980年10月前后“一胎化”政策的效果开始突显。为了检验RDD估计的稳健性,本文还选取省份、性别、是否有配偶和健康评分等变量作为协变量(covariate),因为这些变量可能会对个体的人力资本水平产生直接影响*。其中,省份变量根据《中华人民共和国行政区划代码》(GB/T2260)构造,是否有配偶直接来自调查问卷的婚姻状况信息,而健康评分则是按照雷晓燕等(2010)的方法构造的二值虚拟变量(1表示健康,0表示不健康)。从表2所反映的信息来看,出生在1980年10月之后的子样本配偶比率显著更低(前后期样本概率平均值分别为55.1%和20.6%),反映了结婚概率随年龄而增加的事实;性别比例在1980年10月前后也发生了显著的变化(前后期样本男性概率平均值分别为52.1%和48.7%),其原因可能是“一胎化”政策限制了父母通过弃婴、堕胎等手段对子女性别进行选择的做法†;尽管“教育-健康”交互作用(education-healthgradient)已被大量经济学文献证实(Smith,2004),但本文并未发现健康状况在断点前后的样本中有明显的区别,说明样本个体受教育年限的变化不能被健康状况的变化所解释,这就为RDD估计结果的稳健性提供了间接支持。接下来,本文将使用RDD方法估计个体人力资本水平与其是否为独生子女之间的关系,并对估计结果进行稳健性检验。五、估计结果与稳健性讨论5.1人口数量的外生变化对人口质量(人力资本)的影响前文通过图示展现了独生子女率和补偿受教育年限在断点前后发生跳跃的情况,本节将通过断点回归方法更为严格地估计这一跳跃在多大程度上反映了两者之间的因果关系。根据LeeandLemieux(2010),在标准的RDD中我们不需要加入控制变量(协变量)即可根据(4)式与(6)-(9)式得到一致的LATE估计值,相关结果如表3所示;进一步地,为了控制其他因素对人力资本积累的影响并检验RDD估计的稳健性,我们在表4中给出了加入协变量的RDD估计结果,这些协变量包括年份、季节、省份、性别、健康及婚姻状况,等等;另外,为了检验不同内核函数对非参数估计的影响,我们还在表5中给出了使用矩形内核(rectangularkernel)进行非参数估计得到的RDD估计结果(不加入协变量)。表3关于“一胎化”政策影响的RDD估计结果(不加入协变量)估计量带宽2.4年带宽1年带宽2年带宽3年受教育年限的跳跃0.271***0.393***0.252**0.281***(0.099)(0.153)(0.110)(0.089)独生子女率的跳跃0.048***0.069***0.042**0.056***(0.017)(0.027)(0.019)(0.015)加权LATE5.648**5.676**6.026*5.020***(2.405)(2.591)(3.151)(1.751)是否加入协变量否否否否临界值1980年10月1980年10月1980年10月1980年10月样本量30,66030,66030,66030,660注:***、**和*分别代表在1%、5%和10%水平显著;括号内的标准误差(standarderror)是用bootstrap方法计算得到的;加权LATE(即局部Wald估计)根据非参数方法基于三角内核(trianglekernel)获得;第1列为根据ImbensandKalyanaraman(2012)的方法选取最优带宽后得到的估计结果。表4关于“一胎化”政策影响的RDD估计结果(加入协变量)*本文认为,是否有配偶会对个体的连续受教育年限产生影响,因为本文选取的样本较为年轻,而相应年龄段的连续学业往往可能因婚姻而暂时中断。†事实上,“一胎化”政策不仅对提前避孕的理念和知识进行了大力宣传,还通过完善法律等手段对弃婴等行为进行了限制。12估计量带宽2.4年带宽1年带宽2年带宽3年受教育年限的跳跃0.270**0.271*0.271**0.238**(0.123)(0.153)(0.125)(0.117)独生子女率的跳跃0.060***0.067***0.060***0.055***(0.021)(0.026)(0.021)(0.020)加权LATE4.505**4.023*4.506*4.311*(2.232)(2.372)(2.257)(2.279)是否加入协变量是是是是临界值1980年10月1980年10月1980年10月1980年10月样本量30,66030,66030,66030,660注:本表中的受教育年限是控制协变量后的取值,即先用个体受教育年限对协变量进行多元线性回归,然后从受教育年限中减去该回归预测值得到的残差值;显著性标识、标准误差的计算、加权LATE的计算(内核的选择)、最优带宽的选择均与表3相同。表5关于“一胎化”政策影响的RDD估计结果(基于矩形内核)估计量带宽1.9年带宽1年带宽2年带宽3年受教育年限的跳跃0.301***0.251*0.361***0.330***(0.104)(0.139)(0.099)(0.081)独生子女率的跳跃0.053***0.052**0.067***0.077***(0.018)(0.024)(0.017)(0.014)加权LATE5.634**4.805*5.373***4.277***(2.249)(2.897)(1.669)(1.096)是否加入协变量否否否否临界值1980年10月1980年10月1980年10月1980年10月样本量30,66030,66030,66030,660注:本表进行非参数估计时选取的内核为矩形内核(rectangularkernel);显著性标识、标准误差的计算、最优带宽的选择、协变量的选择(不加入协变量)均与表3相同。可以看到,表4、表5与表3的估计结果没有显著区别:“一胎化”政策的推出使样本独生子女率在短时间内迅速提高,提高幅度为5%左右(即Wald估计量的分母);而出生在该断点两侧的样本在2005年时所具有的教育水平(以平均受教育年限衡量)同时显示了向上的跳跃,其提高幅度为0.3年左右(即Wald估计量的分子)。另外,尽管各个带宽(包括最优带宽以及1、2、3年带宽的情况)所对应的估计结果稍有区别,但它们之间的差别不大,并且估计值都具有统计显著性,这也进一步说明了RDD估计结果的稳健性。根据(3)式所示的局部Wald估计方法,我们可以得到“成为独生子女”对“受教育年限”的影响,即在顺从者中“一胎化”政策对个体人力资本水平的局部平均处理效应(LATE),它可以被解释为人口数量与质量的因果关系(而非简单的相关关系)。从表3可以看到,对于“一胎化”政策的顺从者而
本文档为【计划生育提高了人口质量吗?基于断点回归设计(RDD)的研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥11.9 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
天山书童
暂无简介~
格式:pdf
大小:1MB
软件:PDF阅读器
页数:20
分类:互联网
上传时间:2018-10-19
浏览量:67