您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[长城证券]:宏观经济研究:中国生育率研究 - 发现报告

宏观经济研究:中国生育率研究

2023-05-15长城证券偏***
AI智能总结
查看更多
宏观经济研究:中国生育率研究

人口在每个经济和社会发展中发挥重要的作用,生育率是影响人口变化的因素之一。研究中国人口数量未来走势,重点是研究生育率的未来走势。对生育率的准确预判,有利于对国家制定合理的生育政策。为更准确、全面的探究经济、社会、文化和政策因素对生育率的影响,我们对数据的准确度进行讨论,并对世界面板数据和中国省际面板数据展开实证研究。 从世界各国层面看,经济增长与女性受教育程度可能与生育率存“U”型关系;1981-2015年间,鼓励或限制生育的政策未能起到相应效果。从中国各省层面看,经济、政策和人口结构因素对生育率波动作用较为显著。与世界面板回归模型相比,经济和政策的作用机制有所不同。我国经济上看,房价和居民负债的上升会到导致生育孩子效用的减少,从而导致生育率的下降。 政策上看,由于二十世纪计划生育的实施直接抑制了生育率的提高,导致颁布“单独二孩”,“全面二孩”和“三孩”政策对生育率均有显著的正向效用,释放了居民被压抑的生育意愿。从人口结构上看,人口老龄化和结婚率均对生育率产生显著影响。结婚率的下降和居民杠杆的上升趋势相似,共同导致了近年中国生育率的下降。 因此,为缓解生育率下滑,提高我国生育意愿,应从经济激励和加强社会福利两方面入手。 风险提示:国内宏观经济政策不及预期;统计数据与实际数据有偏差;数据提取不及时;人口生育率可能受到其他因素影响。 1.递进总和生育率和内在总和生育率 人口在每个经济和社会发展中发挥重要的作用,生育率是影响人口变化的因素之一。 研究中国人口数量未来走势,重点是研究生育率的未来走势。对生育率的准确预判,有利于对国家制定合理的生育政策。 1.1统计局抽样误差问题 中国的总体生育率经过了90年代大幅下降、20世纪末的逐步回升以及近年来又再次回落的演进过程。目前已有二十多年处于低生育水平,自计划生育被写入基本国策、提出“提倡晚婚、晚育,少生、优生”后,20世纪90年代至今生育率下降了近1个百分点。国家统计局公布数据显示,我国出生人口连续4年下跌,从2016年的1883万人下降至2020年的1200万人,总和生育率降至1.3。尽管学界对中国的低生育率有一致的共识,但诸多的数据来源及计算方法使得学界对于生育率具体水平有着较大分歧。 以“六普”为例,部分学者认为,“六普”推算出的总和生育率1.181结果偏低,该结果表明平均每名育龄女子生育1.181个孩子;而世界银行给出的同年数据为1.687,差距较大。 学者崔红艳,徐岚,李睿(2013年)对分年龄的人口比例基于留存率假设提出质疑,并提出“六普”生育率不足以代表中国真实生育率水平,并推测真实生育率在1.50-1.64之间,与世界银行结果相近。高爽、陈卫(2013)提出了测算内在总和生育率的方法,陈卫、段媛媛(2019)给出了对于近10年中国总和生育率更精准的估计。 总和生育率表示假设妇女度过整个生育期并按当期年龄别生育率生育的孩子数,由于其计算简单,代表性较强,因此被用于衡量一国生育水平。总体生育率(total fertility rate,TFR)的计算公式为: ∑𝐹𝑇𝑅= (各年龄段的年生育率∗5年∗该年龄阶段育龄妇女占比) 我们根据2003年以来、除普查年份外其他年份的国家统计局抽样数据推算出的总体生育率与世界银行和学界的数据均有所差距。其中2010年之前的抽样数据得出的生育率水平与世界银行给出的生育率水平趋势相反,2010年之后的抽样数据计算得出的生育率走势与世界银行生育率走势较为一致,但波动幅度更大。误差可能是计算总和生育率的原数据中抽样女性年龄分布与真实分布不同造成的。 图表1:各统计口径中国总体生育率 具体体现在不同年龄段的人口占比中——以2005年育龄女性年龄段为20-24岁比例为例,2005年该年龄层占比为11.45%,5年后该年龄层体现为25-29岁年龄层占比为13.70%,两者相差较大。同时2005年20-24年龄层人口比25-29年龄层人口为0.94,2010年25-29年龄层人口比30-34年龄层人口为1.05,也存在较大的缺口。在一般情况下,基于人口留存率应严格小于1的假设,n年与n+5年比例不会出现重大波动,且n年与n+1年间留存在样本的a年龄层与a+1年龄层比例应一致。推测存在抽样方法的差异造成的数据口径不一、执行计划生育时的瞒报行为和国内行业变化等可能原因导致的统计错误。 图表2:各年份年龄层人口普查与抽样结果 1.2递进总和生育率与内在总和生育率 新指标递进总和生育率和内在总和生育率能消除总和生育率中的进度效应,真实反映生育率状况。除了数据质量,总和生育率这一被广泛应用的指标存在的缺陷也被学者们关注,例如,总和生育率可能会由于人口结构和生育进度的变化而产生波动,为去除这两种效应的影响,Rallu与Laurent(1994)通过控制年龄结构、胎次结构和胎次间隔,构建胎次别、年龄别和间隔别的总和生育率;McDonald和Kippen(2007年)提出了内在总和生育率指标。陈卫,段媛媛(2019)利用《2017年全国生育状况抽样调查》数据构建出分孩次总和生育率、分孩次递进总和生育率及分孩次内在总和生育率。 图表3:世界银行和学界所作内在总和生育率 内在总生育率(Intrinsic Total Fertility Rate, ITFR)通过控制和分解胎次别、年龄别和间隔别,进一步消除进度效应的影响。该指标测度人口在长时间内特定年龄阶段的生育率保持不变时所经历的总生育率,由各胎次年龄别、间隔别构成。递进总和生育率通过控制胎次别和年龄别消除了生育的部分进度效应,使存在总和生育率中推迟或提前的生育数量进行还原。 由2017年抽样数据构建的各年内在总和生育率与世界银行趋势、数值大小均相似。实际上,世界银行给出的总体生育率基于抽样、普查原数据,经过一系列数据补空、模型处理过程得到,不是由公式简单得出的生育率,与学界的测算数据相似说明该生育率也具有一定的代表性。 世界银行给出的总体生育率来自于《2022 Revision of World Population Prospects》,其中中国的数据来自各年人口抽样调查、1990、2000、2010、2020年的人口普查和2018年的国家社会调查。根据1982、1990、2000年的生育率调查以及1997、2006年人口与健康调查中的妇女和前12个月出生对的数据,按照母亲胎次别和年龄别得出递进比率指标调整生育率。 世界银行的测算方法除了使用多年份的普查数据外,还使用了人口抽样数据、医疗数据和教育数据作为补充验证数据,能够及时调整由单一年份计算得出的递进总和生育率误差。调整后的数据使用可靠性增长模型——Gompertz模型再拟合。Gompert模型广泛应用于微生物和动植物的增长速率,近年来也运用于保险业、需求和人口增长测算,其“S”型曲线能较好的反映增长规律。因此世界银行给出的生育率数据经过多样本数据调整以及模型的平滑预测,能够较好的反应生育的趋势水平。 我们在接下来的生育率实证研究中使用的是世界银行公布的数据。 1.3调查总和生育率反映的生育规律 由于无法得到的2017年全国生育状况抽样调查数据,我们只能根据一些研究学者的成果进行总结和利用。通过研究学者陈卫(2017)、贺丹(2018)等发布的论文或报告,可以得出如下几个结论: (1)从递进生育率的趋势看,一孩生育率仍保持较高水平,导致一孩生育水平下降的主因是初婚初育年龄增长。2006-2017年妇女平均初婚年龄从23.6岁上升到26.5岁,平均初育年龄由24.3岁上升到27.3岁,均推迟3年,且2012年以来的推迟幅度明显大于之前年份。 图表4:2006-2017年中国一孩总和生育率和一孩递进总和生育率 图表5:2006年、2011年和2016年年龄别生育率 (2)生育政策的开放对生育率影响显著,但并不改变生育趋势。2013年的“单独二孩”、2015年的“全面二孩”政策出台之后,生育率均出现了明显的回升。从内在生育率的走势看,剔除掉堆积效应之后的内在生育率始终保持稳定。 图表6:2007年-2016年中国二孩总和生育率、二孩递进总和生育率、二孩内在生育率 图表7:2006-2016年分孩次平均生育年龄 2.基于国内外生育率影响因素的实证分析 2.1基于世界生育率影响因素的实证分析 近半个世纪以来,世界大部分国家生育率呈总体下降趋势。特别是中东和北非地区总和生育率说自1950年7‰降至2019年2.5‰的水平。东亚各国在经历了数十年经济飞速发展后,生育率也出现显著下降。目前国外已有较多探究生育率影响因素及实证文献,也有较为系统的文献综述。Aboulghasem Pourreza (2021)梳理影响总和生育率的主要因素有医疗、文化、经济、社会和政治因素,并罗列了大部分纳入实证研究的因子。 国内学者对于生育率长期变化和准确性更为关注。实证方面,冀福俊(2014)基于各国数据对总和生育率进行实证分析,得出了经济发展和总和生育率间存在“U”型关系; 张孝栋等(2021)对中国低生育率研究进展进行综述,从经济、社会、家庭、制度和文化五方面对我国低生育率做出解释。人口预测方面,陈卫(2022)给出了对于未来总人口、劳动力人口和老龄化抚养比趋势的预测。我们也从上述因素分析着手,探究对我国生育率的影响因素。 图表8:2020年世界各国收入与总和生育率关系 在消费者理论框架中,生育孩子在居民的效用函数中存在收入效应和替代效应,两者相加得到的总效应发生变动会引起居民行为的变化。当生育的相对成本上升,收入效应和替代效应为负,生育孩子后的总效用下降,居民就会减少生育行为。当生育相对成本下降,生育的收入效应大于替代效应,居民会增加生育行为,反之减少生育行为。 实证分析中,经济发展程度和受教育水平通常被认为是影响收入效应和替代效应的原因。为探究其影响程度及具体影响路径,我们选取了1981-2015年中国、日本、美国、韩国、印度、巴西、法国、希腊、南非、俄罗斯共10个地理位置差异较大、经济发展水平不一的国家数据。除女性受教育年限数外其他数据均来自世界银行。为了消除数据不平稳的情况,人均国民总值采取了对数的形式,对城镇化率进行了一阶差分,处理后的数据均通过单位根检验。 基于对世界各国及中国生育率的分析和已有文献研究,建立如下模型: 式中,被解释变量为总和生育率,指每名妇女生育孩子的数量,文中用于衡量国家的生育率水平。解释变量包括影响生育率的主要经济及社会因素,包括人均国民总值𝑙𝑝𝑔𝑑𝑝,用于衡量经济增长;育龄女性(15-45岁)的平均受教育年限𝑒𝑑𝑢,用于衡量育龄群体的受教育水平;工业化率𝑖𝑟和城镇化率𝑢𝑟用于衡量一国工业化水平和城镇化水平;生育政策𝑝𝑜𝑙𝑖𝑐𝑦用于衡量国家是否对生育进行鼓励或限制生育。为了观察解释变量和被解释变量是否存在非线性关系,加入了𝑙𝑝𝑔𝑑𝑝及𝑒𝑑𝑢。式中𝜇为固定效应,𝜀为随机误差项,下标𝑖表示国家,𝑡表示时间。 图表9:世界面板数据回归结果 方程1为混合效应模型回归结果,混合效应模型回归假设个体间无异质性,该假设对于回归样本过于严格。因此使用混合效应模型回归结果虽然 R2 较大,但不适用于该数据。 经豪斯曼检验和F检验,对该面板数据采用双向固定效应模型,并采用逐步添加解释变量的方式进行回归。方程(1)中,解释变量为𝑙𝑝𝑔𝑑𝑝,𝑖𝑟,𝑢𝑟和𝑒𝑑𝑢,初步看城镇化水平和女性受教育水平的提高对国家总和生育率有显著的负效应, R2 仅为0.402,对总和生育率解释力度不强。方程(3)、(4)、(5)分别加入人均GDP和女性受教育程度的平方项、鼓励生育政策和限制生育的二元变量。此时变量均在置信水平为1%的情况下显著, R2 提升到合理区间,解释变量对模型的解释程度较高。 方程(3)结果显示,经济增长与女性受教育程度可能与生育率存“U”型关系。经济增长线型项与总体生育率是负相关关系,