Content uploaded by Yu-Teng Yan
Author content
All content in this area was uploaded by Yu-Teng Yan on Nov 23, 2022
Content may be subject to copyright.
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
一、引 言
第七次人口普查是一项重大的人口国情与国力调查,其中人口死亡状况又 是其中最
基础的信息之一。死亡是人口变动的基本驱动力,其指标也是评估卫生医疗资源使用
率、了解人口健康进程、解释疾病转变模式、衡量社会和经济发展水平的重要参考。然而
与普查所调查的其他事项不同,死亡数据需要依靠受访户的记忆间接地对死者信息进
行统计①。相较于国际上更为通用的民事登记和生命统计系统,普查死亡数据的准确性
第七次人口普查数据死亡水平估计
*
李 婷 郑叶昕 闫誉腾
【摘 要】评估普查死亡数 据质量是推断死亡水平的 前提和基础。为避免
单一估计方法因违背 其 特 定 假 设 而产生偏误,文章综 合使用多种模 型生命表
与国际比较法,系统估计了第七次人口普查中各年龄段的死亡漏报,并修正了相
应的死亡水平。研究结果表明,七普各年龄段仍然存在显著的死亡漏报现象。就
各类评估方法 的 中 位数 而 言,中 国 婴 儿死亡率男性为’($!‰、女性为%()&‰,
漏报率分别为$%( *&+、$’(’#+ ;成年(#% ~%) 岁)死亡概率男性为## (!, + 、女
性为’(%,+,漏报率分别为!*( !-+ 、,-($%%;中低龄(’&~$) 岁)老年死亡概 率
男性为%-( )*%、女性为*,( ’*%,漏报 率分别为!’ ($) + 、!)( !$+;高龄(.&~))
岁)老年死亡概率男性为))(#&%、女性为).(&*%,漏报率分别 为,(#’+、%( #*+ 。
由此看出,通 过普查获得准确的死亡信息仍面临不少挑战,应尽快建立起完善
的死亡登记制度。
【关键词】人口普查 数据质量评估 死亡水平估计
【作 者】李 婷 中国人民大学人口与发展研究中心、家庭与性 别研究中
心,教授;郑叶昕 中国人 民大学社会与 人口学院,博士研究生;闫誉腾 中
国人民大学社会与人口学院,博士研究生。
*本文受中国人民大学“双一流”跨学科重大创新规划平台(数字社会治理跨学科交 叉平台)的支持。
① 按国家统计局《第七次全国人口普查方案》,受访户需汇报在过去一 年(2019 年11 月 1 日至 2020 年
10 月 31 日)本户的死亡人口信息。具体而言,以死亡人口死亡前的常住地为登记地,受访户常住人口
中有死亡的,无论其与该户有无亲属关系,都应作为该户死亡人口予以登记。如果无法确定死亡 人口
常住地,或登记时与死亡人口常住地联系不上的,一律在死亡发生地登记。
2
更可能受宏观政策、个体意愿等诸多社会因素的影响。因此,从三普到六普,人口学界对
死亡数据的漏报率和实际死亡水 平 的 估 计从未 间断,对重点年龄段(如 婴儿和老龄阶
段)的评估 更是 其中 的 核心议 题(李 树茁 ,1994;任 强等 ,2004;黄 荣 清 ,2005;王金 营 ,
2013)。这是因为婴儿死亡率可以综合反映一个地区经济、文化等状况,是死亡力随年龄
变化的起点,其准确性也会进一步影响对平均预期寿命的估计(宋健、张洋,2015);对老
龄人口死亡水 平 的 准 确 评 估 则是了解中国人口寿命状况和老龄化速度的重要前提。
由于真实的人口死亡情况未知,现有死亡数据质量评估方法的结果都只是一种估
计,尚未有公认的校准方法(黄荣清、曾宪新,2013)。考虑到各类评估方法均有其前提假
设,有必要综合使用多 种评估方法 ,通过交叉验证,获得多数评 估方法校验较 为 一致的
结果或结果的估计区间,以提高结论的稳健性和有效性。与此同时,由于不同死亡数据
质量评估方法提出的年代不同,利用的基础死亡数据不同,所假设的死亡模式也存在差
异。基于对评估结果差异的比较,可反向对方法进行评价,也有利于进一步加深对人口
死亡特征变化规律的理解。
综上,本文使用 国家统计局公开的 第七次人口普 查 汇总数据①,通过模型生命表和
国际比较法 ,估计七普各年龄段死亡 数据的质量,重点讨论婴幼儿组(0~4岁)与老 龄
组(60~99 岁)的死亡漏报情况,并对实际死亡水平进行估计,从而加深对中国人口发
展进程的理解。
二、死亡水平的估计方法
(一) 死 亡水平 估计方 法的原 理
在以往的研究中,普查死亡数据的 评估方法主要有两类(张震等,2017)。第一类是
针对全年龄段的经验模型评估,例如基于人类死亡历史数据所建立的模型生命表,通过
输入特定参数(如婴儿死亡率、预期寿命等)以实现整体死亡概率的估计。第二类是针对
重点年龄段的特殊评估方法,主要通过不依赖参数与死亡模式设定的死亡概率内部关系
法与外部关系法(李建新等,2018),例如利用婴儿死亡 率与 各国 人 均GDP、教育指数等
社会经济水平的关系进行国际比较。本文综合了上述思路,采用模型生命表与国际比较
法,对各年龄组的死亡水平进行估计,并重点讨论婴幼儿组与老龄组的情况。
1.全年龄段的经验模型法
作为经验模型的代表,模型生命表能克服死亡数据不足,可用于全年龄段死亡数据
的估计和修正,是当下应用最广泛的间接估计方法(张震等,2017)。人口的死亡信息包
括死亡水平和死亡模式两个维度。对于死亡水平,模型生命表以少量易收集的指标估计
①第七 次人口 普 查 汇总数据:http://www.stats.gov.cn/tjsj/pcsj/rkpc/7rp/zk/indexch.htm。本文主要使用《中
国人口普查年鉴 -2020 年》资料表 6-4全国分年龄、性别的死亡人口状况。
第七次人口普查数据死亡水平估计
3
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
和衡量整体死亡水平。对于死亡模式,模型生命表则依据大量可靠的经验数 据,利用死
亡指标之间的强相关性,归纳出一些具有典型特征的死亡模式。通过死亡水平和模式的
结合,该类方法构造出不同的生命表,实现对死亡数据的整体性评估。
就构造的逻辑而言,模型生命表可以 分为纵向研究和横向研究(胡松波等,2014)。
具体而言:纵向研究的模型生命表往往借助同一生命表内部各指标之间或各指标随年
龄变化的规律 ,采用回归分析、主成分分析、最优 K 均值、高斯混合聚类、奇异值分解、
对数二次模型等方法,利用少量指标值估计完整生命表,这一类的代表如Coale-Demeny
模型(Coale 等,1966)、1982 联合国 发 展 中国家模型(UnitedNations,1982)、蒋正华中国
模型(蒋正华,1990;蒋正华等,2016)、Clark-Sharrow 模型(Clark 等,2011)、Clark 模型(Clark
等,2019)、Wilmoth 模型(Wilmoth 等,2012)、DCMD模型(李成等,2018)等。横向研究的
模型生命表则基于两个生命表参数之间的函数关系,如Brass-Logit 模型(Brass,1971)假
定生存函数经 Logit 转换后存在线性关系,从而建立起不同生命表间的横向关系,后续
Murry模型(Murry等,2003)对此进行了一定改进。由于不同模型生命表往往构建于特定
假设之上,有必要进行交叉验证以提高结论的稳健性①。
在实际应用中 ,大部分模型生命表都要求提供待估计生命表的死亡模式和死亡水
平两个参数。其中,死亡水平通 常可以通过 5q0或e0这些连续参数确 定 ,而死亡模式的
选择则有离散和连续两类参数,离散参数通常用于分区模型生命表,不同分区的选择对
应于死亡模式的离散参数值,连续参数通常用于不分区的模型生命表。
本文综合采用了当前运用较多的六种模型生命表对七普的死亡数据进行评估。这
些方法可以分成两大类,第一类是经典的Coale-Demeny模型、Brass-Logit 模型;第二类是
2000 年以后新近发展的模型生命表。新近模型对建构方法与基础数据进行了迭代与更
新,试图更好地反映人类死亡概率的下降趋势,主要包括 Murray模型、Wilmoth 模型、Clark-
Sharrow 模型和Clark 模型。后一类模型生命表可以基于相同的输入参数进行应用和比较。
2.婴幼儿死亡水平的专门估计方法
尽管模型生命表的应用十分广泛,但考虑到婴幼儿死亡水平的重要性,学界发展出
了无须提前预估死亡水平的内部关系法和外部关系法,以规避对死亡水平参数的依赖。
其中,内部关系法由死亡数据内部相对稳定的人口过程关系进行预估,外部关系法则通
过寻找婴幼儿死亡概率与社会经济发展水平、教育之间的关系,使用相对客观的外部经
济、文化等数据对婴幼儿死亡水平进行估计。但是,内部估计法(如曾生子女数法)假定
①不同 模 型生命表在运用 中各自存在局 限,原因包 括基于早期死亡数据建立(如 Coale-Demeny模型、
1982 联合国发展中国家模型、蒋正华中国模型),离散的死亡模式类别难以涵盖所有现实可 能(如分
区模型生命表),较依赖经验数据(如 Clark-Sharrow 模型),以及使用不同年龄组进行系数拟合结论会
存在差异(如 Brass-Logit)等。
4
①nmx≅nMx=nDx
nNx
,
nNx为x至x+n 岁年中人数,
nDx为x至x+n 岁 当年死 亡 人 数 。nmx与nqx的转换公式
为nqx=n×nmx
1+(n-nax
)×nmx
。
估计时期不同年龄段的生育率保持稳定,中国快速的生育转变显然不符合这一假定,通
过该方法往往会高估婴儿死亡率(莫尔特里等,2021)。因此,本文主要使用国际社会经济
发展数据对婴儿死亡率进行评估,简称为“国际比较法”。
国际比较法认为,婴儿死亡率不受年龄结构的影响,其数值主要受社会经济条件和
医疗水平等因素的制约,因此具有横向可比性,是衡量一个国家发展水平的基本指标(黄
荣清、庄亚儿,2004)。在具体方法上,首先,按照社会发展水平给 世界各国分类,对比中
国与不同类型国家的婴儿死亡率变动趋势,观察是否存在下降速度过快等不合理情况;
其次,构建衡量各国经济发展水平和文化教育水平的指标,建立起其与婴儿死亡率的关
系,并用中国的相关指标推测当前的婴儿死亡率。以往研究认为,尽管影响婴儿死亡率
的社会性因素有很多,但经济发展水平最具总括性。因为经济因素直接影响医疗卫生水
平、文化教育投入及个体所能享受到的各种福利等,进而影响婴儿死亡率。此外,受教育
水平的高低与个人的 生 活方式、卫生 习 惯 有关 ,也 会影响婴儿死 亡率和儿童死亡概率
(赵梦晗、杨凡,2013)。国际机构所提供的多个开放数据库为国际比较法的可行性提供
了保证。
(二) 死 亡水平 估计方 法的操 作过程
在使用模型生命表矫正死亡数据之前,首先需要 建立一个原始生命表。为此,本 文
借助七普汇总数据的年中人口和死亡人数得到分年龄的死亡率(nmx
),并设定各年龄组
死亡人口的平均存活人年数(nax
),由此得到分年龄的死亡概率(nqx
)
①。在5岁以下极低
年龄组中,本文采用寇尔—德曼针对低死亡水平情景所拟合的公式(Coale 等,1966)。高
龄开口组∞
qx=1。其余5岁年龄组的存活人年数按区间中点2.5年计算。在这一基础上,
本文使用如下的模型生命表对原始数据进行校正。
1.Coale-Demeny模型生命表
Coale-Demeny(下文简称 C-D)模型生命表是当前运用最 广 泛 、最重要的模型生命
表之一,是典型的死亡模式和死亡水平两参数模型生命表。由于中国家庭对子女的身体
健康状况更为关注,婴儿死亡率相对较低。因此本文重点考察C-D模型生命表的西区
模式(适用范围较广)和北区模式(婴儿死亡率偏低)。
在死亡水平上,七普数据未经调整的原始生命表男性预期寿命为 79.23 岁,女性预
期寿命为 84.23 岁。本研究综合了联合国、世界银行和卫生计量与评价研究所(IHME)对
中国预期寿命的估计,分别对比了男性预期寿命在 74~80岁、女性预期寿命在 79~85
第七次人口普查数据死亡水平估计
5
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
岁的C-D模型生命表西区、北区模式。为了选取出最佳模型,本文采用均方根误差(RMSE)
作为拟合度的评价标准,以年龄别的死亡变动率为指标,筛选出与原始生命表变动规律
最为一致的C-D模型生命表(Horiuchi 等,1990)。
由于婴幼儿和老龄组容易 出 现死 亡 漏报,导致数据不准 确 ,匹配最优 C-D模型生
命表的过程中往往会避开这两个年龄组。实践中常使用 5~85岁、5~59岁、10~69岁、
30~59岁作为基准年龄段(王金营,2013;赵梦晗、杨凡,2013)。本文使用不同基准年龄段
逐一进行了匹配,结果均相当稳定。就七普数据而言,男性更匹配西区模式中预期寿命为
74岁的C-D模型生命表,女性更匹配西区模式中预期寿命为 79岁的C-D模型生命表。
2.Brass-Logit 相关生命表系统方法
尽管 C-D模型生命表设立了不同的死亡类型供研究使用,但这4种死亡类型无法
概括所有的死亡模式,学者们只能从中找到相近的类型,而无法结合研究地区的特点进
行调整(赵梦晗、杨凡,2013)。Brass 开发了一种创新方法,其双参数关 联模型可以用数
学规则将一套基准的年龄别死亡概率和任 意人口的死亡概率相关联。具 体而言,Brass
假设不同生命表年龄别死亡概率在经过Logit 转换之后存在线性关系:设基准生命表!
岁的死亡概率为"#
(!),某年份人口的待估 生 命表!岁死 亡 概率为"(!),经过Logit 转
换,二者将呈现为如下形式:
Logit["$
(!)]=1
2ln[%$
(!)
#&"$
(!)
]=’$
(!) (1)
Logit["(!)]=1
2ln["(!)
#’"(!)
]=’(!) (2)
通过经验研究,Brass 证明了以下关系:
’(!)(α)β·’#
(!) (3)
式(2)中α、β值,依据基准生命表和待估生命表中相 对 稳定的 年 龄组数 据 拟合 得
出。以往的研究和经验表明,第三次全国人口普查死亡数据的准确度非常高,因此本文
以 1981年全国分性别和分年龄的生 命表作为基准生命表。在实际操作中存在以下问
题:首先 ,与 C-D模型生命表类似,Brass-Logit 相关 生命表系统方法在年龄组的选取上
存在一定的主观性,不同年 龄组的拟合结果存在差异。其次,在式(3)中,如果死亡水平
α不显著,是否需要纳入回归存在一定的争议。再次,在估计婴幼儿人口、老龄人口死亡
水平时,有研究 用 基准生命表中同一个年龄组进行拟合,也 有研究 用不同年 龄组进行
拟合。为此,本文首 先计算出不同基准年龄组下的α、β值(见表1),再依据死亡水 平 α
的显著水平及不同年龄组估计的组合方式,计算出所有可能的生命表,最终根据均方根
误差选取出最佳模型。就七普数据而言,最佳的Brass-Logit 模型是以 10~69岁基准年
龄组估计婴幼儿人口、30~59岁估计老龄人口、将不显著的死 亡水平 α纳入回归的设
定,得 到 的预期寿命水平,男性为 76.24岁,女性为 81.52岁。
6
表1不同参照年龄组下 Brass-Logit 模型所估计的死亡模式和死亡水平
基准年龄组死亡模式 β显著水平 死亡水平 α显著水平 R2
5~59岁
男1.233 0.000 0.1940.2850.892
女1.177 0.000 -0.243 0.0950.926
10~69岁
男1.080 0.000 -0.223 0.001 0.976
女1.131 0.000 -0.360 0.000 0.978
30~59岁
男1.0280.000 -0.2970.000 0.993
女1.220 0.000 -0.0940.151 0.991
3.新近模型生命
表方法
作为 新 近发 展 的
模型生命表方 法 ,
Murray模型、Wilmoth
模型、Clark-Sharrow 模
型和Clark 模型无 论
在方法上还是估计误
差上 都 做了 重 要 革
新,更能反映现代的低死亡水平。作为参数模型,Murray模型对Brass-Logit 模型的改进、
Wilmoth 表的对数二次模型及 Clark 表的奇异值分解法,克服了经典模型生命表的许多
弱点,包括使用连续而非离散的参数描述死亡模式和死 亡水平,以及使用更新的数据推
导模型系数。与上述3个参数模型不同,Clark-Sharrow 模型生命表是典型的分区模型生
命表,尽管与Wilmoth、Clark模型同样使用人类死 亡 数 据 库(下文简称 HMD)为基础 数
据,Clark-Sharrow 模型表用高斯模型聚类方法确立死亡模式,依靠婴儿或儿童死亡信息 ,
或者 综合成年死亡信息判定相近的死亡模式。已有基于中国的应用表明,Murray表和
Wilmoth 表的评估效果 相 近,Clark-Sharrow 模型虽然在HMD数据 的 拟合中表现较好,
但应用于拟合1981年中国人口死亡数据时却表现一般(张震等,2017)。Clark 表虽然暂
未被用于检验中国的 死 亡 数 据,但在一些死亡状况相对复 杂的发展中国家(如南非、墨
西哥)效果与Wilmoth 相近(Clark,2019)。随着中国公共卫生事业的发展,当前的人口死
亡模式已经与第三次人口普查时有显著变化,考虑到四种模型各自的特点,本文将综合
采用上述四种模型,对中国七普数据的死亡水平进行全面估计。
上述四种模型可以基于相同的参数输入条件进行对比运用,参数类型可以 是单参数
或者双参数。当为双参数时,常见的是婴儿死 亡率(1q0
)或 5岁以下儿童死亡概率(5q0
)与
其他参数如成年死亡概率(45q15
)或预期寿命(e0
)的搭配。基于经验,婴儿死亡率可能有
一定的漏报,并且存在误差堆积的问题,仅依据婴儿死亡率作为参数进行估计可能带来
较大偏误(Aleshina 等,2005;Huy 等,2008)。为了提高准确性,本文使用较为稳健的 5岁
以下儿童死亡概率进行单参数或双参数的拟合。这些参数的数值一般出于估计或源于
其他辅助信息,本文以全国妇幼卫 生监测点的数据为主①,根据 七普中展现的两性死亡
① 1990~1995年 ,原卫生 部在 30 个省、自治区、直辖市建 立了81个 5 岁以下儿童死亡监测点,动态
监测全国5岁以下儿童的死亡情况。1996年起实 行5岁以下儿童死亡、孕产妇死亡和出生缺陷监
测的“三网监 测”,2007年起全国妇幼卫 生监测点扩大到336个。
第七次人口普查数据死亡水平估计
7
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
①不同数据的来源如下:(1) 联合国儿童死亡率估算机 构间小组(UN IGME)https://childmortality.org/
data/China;(2)卫生 计量与评价研究所(IHME)https://www.healthdata.org/china;世界银行(WB)https://
data.worldbank.org/country/china;世界卫生组织(WHO)https://www.who.int/data/gho/data/indicators/indica-
tor-details/GHO/life-expectancy-at-birth-(years)。
②2010 年开始,联合国开发计划 署使用新的方法计算人类发展指数,其中,教育指数是综合考虑 各国
平均受教育年限(大于或等于 25岁的 人在学校接受教育的年数)和预期受 教育年限(5岁的儿童一
生将要接受教育的年数)两方面来计算(任栋等,2021)。
特征确立5岁以下儿童死亡概率的参数,同时,在监测点未提供的成年 死亡概率和出生
预期寿命上,本文广泛参考了外部估计数据,包括联合国、世界卫生组织、世界银行和卫
生计量与评价研究所数据①。考虑到这些机构在45q15和e0的估计上数值差异不大,又同
属于调整后数据,本文将其综合取平均数。最后,男性的参数及数值设定 为 5q0=8.10‰,
45q15=10.62%,e0=74.72;女性的参数及数值设定为 5q0=6.90‰,
45q15=5.70%,e0=80.18。
为了更清晰地展示七 普
死亡数据的评估结果,本文基
于表2所示的三种 输 入参数
对模型生命表进行了简写。
数值“1”表示单参数 5q0,数 值
“2”表示双参数 5q0和45q15,数
值“3”表示双参数 5q0和e0,而
Murray、Wilmoth、Clark-Sharrow、
Clark 表则分别简写为M、W、CS、C。这几类模型生命表可通过 R和Stata 软件实现。
4.基于外部关系的国际比较法
国际比较法将婴儿死亡率视为可横向比较的指标,依托国际经验对中国的死亡水
平进行估计。本文基于世界银行所公布的国际婴幼儿死亡概率数据,以人均GDP 作为
衡量经济发展水平的指标、人类发展指数(下文简称 HDI)中的教育指 数作为衡量文化
教育水平的指标②,分别拟合婴儿死亡率、5岁以下儿童死亡概率的回归方程,最后将中
国相关指标代入计算中国婴幼儿死亡概率的估计值。由于国际数据缺少分性别死亡概
率,本文仅报告了婴幼儿整体死亡概率估计值。
在经济发展水平的外部评估方面,本文选取与中国在经济发展水平 相近的国际数
据。按世界银行 2020 年数据,中国经购买力平价后的人均GDP 约为 17312 美元,筛选
出2020 年人均GDP 在 15000~20 000 美元的其他国家,且剔除婴儿死亡率 大于75‰的
极端值国家,将其余376 条历史数据进行拟合,结果表明经济发展水平与婴儿死亡率和
5岁以下儿童死亡概率有明显的相关性。
表2四类新近模型生命表在不同条件下的应用
注:Clark 模型生命表暂不支持 将e0作 为输入参数,故本文 在
此处将其略去。
输入参数
5q05q0和45q15 5 q0和e0
Murray模型生命表(M)M1M2M3
Wilmoth 模型生命表(W)W1W2W3
Clark-Sharrow 模型生命表(CS)CS1CS2CS3
Clark 模型生命表(C)C1C2-
模型生命表方法
8
表3不同评估方法下两性的婴幼儿死亡概率 ‰
注:由于国际比较法缺乏评估 4q1的相关数据,此处省略。
1q04q1
男性女性男性女性
原数值1.66 1.381.12 0.89
C-D14.3711.10 1.942.18
Brass-Logit 17.71 10.706.55 4.29
M16.84 5.77 1.271.13
W16.65 5.66 1.461.24
CS17.505.90 1.60 1.20
C16.725.71 1.41 1.13
M26.98 6.00 1.13 0.90
W26.65 5.67 1.461.24
CS25.30 5.90 1.20 1.20
C26.726.51 1.31 1.26
M36.956.01 1.12 0.90
W36.65 5.67 1.461.24
CS36.20 5.40 1.30 1.10
国际比较法 12.8(经济)、17.6(文化)-
方 法
在文化水平的外部评 估方面,本文使用 1990~2019 年158个国家教育指数 ,其 中,
由于 2020 年教育指数尚未公布,本文使用基于灰色预测模型的估计值0.69。由此,本文
将上述历史数据与待估数据回归拟合得到中国婴幼儿死亡概率。
三、结果分析
(一) 七 普死亡 数据的 基本质 量判断
综合历次人口普查情况与国际经验看,七普各年龄段的死亡数据可能均存在一定
程度的漏报。首先,在婴儿死亡率方面,根据七普数据直接计算,2020 年中国婴儿死亡
率为 1.52‰,这一结果与妇幼卫生监测点统计的数据(5.40‰)有较大出入。七普数据计
算的5岁以下儿童死亡概率仅为 2.54‰,也远低于妇幼卫生监测点7.5‰的水平。其次 ,
在预期寿命方面,根据七普的死亡数据测算,中国男性出生预期寿命为 79.23 岁,女性
为84.23 岁,分别比2010 年六普数据增加了3.62岁和3.82岁,而联合国步长法估计预
期寿命达到70岁后每10 年增长不超过 2 岁。
如果用国际数据与七普数据对比,则进一步说明七普死亡数据有待检验。世界银行数
据显示,2019 年世界高收入国家的平均婴儿死亡率、5岁以下儿童死亡概率分别为4.3‰、
5.0‰。具体到个别发达国家,英国这两个数值分别为 3.7‰、4.3‰,美国为5.6‰、6.5‰,
均高于七普数据。就婴儿死亡率而言,全世界低于中国普查数据 1.53‰的仅有圣马力诺
一个国家;就5岁以下儿童死亡概
率而言,全世界低于中国普查数据
2.35‰的仅有5 个国家。可见,七普
在婴幼儿阶段确实存在 相 当程度
的死亡漏报。
(二) 婴幼儿 死亡 漏报 与死亡
概率评估
不同方法对婴幼儿实际死亡水
平和漏报率 的 估计分别 如表3、图
1、图2所示。为了更加清晰地展示
评估方 法 的结果,本文将新近模型
生命表估计结果标识为实心圆,经
典模型生命表估计结果标识为空
心圆。同时,模型生命表估计得到
的1q0本质上是0岁死 亡 概率 ,为
行文方便,本文使用婴儿死亡率作
第七次人口普查数据死亡水平估计
9
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
图2女性 1q0与4q1漏报率
1q0的指代。
总体而言,所有方法都显示七普
数 据 中 婴幼儿死 亡 概率存在显著 的
漏报。从各方法估计的 中 位数看,男
婴死 亡 率 为6 . 72‰、死 亡 漏报率为
75.30%,1~4岁男 童死亡率 1.41‰、
死 亡 漏报率为 20 .85%;女婴死亡率
5.90‰、漏报率为76.61%,1~4岁女童
死亡率 1.20‰、死亡漏报率为 25.92%。
新近模型生命表的估计结果与经
典方法 存在 较 大差 异 :无 论 是男性
还是女性婴幼儿,以Murray、Wilmoth、
Clark-Sharrow 及 Clark 为代 表 的新近
模型生命表在不 同 参 数 条件 下的 评
估值基本位于左下角;而经典的C-D
模型生命表法、Brass-Logit 模型的估
计值则基本位于右上角。这说明经典
估计法 所得的婴幼儿死 亡 概率均显
著高于新近模型生命表。此外,国际
比较法因数据缺乏,没有给出分性别婴幼儿死亡概率的 估计,但作为整体参考,估计结
果相对接近于经典方法的估计结果。
有研究指出,相 较于经典估计 方 法,新近模型生命表可能提供了更加准确的 死 亡
估计。具体而言,在经典估计方法中,Brass-Logit 模型所估计的婴幼儿死亡概率最高,这
可能与其基准生命表(第三次人口普查数据)年代较早、死亡模式存在较大差异有关。尽
管相较于 C-D模型生命表法,Brass-Logit 模型在死亡模式的选择更加灵活,不拘泥于固
定的死亡类别,但其缺点在 于 离基准生命表时间越久,预测的有效性下降得越快,婴幼
儿组更为明显(Murray等,2003)。C-D模型生命表也有 相似的问题,其生命表系统基于
20 世纪80年代的死亡数据 ,整个系统难以适应现代的低死亡 概率模式,对一些新兴的
死亡现象缺乏解释力。同样由于基础生命表的局限,C-D模型生命表对发展中国家的死
亡规律解释 力 不足,尤其难以涵盖死 亡 差 异较大的男性群体内 部 的异质性(Wilmoth
等,2012)。由于中国近几十年死亡模式的巨大变迁,这些经典的模型生命表能在多大程
度准确描绘当今中国的死亡状况存在较大疑问。此外,国际比较法获得的婴幼儿死亡概
率处在经典估计方法和新近模型生命表法的结果之间。该方法基于国际经验数据进行
图1男性 1q0与4q1漏报率
10
推测,这既是优势也是不足。一方面,中国卫生健康事业的快速发展,公共卫生基础建设
和资源投入仍领先于其他相近发展程度国家,国际经验会高估中国的实际死亡水平;另
一方面,国际经验数据 在数值或量纲上的偏差都会使估计结果不稳定。
与上述方法相对,新近模型生命表更新了基础死亡数据,更加符合现代的低死亡水
平,例如Murray模型基于WHO收 集 到的63个国家 1 802 张生命表,更新至 2000 年;
Clark-Shallow 模型基于更新至 2007年的 HMD数 据,Wilmoth 模型在此基础 上还补充了
WHO等其他渠道的死亡数据;Clark 模型使用的是 2018年的 HMD数据。这些基础数据
的更新十分重要,因为自20 世纪70年代起,世界范围内特别是发展中国家的人口转变
拉开序幕,死亡率先于生育率大幅下降,这给经典生命表法带来极大挑战。以C-D模型
生命表为例,当儿童死亡概率下降到60‰以下时,会出现显著偏差(Wilmoth 等,2012)。在
死亡概率下降的过程中,会出现“婴幼儿死 亡概率下降—成人死亡概率下降—老龄阶段
死亡概率下降”的3个阶段(Wilmoth 等,1999)。在提前预设了预期寿命水平的情况下,更
具死亡转变中前期特征的经典估计方法将不可避免地高估婴幼儿死亡水平。
除了对基础死亡数据进行更新外,新近模型生命表也在不断优化对于死亡模式的
选择方式,使其最大可能贴合实际的死亡情况。从C-D模型生命表法与Murray模型的
比较看,C-D模型生命表首 先需要依据死亡指标找到对应的分区,然后找到最合适的死
亡水 平;Murray则使用迭代匹配算法,遍历其所 有的基础生命表,重复前述过程以找到
最匹配的模型生命表,大大提高了拟合度(Murray等,2003)。需 要 谨慎的是,模型生命
表对于死亡数据修正的质量有赖于输入参数的准确性。本文在 建立评估时候,已经纳
入当前国际最常见的参数组合类别,同时充分参考了中国妇幼卫 生监测点及其他第三方
机构同期估计的参数值,一方面避免仅使用普查内部数据所带来的误差累积,另一方面
也尽可能提升评估的稳健性。但是,由于真 实的死亡数据情况未 知 ,通过其他途径对
现有参数的数据质量予以评估较为困难。因 此 ,外部估计法等专门估计方法仍然存在
一定价值,可作为婴幼儿死亡概率估 计的一个上限。
(三)老龄人口的死亡漏报与死亡概率评估
随着社会老龄化的逐步加深,老龄 组死亡数据的价值逐渐凸显,图3至图6分别展
示了七普数据中老龄人口的死亡概率估计和漏报率评估。
总体而言,所有方法都显示老龄人口(60~99 岁)存在显著 的死亡漏报。进一步将
其分为传统研究较为关注的60~79岁中低龄群体及当前快速增长 的80岁以上高龄群
体,可以得到不同评估 方法结果的中 位数:Wilmoth 模型在输入 5q0和e0的条件下,所估
计的男性中低龄老年群体死亡率为51.93%、漏报率为 26.79%;Clark-Sharrow 模型在输入
5q0和45q15的条件下,所估计的女性中低龄老年群体死亡率为 34.63%、漏报率为 29.27%;
Clark 模型在输入 5q0和45q15的条件下,所估计的男性高龄老年群体死亡率为 99.10%、漏
第七次人口普查数据死亡水平估计
11
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
图5男性老龄人口死亡漏报率
图4女性老龄人口死亡概率估计
图3男性老龄人口死亡概率估计
报率为4.16%;Wilmoth 模型在输入 5q0
的条件 下,所 估 计的女性高龄老年群
体死亡率为 98.03%、漏报率为5.13%。
从图5至图6的死亡漏报率的变动模
式可 以 发现,男性的 死 亡 漏报率在
60~65岁区间存在一个先上升再下
降的变 化历程 ,并且除 开口组外 ,无
论男女的死亡漏报率从整体来看都是
一种由高到低的下降趋势。对此,黄荣
清(2005)指出,在步入老年的初始时
期存在的死亡瞒报现象可能与领取养
老金的现实诉求相关。部分拥有养老
金的老年人逝世之后,其 家庭成员为
了继续领取养老金而故意不上报 。
从不 同 的 评 估 方 法 表现来 看 ,
Brass-Logit 模型对于死亡漏报率的估
计与其他方法差异较大,这可能对应了
前文所述的死亡转变历程。Brass-Logit
模型以中国第三次人口普查数据确定
其死亡模式,对当前老龄 人 口 的 死 亡
估计较低。基准的三普生命表更符合
死亡转变中前期特征,表现为婴幼儿
死亡概率较高,那些能够存活下来的
人群往往有着更高的健 康 状况,即存
在非随机的死亡选择性使其在老龄阶
段呈现出较低的死亡概率(Ferraro 等,
2009)。相对而言,C-D模型生命表法
的估计结果与新近模型生命表法接近。
这可能是由于本文使用的西区模式 ,
其基准生命表源自欧洲和其他发达国
家。这也体现了近年来,随着中国 死亡
状况的逐步改善,已达 到历 史 上C-D
模型生命表法构建时部分发达国家的老年死亡水平和模式。但值得注意的是,虽然改善
12
图!女性 "岁 至 #" 岁人口死亡概率估计
图$男性 %岁 至 &% 岁人口死亡概率估计
图&女性老龄人口死亡漏报率
幅度较大,相较于同期的发达国家,中国老年死亡概率仍然较高(果臻等,2020)。
此外,对比各类新近模型生命表法的评估结果可 以发现,单参数模型下的老年死亡
漏报率最高,这很可能 是因为模型是
依据唯一已知参数 5q0估计年龄别死
亡概率,而 5q0与不同年龄段死亡 概率
的相关性会随着年龄的增大而逐渐减
弱。也就是说,成年死亡概率与 5q0的
相 关 性 显然 要 大 于老 龄 死 亡 概率 与
5q0的相关性。因此,如 果 仅使 用 单参
数5q0,而没有提供如45q15或e0等更多
死亡信息,可能会影响 老 龄 死 亡 评估
的准确性,带 来 较高的老 龄 死 亡 漏报
率(胡松波,2015)。
(四) 全 年龄死 亡概率 估计情 况
相较来说 ,现有研究对成人 死亡
概率及其准确度的关注较少。在七普
数据 中 ,15~59岁成人死亡概率 的中
间估计值为男性11.24%,女性6.54%,
对应 的 死亡 漏报率分别 为 23.21%与
41.75%。成人两性死亡概率的差异与
当前发达国家的表现相似——
—
随着预
期寿命提升,女性逐渐扭转了 育龄期
高死亡概率的 不利地位。女性成人 死
亡漏报率自2009 年显著高于男性(李
成、米红,2022),其原因可能是出生时
代较早的女性在统计登记中常常处于
被忽略的地位。考虑到成人健康情况
对人口疾病谱和社会经济发展的重要
作用,未来有必要进一步提升对成人
死亡概率测量的精准度,为相关政 策
提供支持。
图7和图8 总结了不同模型生命
表分性别、分年龄段 的死亡概率中 间
第七次人口普查数据死亡水平估计
13
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
估计值,并提供了相应的估计范围。鉴于上文已经专门绘制了60岁以上老龄人口死亡
概率的估计值,图7和图8仅展示0~60岁的死亡概率估计。此外,在 0 岁预期寿命方
面,男性的中间估计值为74.73岁,上下限分别为76.47 岁、73.11 岁;女性的中间估计值
为80.17 岁,上下限分别为81.52岁、79.00 岁。
四、结论与讨论
(一) 主 要结论
本文综合采用了多种模型生命表与国际比较法 ,对第七次全国人口普查各年龄段
分性别的死亡水平和死亡漏报率进行估计。结果发现,七普数据质量尽管在各个方面均
有所提升,但基于被调查人汇报的死亡数据仍存在显著的漏报现象。从各类估计方法的
死亡 漏报率中位数来看,在婴幼儿组中,男婴死亡率为6.72‰、死亡漏报率为75.30%;
女婴死亡率为5.90‰、死 亡漏报率为76.61%。在成年组中(15~59岁),男性死亡概率
为 11.24%、死亡漏报率为 23.21%,女性死亡概率为6.54%、死亡漏报率为41.75%。在老龄
组中(60~99 岁),中低龄(60~79岁)男性的死亡概率为51.93%、死亡漏报率为 26.79%,
女性的死亡概率为 34.63%、死 亡 漏报率为 29.27%;高 龄(80~99 岁)男性的死亡概率
为 99.10%、死亡漏报率为4.16%,女性的死亡概率为 98.03%、死亡漏报率为5.13%。同
时,从 各类评估方法 所 估计的预期寿命中位数看,男性为 74.73岁,女性 为 80.17 岁,与
国家统计局所公布2020 年全国分性别预期寿命男性75.37 岁、女性80.88 岁较为接近,
本文的男性和女性估计值较原始值分别下降了5.77%和4.88%。
除对七普死亡数据的评估外,本 文 在 评估过程中所使用的不同评估方法在结果上
存在差异也说明学界有必要进一步审视各类评估方法本身的有效性。其中,经典评估方
法虽然历史悠久,并在 20 世纪得到广泛运用,但其 评 估结果与新近模型生命表有较大
出入,与 WHO、UN、IHME等第三方评估结果也有较大差异,说明其适用性在当下受到了
挑战。其中,最核心的挑战来源于婴幼儿死亡概率的下降与老年存活率 的 上升(Baniste
等,2004)。婴幼儿死亡概率的下降一方面是死亡转变中最突出的特征,另一方面也是影
响平均预期寿命的关键。这也解释 了为什么在匹配了当前的死亡水平、拥有着相近的
预期寿命条件下,经典模型生命表在评估结果上仍然与新近模型生命表存在显著差异;
同时,这还反映 了经典模型生命表更具死亡转变中前期特征的本质,间接证明了自20
世纪80年代以来全球范围人口转变所带来的死亡模式变化之剧烈。自1990 年起,中国
婴幼儿及成人死亡概率也出现较大幅度的下降,老年人口死亡概率则稳步下降(果臻等,
2020),相较而言,新近模型生命表则可 能更能捕捉中国 当前低死亡概率下的现代人口
死亡特征,对七普数据的实际估计结果也更为一致。
14
当然,对于新近模型生命表而言,各类方法的结果之间也存在一定的差异。但目前
并没有充分的证据表明哪一种新近模型生命表具有压倒性优势,也无从通过 外部信息
来比较这些方法对中国死亡数据拟合的效果。因此,同时保留各类方法的估计值具有一
定的意义。它们可以在一定程度上提供中国死亡水平估计值的一个范围。
(二) 建 议:推进生命登记系统建设
最后,死亡漏报对于死亡水平评估的影响是巨大的。尤其在低死亡水平、高死 亡漏
报率的情况下,死亡漏报率的改变将带来如平均预期寿命更大幅度的变化(宋健、张洋,
2015)。但在基于调查法的人口普查实践中,由于只能依赖被访者的回忆间接收集死者
信息,死亡数据准确性难以保证。因此,虽然七普全面采用电子化数据采集方式,基础人
口信息质量有显著提升(翟振武、刘雯莉,2021),但死亡数据仍然存在较高的漏报率,表
明利用调查法收集死亡数据存在较大弊端。
放眼国际,调查法并不是通用的死亡数据收集方法。国际社会对于死亡数据的收集
主要依 赖民事登 记系 统与 生 命登 记系统,也 就是从人 口 或户口登记系统收集死 亡 和
出生等记录,再利用生命统计制度汇编出详 细 的出生 和 死 亡 数 据。这样的人口数据是
动态的、连续的。用登记的方法不仅可以记录当事人详细的人口和社会特征,也可以记
录与这些事件有直接关系的人的社会特征。鉴于目前中国大陆仍缺乏完善的民事登记
和生命统计制度,本文建议尽快整合各政府部门数据,推进建立常规 、稳定的生命登记
系统。
参考文献:
1.果臻等(2020):《中国老年人口预期寿命增长滞后问题研究》,《中国人口科学》,第 3期。
2.胡松波等(2014):《模型寿命表方法及其研究进展》,《中国卫生统计》,第 1期。
3.胡松波(2015):《中国模型寿命表:现有模型的评估和新模型的建立》,武汉大学博士论文。
4.黄荣清(2005):《20 世纪90 年代中国人口死亡水平》,《中国人口科学》,第 3期。
5.黄荣清、曾宪新(2013):《“六普”报告的婴儿死亡率误差和实际水平的估计》,《人口研究》,第 2期。
6. 黄荣清、庄亚儿(2004):《人口死亡水平的国际比较》,《人口学刊》,第 6期。
7. 蒋正华(1990):《中国分区模型生命表》,《中国人口科学》,第 2期。
8. 蒋正华等(2016):《中国区域模型生命表(简略生命表拓展版)》,中国人口出版社。
9.李成等(2018):《利用DCMD模型生命表系统对“六普”数据中死亡漏报的估计》,《人口研究》,第 2期。
10.李成、米红(2022):《中国 1982年后人口普查和抽样调查中死亡漏报的估计——
—
基于Bayesian 分层回
归模型》,《人口研究》,第 1期。
11.李建新等(2018):《中国城乡生命表编制方法探析》,《中国人口科学》,第 3期。
12.李树茁(1994):《80年代中国人口死亡水平和模式的变动分析──兼论对 1990 年人口普查死亡水平
的调整》,《人口研究》,第 2期。
第七次人口普查数据死亡水平估计
15
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
13.任栋等(2021):《基于人类发展指数框架的中国教育指数的编制和比较研究》,《华东师范大学学报(教
育科学版)》,第 11 期。
14.任强等(2004):《20 世纪80年代以来中国人口死亡的水平、模式及区域差异》,《中国人口科学》,第 3期。
15.宋健、张洋(2015):《婴儿死亡漏报对平均预期寿命的影响及区域差异》,《人口研究》,第 3期。
16. 汤姆·A·莫尔特里等(2021):《人口学估计方法》,冯秋石等译。
17. 王金营(2013):《1990 年以来中国人口寿命水平和死亡模式的再估计》,《人口研究》,第 4期。
18. 翟振武、刘雯莉(2021):《七普数据质量与中国人口新“变化”》,《人口研究》,第 3期。
19.张震等(2017):《二维死亡模型对中国人口死亡模式的适用性研究》,《中国人口科学》,第 1期。
20.赵梦晗、杨凡(2013):《六普数据中婴儿死亡率及儿童死亡概率的质疑与评估》,《人口研究》,第 5期。
21.Aleshina N. and Redmond G.(2005),How High is Infant Mortalityin Centraland EastermEuropeand the
Commonwealth ofIndependent States?.!"#$%&’(") *’$+(,-. 59(1):39-54.
22.BanisterJ. and Hill K.(2004),Mortalityin China 1964-2000./"#$%&’(") 0’$+(,-.58(1):55-75.
23.Brass W.(1971),Mortality Models and Their Uses in Demography.12&)-&3’(")- "4 ’5, 6&3$%’7 "4 83’$&2(,-.
33:123-142.
24.Clark S.J.(2019),GeneralAge-Specific Mortality Model With an Example Indexedby ChildMortalityor Both
Child and AdultMortality.9,:";29.56(3):1131-1159.
25.Clark S.J. and Sharrow D.J.(2011),<")’,:#"2&27 ="+,% >(4, 1&?%,- 4"2 9,@,%"#,+ <"$)’2(,-:8) 8##%(3&-
’(") "4 ="+,%A?&-,+ <%$-’,2();.Centerfor Statistics and the Social Sciences. UniversityofWashington.
26. Coale A.J.,DemenyP. and Vaughan B.(1966),B,;(")&% ="+,% >(4, 1&?%,- &)+ 0’&?%, C"#$%&’(")-. Prince-
ton UniversityPress.
27. Ferraro K.F. and Shippee T.P.(2009),Aging and CumulativeInequality:How DoesInequalityGetUnder the
Skin?.15, D,2")’"%";(-’.49(3):333-343.
28. Horiuchi S. and Coale A.J.(1990),AgePatterns ofMortalityfor OlderWomen:AnAnalysis Using theAge-Spe-
cific RateofMortality Changewith Age.=&’5 !"#$%&’(") 0’$+(,-. 2(4):245-67,325.
29.Huy T.Q.,Johansson A. and Long N.H.(2007),Reasons for Not Reporting Deaths:AQualitative Studyin Ru-
ralVietnam.E"2%+ F,&%’5 G C"#$%$%&’(").9(1):14-23..
30.Murray C.J.L.,et al.(2003),ModifiedLogit LifeTable System:Principles,EmpiricalValidation,and Applica-
tion. C"#$%&’(") *’$+(,-. 57(2):165-182.
31.UnitedNations(1982),="+,% >(4, 1&?%,- 4"2 9,@,%"#(); <"$)’2(,-.UnitedNations.
32.Wilmoth J.,et al.(2012),AFlexible Two-Dimensional Mortality Model for Usein Indirect Estimation. C"#$%&-
’(") *’$+(,-. 66(1):1-28.
33.Wilmoth J. and Horiuchi S.(1999),Rectangularization Revisited:Variabilityof Ageat Death Within Human
Populations. 9,:";29.36(4):475-495.
(责任编辑:李玉柱)
16
中国人口科学 !"#$ 年第 %期中国人口科学 !&!! 年第 %期
!"#$%&% ’()*$+, (- .(/),+0#($ 12#%$2%
A bimonthly
No.
5
October,
2022
341567851
5"% 9&0#:+0#($ (- 0"% ;(*0+,#0< =%>%, ?#0" 0"% 1%>%$0" 8"#$+ .(/),+0#($ 8%$&)& Li Ting and Others·2·
Assessing thequalityofcensusmortalitydata is a prerequisiteand basis for inferring mortality levels in China. To
avoid thebias ofa single estimation method due to theviolation ofits specific assumptions,this paper comprehensively
usesmethods ofmodel lifetables and internationalcomparison to systematically estimatetheage-specific mortalityrate
and corresponding death under-reporting ratewith theseventh China population census. Theresults find that thereis
significant under-reporting in theseventh census. In terms ofthe median ofvariousmethods’results,theadjusted infant
mortalityrates are6.72‰for the male and 5.90‰for thefemale,with under-reporting rates of75.30%and 76.61%,
respectively.Theadjusted adult(15-59)death probabilities are11.24% for the male and 6.54% for thefemale,with
under-reporting rates of23.21%and 41.75%,respectively.Theadjusted old-aged(60-79)death probabilities are51.93%
for the male and 34.63%for thefemale,implying under-reporting rates of26.79%and 29 .27%,respectively.The
adjusted old-aged(80-99)death probabilities are99.10%for the male and 98.03%for thefemale,implying under-
reporting rates of4.16%and 5.13%,respectively.Thus,therearestill manychallenges to obtaining accuratedeath in-
formation through thecensus,and a completedeath registration system shouldbe established as soon as possible.
5"% @%+,0" 10+0)& (- 0"% 8"#$%&% 9,A%*,< .(/),+0#($ +$A B0& 5*%$A& #$ CDED
~
CDCDF
9>#A%$2% -*(: 0"% .(/),+0#($ !%$&)& +$A 1+:/,#$G H+0+ Zhang Wenjuan Fu Min·17·
Health status is an important indicator for thequalityoflifeand crucial evidencein theprocess ofpolicy making on
the elderly,but thechanges in thehealth ofthe elderly arecomplex and unstable.Based on thenationalcensus and
sampling data since2010,this paper analyzes theself-reported health status ofthe Chinese elderly from2010 to 2020,
and discusses thetrends in the extension oftheir healthy life expectancyand disability-free life expectancy.Theresults
show that thehealth status ofthe elderly population has been developing well since2010.Their performanceon thephysical
activities ofdaily living had been improved steadily,and thehealth status ofthe elderly who lived in theruralaveas has
been improved. The life expectancy,self-reported healthy life expectancyand disability-free life expectancyofthe elderly
havesteadily increased,while thesurvivaltimein thestateofdiseaseor disabilityhas been shortened as wellas its proportion in
the life expectancy.This phenomenon conforms to thecharacter ofabsolutecompression ofdiseaseor disability,which
indicatesChina has entered thefourth stageofhealth transformation. Therefore,weshould reconsider the existing projection
on thehealth status ofthe elderly,and adjust thepessimistic expectation on therapid growth ofthe elderly careburden
in thefuture.
.(/),+0#($ @%+,0" 5*+$�#($ #$ !"#$+F 72"#%>%:%$0& #$ 0"% !(I%>(,)0#($ (-
J%+,0" K(>%*$+$2% +$A J%+,0" 10*+0%G#%& Zhang Zhen·32·
Morethan 70years ofthePeople’sRepublic ofChina havewitnessed theremarkable journey ofalargepopulation
with a long historyofpovertyand weakness to achieverapid improvement in health status and sustained growth in life
expectancy.Alargenumber ofliteraturehas extensively and thoroughly exploredChina’s population health improvement
126