周一至周日 8:00-22:30:
帮助中心 联系我们
当前位置:啊呀呀呀教科专业毕业设计 > 论文 > 社会学 > >列表
社会学(  )
站点导航
展开/合拢

人口普查事后质量抽查的有关问题:国外经验及借鉴

2015-05-10 18:39   来源: 人参与在线咨询

                           作者:贺本岚 金勇进 巩红禹

    摘 要:事后质量抽查是对人口普查登记质量进行检验和评估的调查方法。文章通过对美国、英国和印度等国家的事后质量抽查经验进行,对我国今后人口普查事后质量抽查提出了建议。

    关键词:人口普查;事后质量抽查;数据质量
    Abstract:Post enumeration survey is one of the effective approaches to examine and evaluate the quality ofcensus registration.Based on the experience ofpostenumeration survey from theU. S., U.K. and India, this paperproposes some suggestions forChina2010 census.

Key words:census; post enumeration survey; data quality

  我国政府统计数据质量已成为近年来国内外社会各界关注的问题之一。今年我国将进行第六次人口普查,人口普查的数据质量再次受到人们普遍的关注。目前,评价人口普查数据质量常用的方法之一是事后质量抽查。我国于1982年在人口普查中首次采用抽样调查的方法来评价人口普查的登记质量,在历年的人口变动情况抽样调查中仍采取事后质量抽样调查作为评价全国人口抽样调查数据质量的方法之一[1]。

    美国、英国等发达国家几十年来对事后质量抽查进行了长期的讨论,积累了丰富的理论和实践经验。对这些国家人口普查事后质量抽查进行经验总结,将有助于我国人口普查及事后质量抽查工作的改进与完善,有助于改善我国政府统计数据质量,为日后普查方案的修订提供依据。

    美国和英国在人口普查事后质量抽查方面起步较早,而印度作为世界上的人口大国之一,与我国国情具有诸多相似之处,因此,本文选取这三个国家与进行比较分析。

    一、抽样设计比较

(一)美国抽样设计美国在每十年一次的人口普查中估计人口覆盖率较长,正式测算始于1940年的人口普查。1980年开始结合双系统估计方法采用事后质量抽查测算人口普查的覆盖率。2000年美国的人口普查事后质量抽查称为“准确性与覆盖度评估”(Accuracy and Coverage Evaluation,以下简称为ACE),采用三阶段分层整群抽样设计。

    2000年人口普查中,美国共划分了3767000个街区群,美国联邦人口普查局根据估计精度和事后抽查目的确定全国样本量。第一阶段,ACE调查首先将所有街区群按居住单位数量和是否美国印第安人居住分为小型街区层(每个街区群0-2个居住单位),中型街区层(每个街区群3-79个居住单位),大型街区层(每个街区群80个以上居住单位)和美国印第安人居住层[2]。再按人口比例分配各街区样本量,在各层内等距抽取街区群样本。

    该阶段样本抽取出来以后,还需进行居住单元比较和目标延伸搜索,以弥补调查目录的不足。对每一个街区群样本进行现场调查,编制每个街区群内的居住单位地址目录,称为ACE独立(居住单位)地址目录。对每个入选的街区群样本,将该街区群的ACE独立(居住单位)地址目录与该街区群的“最新普查(居住单位)地址目录”进行对比,确定是否需要进行目标延伸搜索,完善调查目录。如果这两份目录的居住单元一致,则无需进行目标延伸搜索。而如果两份目录不一致,则按照不一致单元的数量进行排序,等距抽取其中一部分进行目标延伸搜索,即对划分区域内除调查目录外的其他建筑和场所进行居住单元地搜索与登记,对登记错误的居住单元进行改正,对遗漏的进行补充。

    第二阶段对抽取的第一阶段样本街区群分子层基础上,采用第一阶段抽取街区群的相同方法从这些划分子层中分别抽取调查小区样本,目的是为了缩小最终抽取调查小区样本的数量,提高样本的代表性。

    第三阶段抽取住户单位,对第二阶段抽出的包含79个住户单位以下的调查小区内的住户全部进行调查,而包含80个住户单位以上的调查小区则被再分成街区片(由若干住户单位组成),采用系统抽样抽取一定比例的街区片住户单位。

    对抽取的样本住户内的个人采用年龄、性别、种族、房屋所有权期限、地区、城市类别、邮寄回答率等进行事后分层[3]。在每个事后层内构造双系统估计量估计该层的人口数,再通过汇总得到全国人口数。最终得到人口普查净遗漏率为1. 16%。

    2010年美国将进行第23次人口普查,并制定了事后质量抽查初始方案,称为普查覆盖度测量(CensusCoverageMeasuremen,t简称CCM),其抽样设计与2000年相同。

    (二)英国抽样设计

英国自1961年开始在人口普查后进行普查日外出人口10%调查、事后调查估计覆盖和回答误差等。

    2001年人口普查事后抽查称为普查覆盖度调查(CensusCoverage Survey,以下简称CCS),采用两阶段分层不等概率抽样设计。

    为选择有效样本,能对所有地方行政区按年龄和性别估计普查日人口数,调查首先将英国相邻的地方行政区重新归类,形成112个“设计区”。每个设计区包含大约500000人,由若干邮政编码区域组成。由于各区域的漏报率水平不一致,为提高估计精度,根据1991年普查中影响漏报率的相关变量构造“普查难度指数(Had to Count Index)”[4],将每个设计区划分为简单、中等、困难三类调查区,再从每一类调查区内抽取调查区,即为第一阶段样本。

    第二阶段采用简单随机抽样从每一调查区内抽取一定数量的邮政编码(每个邮政编码对应多个住户),这些邮政编码对应的住户构成最终样本单元。最后将CCS最终样本按年龄性别交叉分为37组,经过CCS与普查记录进行匹配,构造双系统估计量来推断总人口数。推估得到2001年人口普查净遗漏率为6.1%。

    为准备2011年的人口普查事后质量抽查,英国于2009年11月23日至12月17日进行了预调查。2011年的CCS在1991年的基础上做了一些改进,如划分设计区时不仅考虑地理位置因素,还综合考虑区域类型等其它因素;对重复率和漏登率分别进行估计等。

    (三)印度抽样设计

印度于1872年首次进行人口普查,从1951年人口普查起开展事后质量抽查。2001年人口普查事后质量抽查(PostEnumeration Survey,以下简称PES),主要目的是计算覆盖误差(Coverage Error),采取两阶段分层系统抽样设计。

    调查首先根据1991年的遗漏率和相对百分误差确定2001年PES的样本量。再考虑区域的离散性,数据分析的可靠性及非抽样误差的控制等因素,在国家的层面上抽取3000个街区。同时由1991年的调查发现,在区域范围内更能精确合理地估计相对标准百分比误差。因此,将全国所有的邦分成六个区:南区、东区、东北区、北区、西区、中区,分别在全国和区域的层面上进行估计。

    根据1991年人口普查结果预先推算2001年各邦人口数,再按与这个人口规模数成比例分配街区到各个邦。在每个邦内,先将该邦所有的街区按照位置代码排序,采取系统抽样抽取街区,最终抽取的3000个街区用来估计覆盖误差。再从这3000个街区中按照系统抽样抽出600个街区,用来估计普查登记内容误差。对被选中街区的所有住户都进行调查。

    对最终抽取的样本按年龄、性别、城乡和区域进行事后分层,构造双系统估计量估计特定属性人口的普查覆盖率和人口数。2001年印度PES显示全国范围内总的净遗漏率为2. 3%,其中:城市比遗漏的更多,前者净遗漏率为4%,后者净遗漏率为1. 7%。

    2011年印度将进行第十五次全国人口普查,这次普查的准备工作已经于2010年4月1日正式启动。

    (四)中国抽样设计

2000年我国人口普查事后质量抽查采取分层随机等距整群抽样设计,采用人口普查地址码库作为调查目录。事后质量抽样调查目的是只评价全国人口普查登记的质量,并不评价省级及省级以下各级的登记质量,也不评价抽中调查小区的登记质量。

    首先根据1999年年末人口数据将我国31个省市按总人口规模划分为四层,各省再按城乡分层,在层内随机等距整群抽取调查小区(根据《第五次全国人口普查办法》,人口普查登记和资料汇总按照划分的普查区域进行。农村以村民委员会所辖地域为基础,城镇以居民委员会所辖地域为基础划分普查区。每个普查区,按照一个普查员所能承担的工作量,划分成若干个调查小区,涵盖调查小区的
所有住户,不重不漏。)。5000万人以上的省份抽取30个调查小区, 2600—5000万人的省份抽取20个调查小区, 2600万人以下的省份抽取10个调查小区,西藏由于地广人疏的特殊地理条件单独划分为一层,抽取2个调查小区。对居住在入选调查小区的人全部进行调查。全国共抽取602个调查小区,调查了162940人,抽样比为0. 13‰。

    事后质量抽查的对象包括普查时应在该调查小区登记的常住人口和普查登记时不属于本调查小区的常住人口(即暂住人口)。对常住人口,先与该小区原普查表结果进行逐项比对得到两次调查不一致的地方;对接受过调查的暂住人口,汇总至省级普查机构与其原登记地进行联系比较,得到暂住人口在普查登记中的重登和漏登情况。通过两类人的比对,计算普查的遗漏率、重登率、性别差异率和年龄差错率。采用双系统估计方法估计调查遗漏人口,最终计算得出2000年人口普查净遗漏率为1. 81%。将上述四个国家人口普查事后质量抽查抽样设计汇总如表1所示。

  • 了解我们
  • 服务与支持
  • 工作时间
  • 我们的位置
  • 请认准本站唯一企业QQ:
  • 工作日周一至周日
  • 工作时间7×24小时制
  • 地址: