Pocket Readings

个人阅读清单记录博客

0%

人口数据再剖析

微信号 datacomehere 功能介绍 数据在手,天下我有! 昨天我讲了一下国家统计局新鲜发布的人口普查数据之中存在的逻辑冲突,希望能有人为我解惑,但是很可惜,至今为止没有看到合理的解释。这篇文章大家现在也看不到了,



Tags:



via Pocket https://ift.tt/3fbqdbF original site



May 12, 2021 at 06:52PM

Comments


from: github-actions[bot] on: 5/12/2021

人口数据再剖析 by 数据归集处

2021-05-12
昨天我讲了一下国家统计局新鲜发布的人口普查数据之中存在的逻辑冲突,希望能有人为我解惑,但是很可惜,至今为止没有看到合理的解释。这篇文章大家现在也看不到了,这是意料之中的事。今天我们继续来分析一下。没看过昨天的文章也没关系,今天这是全新的一章。

首先,我们必须对现在的人口普查技术,有清晰的认识。这次人口普查,事实上就是在公安部门的电子户籍信息的基础之上,进行的普查,也就是我们号称的电子普查。截个相关新闻的图给大家看看。

事实上,我大中国的户籍信息电子化已经实现超过6年了。近年来相关相关信息系统不断的完善,身份证重号的现象也都逐步予以了解决。可以说,现在不在户籍信息系统里的人,已经非常罕见了,误差率不会超过千分之一。即便在偏远山区的小村落,伴随着我国基层党组织工作的强化,以及扶贫工作的全面开展,入户也成为了最基本的要求,生了娃不落户的现象,已经几乎不存在了。这么说吧,今时今日除非你自己一家人呆在深山老林里做野人,不属于任何社会组织,也不跟外界发生任何商品交易,不然但凡你生了娃敢不去落户口,村支书会让你精准的认识到马王爷为啥生了三只眼。所以,第七次人口普查的技术难度其实是很低的,在很多地区,都是通过短信等电子方式完成的普查,其实只是对户籍电子信息进行了一次再确认而已。

理解了这一点,我们才能更加深刻的理解,事实上, 现在人口普查工作的意义已经不大了。现在不比十年前二十年前了,现在每个人的信息都在系统里了。如果国家统计局出来放话说,现在还有数以千万计的人口不在系统内,要靠统计调查队的人挨家挨户钻山沟走树林把这些人找出来,公安部门能跳起脚来骂人。实在需要进行入户调查的,主要也就是搬迁人口,比如老蛮我这种,前年在深圳工作,去年调广州,今年又调广西,说不定明年又调去哪里了。这种情况需要两地统计部门予以协调,不要搞出重复统计,但是遗漏的可能性是不存在的。如此而已。

在昨天的新闻发布会上,国家统计局给出了几个很有趣的数据:从2018年以来人口出生数持续走低,2020年出生人口的大数是1200万。相关新闻的附图如下:

我这里先说明一下,2020年的出生数据只在新闻发布会上提了一嘴,在人口普查公报里并没有发布。我们在这里就相信这个口头数据好了。现在我们可以开始做计算题。2020年普查结果,总人口规模为141178万,扣减2019年的总人口140005万,增量为1173万

各位,你们必须清晰的认识到,人口增量不是凭空而来的,它是当年度的出生人口-死亡人口而来的。2020年我国出生人口的大数是1200万,人口增量1173万,所以2020年我国的死亡人口数=1200-1173=27万。这是什么意思????

为了进一步说明这个问题,我把1990年至今的人口出生和死亡数都放出来,并把2020年的数据放进去,形成了下表的数据。

对于2020年只死亡了27万人的事情,我实在不知道应该怎么分析。这大概是由于去年的新冠期间大家特别注意养生吧,呵呵。

此外,国家统计局在昨天下午对于数据上的逻辑不自洽给出了一些解释,比如此前年份的数据是抽样调查数据,有些人口遗漏的情况。事实上户籍信息电子化之后,抽样调查已经足够精准了,不过这个事我们就不多纠结了。那么,到底是哪些年的数据失真呢?

人口增量从来都不是凭空而来的,它一定是出生人口-死亡人口而来的。一个非常重要的信息是:国家统计局在新闻发布会明确说明了2016-2020年的人口出生数,也就是说,国家统计局并不会再上修这些年的出生数据。那么,如果少算了此前年份的人口增量的话,唯一的可能性,就是多计了近年来的死亡人口

真是天可怜见,我国的人口死亡数据,那是真没有多计的可能性。这个数据是卫生部门和公安部门的汇总数据,是以“死亡证明”为基础的。它有可能会漏计部分偏远地区的死亡,但是绝不会多计,更不可能出现千万计的多计。你说卫生部门没事多开上千万张死亡证明是图什么啊?存在这种可能性吗?

所以,我个人实在是不能理解,这凭空冒出来的千万级的人口增量,到底是哪里来的?它总归一定是人口出生数-死亡数的结果。人口出生数不会再上修了,死亡数里存在泡沫的可能性更是微乎其微,那这到底是怎么回事呢?我特别希望,我大中国除了我之外,还能有另外的数据大咖,把这个数据逻辑解释清楚,解决我这个微不足道的小疑惑。谢谢了。