您的位置: 新闻动态 > 人口•卫生•健康 > 详情

基于大数据的人口流动轨迹研究

来源:《人口与健康》2020年第2期  添加时间:2020-04-23 10:00:01 点击:4274

  摘要:数据化时代人口流动产生了海量的大数据。本文基于百度地图慧眼迁徙大数据分析了2020 年1 月10 日到24 日从武汉迁出的人口去向,并比对了这些人口流入所在地的疫情分布,发现:确诊病例分布和人口流动分布基本吻合,从武汉流入人口多的城市,往往成为疫情严重的地区。因此,加强人口流动轨迹信息的监测,成为疫情防控的关键。


  关键词:大数据,人口流动,疫情扩散,新冠肺炎


  基金项目:国家社科基金重大项目“健康中国2030”综合评价指标体系建立与动态监测研究(19ZDA108)

  自2019 年12 月底爆发的新型冠状病毒肺炎随着2020 年春运的步伐由武汉向全国扩散。2020 年1 月23 日,中央果断对武汉进行隔离,并在全国大范围启动重大突发公共卫生事件一级响应机制,有效地阻断疫情进一步蔓延和扩散。由于这次疫情源头是武汉,在城市隔离之前从武汉流出的人口成为影响整个疫情发展态势的主要人群。根据1 月26 日武汉市市长介绍,在城市隔离之前大约500 万人口已经从武汉流出。这500 万人的去向成为影响整个疫情发展态势的关键。为此,本文重点对这500 万人口流动的去向进行分析,并与湖北省内和全国其他省份的确诊病例分布进行比对,由此研判全国疫情的发展态势,并提出下一步疫情防控的政策建议。

  本文从百度地图慧眼迁徙大数据(http://qianxi.baidu.com/) 中获得了2020 年1 月10 日到1 月24 日从武汉流出到全国各地的人口分布数据。百度地图慧眼迁徙大数据是百度公司基于百度地图APP的地理定位来识别人口流动迁移。凡是使用百度地图APP 的手机用户,百度就可以收集到其迁移数据。前瞻产业研究院的研究显示,2018 年我国手机地图用户规模超过7.2 亿人,根据2018 年中国主要手机地图APP 月活用户数据显示,高德地图和百度地图的月活用户数以绝对的优势领先于同领域手机地图APP,其中,高德地图以3.7 亿人稳居榜首,百度地图以约3.2 亿人排名第二。百度地图慧眼迁徙大数据平台提供了迁出目的地地图(见图1)和比例数据(即从武汉迁出到其他城市的人口与从武汉迁出总人口的比值),为我们分析人口流动和疫情扩散提供了基础数据。

1.png

  一、500 万人口流动轨迹及其影响

  这500 万人口究竟去了哪里?根据百度地图慧眼迁徙大数据显示,1 月10 日至1 月24 日间,从武汉流出的人口中有69.4% 在湖北省境内,其余30.6%的人口则流出湖北省外。因此,我们分别从湖北省内和省外两个方面来分析500 万流出人口的影响。

  (一)对湖北境内的疫情态势的影响

  从武汉流出但依然还在湖北境内的人口中,19.9% 在孝感,18.8% 在黄冈,9.4% 在荆州,7.2%在咸宁,5.7% 在鄂州,5.7% 在襄阳,5.4% 在黄石,其他城市占比均不到5%(见图2 蓝色柱)。截止到2020 年2 月14 日17:20 分,除了武汉外,湖北省内的累计确诊病例分布中,18.81% 在孝感,17.45%在黄冈,9.05% 在荆州,7.54% 在随州,7.03% 在鄂州,6.95% 在襄阳,5.90% 在黄石, 5.63% 在荆门,5.48%在宜昌,其他地市占比均不到5%(见图2 红色柱)。

  比对流入人口分布数据和确诊病例分布数据,我们可以得出三个基本结论:(1)确诊病例分布和人口流入分布基本吻合。从数据比对来看,从武汉流出到湖北其他地市的人口分布和湖北境内(武汉除外)的确诊病例分布基本吻合,流入人口占比高的地市通常确诊病例占比也高。(2)有些城市的疫情传播力强,值得警惕。随州、襄阳、鄂州和宜昌的确诊病例占比分别高于流入人口占比约1 ~ 3 个百分点,这可能意味着这些地市疫情传播可能比较快,值得重点关注。(3)有些城市的疫情可能还会有所增加。孝感、黄冈、咸宁的流入人口占比低于确诊病例占比,这意味着这些城市的确诊病例可能还会增加一些,当然也可能是因为这些城市的疫情控制得好,导致疫情的传播力不强。

  (二)对全国其他省市疫情态势的影响

  从武汉流出湖北到其他省份的人口中,有18.7%在河南,11.46% 在湖南,7.47% 在安徽,6.98% 在江西,6.39% 在广东,4.81% 在江苏,4.18% 在重庆,4.08% 在四川,3.62% 在山东,3.52% 在浙江,3.06%在河北,3.00% 在福建,2.83% 在北京,2.17% 在上海,其他省份占比均不到3%(见图3 蓝色柱)。而从全国疫情态势来看,截止到2020 年2 月14 日17点20,除了湖北外,全国范围内累计确诊病例分布中,10.62% 在广东,9.73% 在浙江,9.97% 在河南,8.32%在湖南,7.86% 在安徽,7.58% 在江西,4.99% 在江苏,4.48% 在重庆,4.40% 在山东,3.90% 在四川,3.52%在黑龙江,3.13% 在北京,其他省(市、自治区)占比均不到4%(见图3 红色柱)。

2.png

  对比武汉流出到其他省份的人口分布和湖北外疫情分布,可以得出两个基本结论:

  (1)疫情态势的关键省份已经出现。图3 显示,有两类特征的省份比较特殊:第一类省份是河南和湖南,这两个省份的流入人口占比明显高于该省份的确诊病例占比,这存在两种可能:一种可能就是流入这些省份的大多是农村的农民工,返乡后并没有引起较大范围的疫情传播;第二种可能就是这两个省份未来可能存在持续增加的风险。第二类省份是浙江和广东以及黑龙江,这三个省份的确诊病例占比明显高过从武汉流入的人口占比,这说明,这些地区人口流动频繁,疫情传播力强。

  (2)大部分省份的疫情分布与人口流入分布基本吻合。图3 显示,从武汉流入人口占比多的省份,比如河南、湖南、江西、广东等地,确诊病例占比较多,相反,从武汉流入人口占比少的省份,确诊病例占比较少。除上述提到的5 个省份(河南、湖南、浙江、广东、黑龙江)外,其他25 个省份的确诊比例占比和从武汉流入人口占比基本吻合,可以初步认为,在现有人口流动性不大的情况下以及当前强有力的疫情控制措施下这些地区出现疫情激增的可能性不大。

3.png

  二、基本判断

  比对人口流动数据和疫情扩散数据,我们发现,人口流动与疫情扩散紧密相关,成为疫情防控决胜的关键。通过数据比对可以发现,从武汉流出人口多的城市,往往成为疫情严重的地区。从武汉迁出的500万的人口流动链条来看,目前全国大致形成了以武汉为核心的疫情防控的三个链条:

  第一链条由湖北省内的其他地市(武汉除外)组成,这些地市的累计确诊病例之和仅次于武汉(原来比武汉多,后来随着武汉全面收治后,武汉确诊病例比湖北其他地市确诊病例之和多),是湖北省内所有累计确诊病例的三成,是全国的四分之一,这些地市的疫情防控成为整个疫情防控的关键。而整个湖北的确诊病例占了全国的八成多。因此,湖北是全国疫情防控的重点。

  第二链条由湖北省的邻近省份构成,包括河南、湖南、安徽、江西、重庆等,这些省份的确诊病例占湖北省外确诊病例的比例接近四成。从武汉流出到这四个省份的人口接近全部从武汉流出人口的一半,但是确诊病例并没有达到湖北省外确诊病例的一半,其中原因值得深入分析。

  第三链条由浙江、广东、北京、上海、山东等沿海发达地区组成,这些省份的确诊病例也接近湖北省外确诊病例的三分之一。不过,从武汉流出到这四个省份的人口只占了全部流出人口的比例不到二成,这说明,这些地区的人口流动频率高,疫情扩散和传播力强,是疫情防控的关键。

  其他20 省份(不含湖北)则是介于第二链条和第三链条之间,这些省份确诊病例合计占了湖北省外确诊病例的三分之一。从武汉流出到这20 个省份的人口占了全部流出人口的三分之一,与确诊病例占比基本一致。这说明处于第二链条和第三链条中间的20 个省份的疫情相对稳定。

  三、政策建议

  在春节假期早期,中央对疫情扩散实施了强有力管控,并充分发挥群众在联防联控和群防群控中的作用,有效地控制了疫情地进一步扩散和蔓延。目前取得了阶段性成效,应该继续加强管控。为了取得疫情防控的决定性胜利,结合对未来趋势的研判,提出如下疫情防控的政策建议:

  第一,突出重点,分区实施疫情防控。根据人口流动和疫情传播的规律,实施分链区防控的策略:首先,对疫情源头(武汉)患者的全面排查和重点救治。尽快对留守武汉的900 万人进行全面排查,并动员全国资源支援疫情源头的疫情防控,集中全国顶级专家攻关新型冠状病毒肺炎特效药的研发,尽快从源头上控制疫情传播。其次,重点加强对疫情传播的第一链区(湖北省内地市)的疫情防控。湖北省内地市的疫情是整个疫情防控的重点,也是疫情防控的关键。除武汉外,湖北省内其他地市累计确诊病例之和比湖北省外的其他省市累计确诊病例之和还多,湖北省内地市成为疫情扩散的关键。从全国来看,湖北省的确诊病例占比超过八成。湖北疫情防控是全国疫情防控的重点。第三,高度重视对第二链区(湖北邻近省份)的疫情防控。这些省份从地理位置上距离武汉和湖北较近,而且从武汉流出的人口较多。要防止疫情从第一链区向第二链区扩散。第四,严密防控第三链区(东部沿海发达地区)的疫情。考虑到第三链区人口聚集,疫情传播快,这些地区的扩散或传播力度和范围均比较强。要考虑采取错峰复工的策略,在现有假期延长的情况下,企业复工采取错峰的方式,避免人口流动造成疫情扩散。全国大中小学的学生尽量最后返校,全面采取网络授课的方式。等疫情彻底扭转和天气转暖后再让学生返校。

  第二,加强对人口流动轨迹的监测。这次疫情防控的关键在于对人口流动轨迹的掌握。尽管我们可以通过手机信令数据来全程监测人口流动的轨迹,但是对于特定人员的伴随人群的监测不够。从这次疫情来看,确诊病例出行轨迹中的伴随人员的监测成为整个疫情防控成败的关键。在这次防控中,我们可以区分出ABCD 四类人群:A 是从武汉或者湖北省流出的人群,B 是A 类人群在流动过程中接触到的人群,而C 类是A 类人群最终接触到的家庭成员和亲戚朋友,D 类人群是未被A 类接触的人群。目前的人口流动监测体系,A 类和C 类人群较容易获得,而B类和D 类人群是最难掌握的,而且因为B 类人群再度传染的B2 或者B3,乃至Bn 人群是现有监测体系的空白。但是如果人人都有自己的出行和饮食轨迹数据,那么,B 类人群则相对较容易识别。因此,未来要加强人口流动的轨迹数据的监测。

  第三,加强对疫情传播力的研究。现有数据表明,有些省份(比如河南)的疫情传播力可能较弱,而有些省份(比如浙江和广东)的疫情传播力较强。造成这些传播力差异的原因可能是多方面的。既可能是疫情管控措施上的差异,也可能是病毒携带者的城乡差异,比如从武汉流入河南省的人口大多是农村居民,那么居住在农村的传播力可能相对弱些,而在广东和浙江的病毒携带者可能是城市居民较多,由此导致疫情传播力较强。当然,疫情传播力的差异可能更为复杂,可能与公共交通、人口规模、生活实施、自然气候等因素都有关联,因此需要综合多方数据来分析验证。(黄匡时、贺丹,中国人口与发展研究中心)