全国返城复工进度如何?

澎湃新闻 2020-02-18 19:09 大字

作者:李   丁 中国人民大学社会与人口学院副教授,中国人民大学国家发展与战略研究、中国调查与数据中心研究员; 

何凌锋 中国人民大学社会与人口学院本科生

新冠疫情不断增长的确诊数和死亡数令人揪心,何时是个尽头,啥时能全面复工复产,经济后果如何,同样让人担忧。武汉疫情爆发,中央作出指示后,各地都出台了非常严格的防疫措施,大多数人都度过了一个居家隔离的假期。春节假期结束后,各地复工复产的政策相继出台,对企业复工复产提出了要求。但很多地方政府的工作重心仍然放在疫情防控上(网上流传的一个“地方官员纳什均衡分析”以及社会学关于中国制度下过度执行的分析很能说明问题),加上防护物质供给不足,很多企业无法满足复工条件,实际复工进度不如预期。各地复工复产实际进度如何呢?相信根据交通、电力等系统提供监测数据,中央已掌握基本情况。在本报告中,我们将利用公开的、相对比权威和适时数据,估算全国地级行政单位的返城复工进度,让各级官员和公众对全国经济社会生活的恢复进度有所了解。

一、数据来源与说明

本文所用数据来自百度慧眼迁徙地图数据(http://qianxi.baidu.com/)。百度通过安装在智能手机中地图应用采集用户的一些时空迁移数据,并生产了不少增进社会价值的公共报告,为我们了解城市活力,交通状况提供了有价值的信息。在迁徙地图中,百度提供了2019年和2020年春节期间全国各个地级城市迁入、迁出人口、以及市内出行强度的可比数据。而且提供了迁入人口的来源于各个省份、前100个地级市的比例,迁出人口去往各个省份的占比以及前100个地级市的具体比例。时间跨度为2018年腊月初七到2019年正月二十五日,以及2019年腊月初七到2020年正月二十五(本文抓取的为到正月十八日的数据),两个年份的数据以春节对齐,两个年份的周六、周日无法对齐。

根据百度提供的文档资料,该数据具有很强的可比性和内部一致性。虽然平台提供的数据并非出行的绝对规模,而是通过清理计算的相对规模,但在不同地区之间、不同日期之间具有可比性。其中,市内出行强度为市内有出行的人口占城市居住人口的比值。其中城市居住人口为在一个城市居住3个月以上,综合了定位属性、画像、定位时间、poi属性挖掘出来的人口数,在一定时间内固定的。总之,百度提供的这一数据具有高度的可比性(由于疫情尚未结束,我们也呼吁百度延长今年数据的观测期,并持续公开发布这一数,可参照本文构建更多有意思的指标,此次疫情期间的大数据以后可为学界展开县市层面的研究提供难度的宏观层次数据)。

根据最新的数据,截至2020年2月14日,无论是从迁入迁出还是市内的出行强度,对于各个大城市而言,大家担心的返工潮并没有到来。北京市2019年正月初七之后平均出行强度相对于正月初七之前的一周就要提高80%以上,但今年只提高了4.7%,上海对应的数字是分别为98%、4.4%;北京市正月十五之后出行强度相对于初一到初七的强度是142%,上海为152%,去年对应的数据为204%、221%,要知道今年因为初一到初七的出行强度因疫情影响只有不到2019年的70%。

图2:百度慧眼-百度迁徙页面

图2:百度慧眼-百度迁徙页面

二、春节出行的一般规律

在正常年份,一个典型的人口流入地(如北京、上海、广州、深圳的一线二线城市)春节前会有超过平常流出人口规模的人口流出(返乡过年春运人流),而春节后会有,则会有超出常规规模迁入规模的流入人口(返城复工春运人流)。2020年,新冠肺炎疫情发生时,大量人口已经离开城市返乡过年,全国居家隔离,村居封闭,导致节后商务、旅游迁出人口下降,与此同时返城复工人流则难以增长。

 ?图3:典型人口流入地春节期间的迁出-迁入模式

?图3:典型人口流入地春节期间的迁出-迁入模式

?图4:北京、上海、深圳及武汉春节期间人口净迁入模式

?图4:北京、上海、深圳及武汉春节期间人口净迁入模式

一个典型的人口流出地(大量中西部地区的区县,如湖南邵阳),在正常年份春节前会有大量的返乡过年人口回来,迁入规模超出平常迁入规模(常规性商务、旅游人口),而春节后会有大量人口外出,形成外出务工、就业的春运人口,同时会有一定的人口流入。

2020年情况因肺炎疫情变化,大量返乡人口回家过年,但在年后无法外出务工,出现迁入人口年后持续下降,而迁出人口难以增长的情况,工人和学生难以恢复正常的工作和学习,社会经济遭遇巨大影响。图5:典型人口流入地春节期间的迁入-迁出模式

图5:典型人口流入地春节期间的迁入-迁出模式

 多数地区的模式可以归为上述两个类型,但是也存在一些其他情况。比如,受汉族新年影响小的新疆地区的很多城市春节期间迁入和迁出并没有如此鲜明的特征,相对比较平稳。旅游城市如桂林、阿坝州,春节期间流入的人较多,节后流出的人较多。同是人口流入地,民营非正规更经济发达的温台地区,春节前人口外流的时间更早,而春节后人们返工的时间更晚一些。腊月二十一即达到返乡高峰,正月十五之后的返城高峰明显。具有其他地方所没有的灵活性。

图6:温台地区有着更长的假期

图6:温台地区有着更长的假期

此外,还有大量人口流动的“中转”地区,这包括大量中西部地区的二线城市。它们既是周边人口流入的重要目的地,春节期间走动的目的地,也是去往其他更大城市的中转或起点,比如河北石家庄、山西吕梁、宁夏固原、江西南昌。湖南邵阳有部分如此。这类地区春节期间仅除夕人口外出较少,其他时间都有大量人口流出;?图7:人口流入-流出中间地春节期间的迁入-迁出模式

?图7:人口流入-流出中间地春节期间的迁入-迁出模式

春节作为特殊的日子,市内出行强度会有所变化。此外,春节城市间的人口迁移变动会使得春节市内出行强度发生对应的变化。这里出行强度的分子是市内有出行的人口规模,是一个实时数,而分母是一个城市的常住3个月以上的居民数,是一个相对稳定的数。平时的人口流入地春节期间大量人员回家,实际人口减少,出行强度相对于平时会有较大下降,出现过年期间空城或冷清现象。而平时的人口流出地,春节大量人口返乡,实际人口比平时的常住人口更多,春节期间出行人口规模相对于平时的常住人口规模取值会比较大。对比北京和湖南邵阳,春节期间的出行强度可以给大家很直观的感受,前者春节变得很冷清,而后者春节相对于平时很繁忙。图8:典型人口流入地和流出地春节期间的市内出行强度模式对比

图8:典型人口流入地和流出地春节期间的市内出行强度模式对比

根据上述年前年后的城市间出行数据,以及城市内部的出行强度数据,我们可以构建合适的指标测量各个地方的年后返城复工的进度情况。因此,复工的第一步是劳动力返回长期工作的城市,尤其当中国城市劳动力相当部门来自农民子女(包括农民工和农村出来的获得城市户籍的新市民)且他们都有回家过年的风俗习惯时。疫情防控后,这些人尚未从老家返城工作的城市,如果他们无法通过线上办公的方式完成以往返城情况下完成的工作,生产就很难恢复起来。考虑到现代经济分工越来越细,返城进度不行,复工进度肯定会受影响。当然,返城或市内出行与复工的概念无法完全对应的 。因为各个城市还有不少留守人口,而且即便返乡人口都回城了,复工政策松紧程度不同也会影响实际复工情况。但这些指标与实际复工之间的相关度一定非常非常高。

三、返城复工指数构建方式

依据人口迁移数据,我们可从人口流入地和流出地两个角度衡量返城复工情况。一个地方作为人口流入城市,春节后返城人流状况反映社会经济恢复正常情况,有两种定义方式:

第1:用2020年正月初一后累计流入规模除以2019年正月初一到正月二十五日的累计流入规模的70%的比值(bkrc19ain)。

第2:用2020年正月初一后累计流入人口规模除以年前腊月初七到除夕的流出人口的规模的70%(bkrc20bout)。

对于人口流出地来说,其定义的方式为:

第1:用2020年正月初一之后累计流出规模除以2019年正月初一到正月二十五日的累计流出规模的70%的比值(otrc19aout)。

第2:用2020年正月初一以后流出人口规模除以年前腊月初七到除夕的流入人口的规模(otrc20bin)。

任何城市即使人口流入地也是人口流出地,因此两个指标都有参考价值。对人们常说的主要人口流入地,可主要看流入指标,而对于人口净流出地可主要看流出指标(操作定义上,可将2019年春节前净流出为正数而春节后净流入为正数则为人口净流入地,其他为人口流出地)。上述两种定义方式中,第一种定义方式假定各个城市2019年和2020年回乡或返城的规模类似,用2019年的规模衡量2020年的进度,2019年的春节流量中70%是外出务工或返城务工的人;第二种定义方式无需假定2019年和2020年的相似性,但他假定年前流出(或流入)人口大部分(70%)是返乡人口,而他们年后通常都会再次外出。这些假定虽不完全成立,但大体反映实际情况。需要说明的是,使用年前年后的净流入人口构建返城指标会出现测量偏差,特别是那些流入量和流出量都很大,而净流入量不大的城市(有朋友使用了这种测量方式)。本报告作者在尝试之后,暂时放弃了使用净流入流出规模进行指标构建的方案,而使用了分别流入、流出进度测量的方案,避免误导决策。图 9 几个返城恢复程度指数的相关性情况

图 9 几个返城恢复程度指数的相关性情况

市内出行强度的恢复情况更反映市内生活恢复正常的程度。正常情况下,市内出行不仅包括上下班的通勤,也包括大量的就医、购物、游玩交通。2020年因为疫情影响,后面这些出行也大大下降了,而不得不工作的人必须出行,因此实际开始工作的人的比例会比出行强度恢复的情况要乐观一些。对于以往的人口流出地,今年春节后由于大量人口未能外出打工,隔离在老家,即便就医、购物、游玩交通下降了,人口基数会比百度估计的居住人口要多,计算出来的出行强度也会比较大,从而高估当地恢复正常的程度。也就是说这一指标会低估流入地复工情况而高度流出地复工情况。我们需要对各地实际人口规模以及当前出行中务工出行的比例进行适当修正(限于时间和数据,这里我们仅根据前述迁入迁出数据对春节期间的实际人口规模进行了适当修正)。此外,百度城内出行强度为出行人数与市内居住常住人口的比值,由于居住人口是一个相对稳定的量,但由于百度数据覆盖率提高、社会经济的发展等原因,各个城市2020年的出行强度比2019年普遍有提高,达到去年同期120%。因此,所谓的恢复正常既可以是2019年的水平,也开始恢复到如果没有新冠肺炎情况下2020年的反事实水平。据此,我们构建了如下四套指标:

A: 2020年正月初一之后的平均出行强度相对于2019年初一后的平均出行强度的比值(rate19,修正两年年前平均强度差后为rate19_2)。

B: 2020年正月初一到正月初七为止的平均出行强度相对于2019年正月初一到正月初七日的平均出行强度比值(b7rate,修正两年年轻平均强度差后为b7rate_2)

C: 2020年初八到正月十八为止的平均出行强度相对于2019年正月初八到正月十八日的平均出行强度比值(a7rate,修正两年年轻平均强度差后为a7rate_2)

D:2020年正月十六到正月十八为止平均出行强度相对于2019年正月十六到正月十八日的平均出行强度比值(a15rate,修正两年年轻平均强度差后为a15rate_2)

主要指标测量的结果具有高度的相关性,正月初七前的各个地方的出行强度与初七之后的相关性不大,具体结果如下:图10 几个市内出行强度恢复程度指数的相关性

图10 几个市内出行强度恢复程度指数的相关性

 

基于城市间人口流动和市内出行强度建构的指标存在

表1 返城指标与市内出行强度指标的相关性

 四、从返城进度看复工进度

计算结果显示,截止2月15日(正月廿十二),全国主要城市返城情况并不乐观,相比去年同期,尚有60%到80%没有返城,武汉90%以上没有返工。

相对于年前流出人口规模,返城情况目前最好的是沈阳、重庆、程度、昆明、长沙、南宁、合肥、上海、厦门、青岛、贵阳、惠州等城市,返城率可能已经得到四成以上。

从年前流入人口规模来看,主要人口流出地(2019年年后净流出人口规模前30的城市)年后外出的情况较好的包括南州、梅州、盐城、邵阳、达州、衡阳、永州等,可能已达到去年同期水平的一半以上(因为将去年的流量打了7折,因此保守估计在35%以上)。

 表2 常见人口流入大市的返城进度和主要人口流出市外出进度 

主要人口流入地的返城率展示在地图上,如下图。可以看到,成都、上海、珠三角和山东半岛的返城情况好于苏南、京津、浙江地区,但返城率都在50%以下,浙江和湖北的情况很糟糕,返城率在两成以下。

图11 主要人口流入市返城进度情况

图11 主要人口流入市返城进度情况

从人口流出地看,东北和内蒙、四川、云南、湖南、广东省、苏北内流出地的外出复工情况相对较好,不少地区在五成以上;湖北、江西、河南、甘肃、陕西等等省份外出复工的情况不是很好,不少县市在三成以下。

图12 人口流出地2020年春节后人口外出情况

实际上,每个地区既是流入地也是流出地。从流入角度看,各个地方的人口返城进度如下图所示。和流出复工模式类似,东北和西南远离疫情中心的地区以及湖南、广东地区流入情况相对较好,而武汉、江西、浙江、华北地区的情况不太好。图13 相对于年前的人口流出各地人口回流进度

图13 相对于年前的人口流出各地人口回流进度

五、从市内出行强度看复工进度

市内强度反映的复工进度结果与上述结果类似。由于四个指标具有较强的一致性,我们使用正月十五日后的出行强度相对于2019年的比值(调整年前基准出行强度水平后)进行描述。从结果来看,西南地区、湖南、广东非珠三角地区市内交通强度恢复水平明显较高,这与当地春节大量人口返乡,人口基数相对于平时的常住人口较多有一定关系。浙江、京津冀、珠三角、苏南、湖北、河南、新疆等省市市内出行强度恢复水平较低,这与当地尚有大量务工人员尚未返回有关。

 图14正月十五后各地市内出现强度相对于2019年同期恢复情况

从具体城市来看,上海、北京、东莞、广州、南京、无锡、成都等城市的恢复情况较好,达到没有新冠疫情状况下的三成以上。惠州、厦门、济南、青岛、昆明、长沙、沈阳、南宁等城市出行强度比前述城市更强,达到四成以上(可能受大量外出人口未外出增加出行强度,实际复工率待考察)。

 表3 常见人口流入大市市内交通强度恢复程度 

六、初步结论和建议

依据百度出行数据,复工开始一周后,全国实际复工情况整体并不乐观,除疫情严重的湖北地区外,浙江、江西、河南、河北、新疆、黑龙江、苏南部分城市,返城及复工的进度相对较缓。采用不同的定义方式,具体水平有一定差异,但总体结论相差不大。上述指标可以与其他途径的数据相互验证,例如电力的大数据结果显示,浙江地区复产率达到25%左右,温州台州的情况相对更差一些,只有百分之十几。我们这里计算的结果类似,有些相对更高一些。未来两周的复工情况值得进一步跟进。

目前的复工情况与各地实际发生的新冠肺炎案例具有一定的相关性。但即便在类似的疫情下,各个地方复工情况仍存在较大差异。湖南和江西的疫情差不多,湖南复工情况较好,虽然江西复工的新闻和政策叫得比较响亮。河南和安徽的疫情类似,安徽的复工情况似乎要更好一些。四川、贵州、云南的疫情都不太严重,但四川和云南的复工情况明显好于贵州。地方政府和民众还是具有一些能动性和灵活性的。疫情不太严重的地方应该将取消复工行政审批制度,工厂如果出现聚集性疫情,政府应该给予帮助照顾,分担风险和损失,而不是责罚。

除了湖北外,需要特别提及的是,民营经济大省浙江的复工情况不理想。这与浙江的疫情和严格的控制有一定关系,但也可能也和经济结构有关。数据显示,温台地区正常年份春节假期就更长更灵活,复工比一般的地区更晚一些。这种灵活性可能也体现在工人与企业的劳动合同上,签合同或签固定合同的工人可能相对较少(需要找数据验证),从而使得春节安排更为灵活。这种灵活性在疫情发生后也体现为劳资关系约束力不够,大量外地工人在老家观望的情况,为企业复工带来困难,出现规上企业复工数占比高于产能恢复进度的情况。与此同时,由于藏富于民,大量小微私营企业难以满足复工条件而无法复工,这些企业纳税不多,平时和疫情发生后都较难以获得政府实质性支持和帮助,更需关注。对于浙江而言,尽快控制疫情,落实复工政策和防护措施,才能让企业和工人安心复工,让这几年因“三改一拆”、城市更新、劳动力外流、贸易战等原因本已有所下滑的经济形势停止进一步恶化,否则影响深远。

 

图15 各市新冠肺炎感染人数对数分布情况

感谢百度收集并开放上述相关数据,建议可进一步开放县市层面的宏观汇总数据,例如常住人口规模数据,为进一步深入研究提供条件。由于今年的复工复产尚未完成,建议百度慧眼延长今年春节数据的采集,并与往年对比。未来可通过直接公布汇总数据表和数据库的方式,方便公共部门和学者使用。这样,我们学者就不需要写爬虫,反复爬取平台数据了

在信息社会,公开可获取的、机器可读的数据可大大提高知识生产效率。互联网公司作为先进生产力的引力者,可带头建立数据开放共享的典范,让统计局、卫计委等政府部门在公开信息时有参照标准(它们的数据公开还有很多不敢恭维的地方,不仅公开程度不够,数据格式也非常不适应当前的科研需求),引领在技术和意识上都相对落后的政府部门一起进步。

我们将继续采集相关数据关注和研究复工进度,并与之人口迁移流动、疫情、地方社会经济状况结合起来进行深入的分析,并在适当的时候在github上分享相关代码和数据。各地级市复工指数通过阅读原文从百度云盘提取,提取码密码:u9hh。

本文以获得作者授权转载上传。

新闻推荐

“汶川感恩您,武汉要雄起”

“汶川感恩您,武汉要雄起”7万公斤汶川感恩蔬菜运抵武汉村民和志愿者正在武汉装卸蔬菜。□本报记者徐登林文/图2月5日...

阿坝新闻,新鲜有料。可以走尽是天涯,难以品尽是故乡。距离阿坝再远也不是问题。世界很大,期待在此相遇。

 
相关推荐

新闻推荐