中国的集中供暖政策让北方人寿命减少了吗?
郭骏
Chen et al. (2013) 发表于《美国国家科学院院刊》(PNAS)的论文“Evidence
on the Impact of Sustained Exposure to Air Pollution on Life Expectancy from China’s
Huai River Policy”研究了中国空气污染对健康的影响。文章通过断点回归模型估计
了空气污染和预期寿命的因果关系。文章认为中央集中供暖导致了淮河以北的城市
的总悬浮颗粒物浓度极大提高和预期寿命显著减少,这项政策使北方人平均寿命减
少 5.5 年。作者总结,中央集中供暖政策对人的健康有灾难性的影响(原文
“disastrous consequences”)。
这篇文章发表后在国内外受到广泛关注。在几天内,《自然》杂志,《纽约时
报》,《洛杉矶时报》,《华盛顿邮报》,《卫报》,《Fox 新闻》,《CNN》,
《路透社》,以及其他 200 多家国际主要媒体报道了文章的研究成果。在中国,关
于这篇文章的讨论几乎可以在所有主要媒体和社交网络上找到。
然而,这篇文章存在几个较为严重的数据和方法上的问题,导致结果并不可信。
文章不正确地对城市样本分组,运用了不恰当的研究设计和计量方法,并给出了有
误导性的研究结论。
一、样本分组
Chen et al. (2013) 断点回归模型的关键假设是:秦岭-淮河线将中国的城市分为
两组,一组在秦淮线以南,一组在秦淮线以北。秦淮线以南的城市没有中央供暖,
秦淮线以北的城市有中央供暖。然而,文中地图上的分界线并非秦淮分界线。
图 1. 秦岭-淮河分界线
图 1 是原文所用的地图,黑色实线用于做南北分界。然而这条线并非供暖政策
的淮河分界线。淮河位于文中的黑色线上方,大约 3 个维度的距离。地图上的红线
标示了秦岭淮河的大概位置。文中地图被向左旋转了一个角度,导致黑色线看起来几乎是水平的。实际上红色线应该是大致水平(东西向)。由于断点回归的结果严
重依赖于分界线周边样本的情况,错误的分界必然导致结果有误。
在进行城市样本复查的过程中,我们还发现本文使用的坐标也可能存在问题。
在这篇论文正式发表前的工作论文稿中,地图标示了更多城市名称。例如,在图 2
中,洛阳被标示在郑州东边,实际上洛阳在郑州西边。如果本文的坐标也有误差的
话,在匹配健康数据和空气质量数据的时候,可能存在更多的错误。
图 2. 局部城市样本
左图来源:Chen et al. (2011);右图来源:Google Map.
不准确的分界线可能导致的影响如图3和图4所示。我们把黑色0度线往右移动3
度左右,对应实际上的淮河线(红色)。样本中的若干城市现在被分组到了南方。
在红色线两侧,我们发现不论是总悬浮颗粒的浓度,还是预期寿命都没有明显的跳
跃。原文很有可能高估了该政策对健康的影响。
图 3. 淮河两侧总悬浮颗粒浓度比较 图 4. 淮河两侧预期寿命比较
根据我们的分析,该研究中发现的显著性结果可能主要来自于上海及其周边城
市。这些城市在文中被分组到正好位于黑色线下方的区域中。这些城市属于中国最
高收入的几个城市,临海且人口数量较大,同时拥有较好的空气质量和较高的预期
寿命,并不能代表淮河以南的大多数城市。
二、断点回归模型
为了估计供暖政策对人均寿命的影响,Chen et al. (2013) 估计了以下模型: = + + ( ) +
(1)
其中 是城市 的预期寿命, 表示城市 是否处于北方(享有集中供暖), ( )
是一个关于纬度的多次函数, 为城市 与淮河线的纬度距离。
该断点回归模型利用了全局多次函数拟合方法进行断点回归模型估计。多次函
数 ( )被用来拟合人均寿命和纬度之间的关系。这一模型强制函数 ( )在断点处
连续, ( )的斜率在断点处必须相等。带来的问题是,断点左侧的样本量会显著
影响断点右侧的拟合曲线,反之亦然。如果预期寿命与纬度之间的关系在南北方是
不相同的话,该模型会给出有偏的估计 。 同时,强制南北方使用同一函数关系
( ),会导致 的估计受具体函数形式的影响。如果换一种拟合方法,就会得到
非常不同的结果。例如,在原文中,如果作者只用一次函数做拟合,南北预期寿命
的的差异只有 1.62 年,并且效果不显著。
一个更为合理的估计方法是:
= + + + ( ) +
(2)
其中 ( ) 也是一个关于纬度的一个多次函数。与式(1)相比,式(2)加入
了交叉项 ( )。交叉项允许我们分别对南北进行预期寿命与纬度的拟合。 的
估计也更不易受到具体函数形式的影响。
图 5 中,我们将原文中位于淮河线右侧的总体悬浮颗粒拟合曲线往下移动并接
到左侧,我们发现两侧曲线在结点处斜率相同。图 6 中,我们将淮河线右侧的预期
寿命曲线往上移动接到左侧,也得到相同的结果。在断点右侧附近区域里,随着离
淮河线距离越来越近,预期寿命曲线在不断下降,而这种下降趋势很大程度上是受
固定的函数形式 ( ) 以及在断点左侧附近的城市影响的。换句话说,如果我们分
别对淮河两侧的不同样本进行拟合的话,结果会非常不同。从图 4 中绿色圆圈的分
布上看,如果使用更加恰当的模型,式(2),期望寿命的差别将会减小。
图 5. 总悬浮颗粒浓度拟合曲线的移动 图 6. 预期寿命曲线的移动
该研究还用两阶段回归估计了总悬浮颗粒对预期寿命的影响:
= + + +
(3)
= + + ( ) +
(4) 为了得到无偏的估计,必要条件是在经过 的拟合以后, 捕捉到的空气
污染差异完全是南北暖气政策造成的。这个条件在现实中是不成立的,即使研究者
将样本完全限制在秦岭淮河两边的城市上。
要解释这个问题,就要回到关于研究设计的讨论上。文章作者认为,暖气政策
按照秦岭-淮河线进行划分是政府任意独断的(原文“arbitrary”) 。因此在这条线
两侧的城市,除了这个政策差异外,其他社会经济变量应该都是连续的。这样的假
设并不成立。首先,在淮河流域,淮河本身并不能阻挡空气污染的流动。虽然淮河
两岸城市的社会经济变量可能是连续的,但淮河南岸城市与北岸城市的空气污染不
可能完全被隔离。更重要的是,在秦岭附近,虽然秦岭能够很大程度上阻隔空气污
染的跨区域流动,但很多其他影响因素就不再连续。秦岭对南北城市的气候、农业、
水系、土壤的影响巨大。与秦岭北边的城市相比,秦岭南方城市有更多的降雨量,
更高的气温,更多的暖风。 这些因素不仅会造成南北空气质量的显著差异,也可
能直接影响人的健康状况。实际上,秦淮线同时也是水田旱地分界线,水稻小麦种
植分界线, 亚热带气候与温带气候与分界线。正是这些显著的地理、气候和环境
差异,让这条线成为了中国传统上的南北分界线,因此国家供暖政策对城市划分并
不是任意独断的。该研究设计本身的合理性有待商榷 。而文中并未对秦岭南北这
些重要的地理、气候、环境差异进行深入讨论并加以控制,导致该文无论是对供暖
政策影响的估计,还是对总悬浮颗粒影响的估计,都是不可靠的。
三、结果的解释
断点回归模型只是局部有效的。在研究因果关系时,我们通常用反事实
(counterfactual)来形容某个体如果没有受到某个政策影响会发生的情况。例如,
我们会问,如果北方城市没有供暖的话,可能出现的情况是什么?这篇文章忽略了
断点回归模型的局部有效性,将结论推广到全国范围,并错误的认为中央集中供暖
政策导致了 25 亿年的生命损失。
总体来说,南方城市的人均寿命并不是北方城市人均寿命的一个很好的反事实。
北方冬天寒冷,如果没有中央集中供暖系统,大多数家庭(1980-2000s)将自己烧
煤取暖。这样不仅成本更高,还会导致严重的室内空气污染与室外空气污染。室内
空气污染通常比室外空气污染对健康的损害更大。实际上,更加合理的反事实推测
是,中央集中供暖提高了北方人的人均寿命,因为如果没有这套系统的话,将会有
更多人死于更加严重的室内空气污染。在研究使用的数据中也证实了这一点,北方
人平均预期寿命比南方人高 1 岁。
综上,该研究可能错误的将城市进行了分组,使用了不恰当的计量模型和研究
设计,并给出了有误导性的结论。过去几年有很多关于南方城市集中供暖问题的讨
论,网上的投票表明大多数长江以北城市的居民都希望政府能够提供供暖系统。这篇研究传递给公众的错误信号是,如果政府提供供暖系统的话,预期寿命会降低
5.5 年。
空气污染对健康的影响是一个重要的研究课题,准确的估计出空气污染的社会
成本,是国家制定相关政策的基础,希望将来有更多的科研人员加入到该项研究中
来。
参考文献:
Chen, Y., Ebenstein, A., Greenstone, M., & Li, H. (2013). Evidence on the impact of
sustained exposure to air pollution on life expectancy from China’s Huai River
policy. Proceedings of the National Academy of Sciences.
Chen, Y., Ebenstein, A., Greenstone, M., & Li, H. (2011). The long-run impact of air
pollution on life expectancy: Evidence from China’s Huai river policy. Working Paper.
有话要说...