利用基于卫星遥感的高精度PM2-5浓度预测分析济南市空气污染.pdf

pdf,PM2,济南市,空气污染,高精度,研究报告
文档页数:48
文档大小:4.74MB
文档格式:pdf
文档分类:研究报告
上传会员:
上传日期:
最后更新:

PlanetData 利用基于卫星遥感的高精度PM2.5浓 度预测分析济南市空气污染 行星数据(北京) 2019年6月
PlanetData 1.背景 济南市是山东省省会.

由于人口集中和经济快速发展,近年来,济南市空气污染问题加 剧,雾霾事件频发,带来了负面的健康效应并引起了社会的广泛关注,对于济南市PMzs 的污染控制政策提供理论依据.

然而,之前的相关研究依赖于地面空气质量监测站点提 供的PMzs浓度数据.

由于我国在2013年之前并未将PM2s浓度纳入常规监测,仅有少量 以科研为目的对PMzs零散观测,缺少时间上连续统一的PMzs浓度数据:同时,由于地面 监测站建设及维护成本较高,现有的地面监测网络倾向于在主要城市的中心区域设立站点, 因而在空间上覆盖范围有限.

地面监测数据的不足限制了对济南以及其他类似城市的空气 污染进行长期时空特征的全面分析.

近年来,利用卫星遥感气溶胶光学厚度(AOD)反演地面PM2s浓度的方法引起了研究 者的广泛注意.

AOD(AerosolOptical Depth)是大气消光系数在垂直方向上的积分,描述了 气溶胶对入射光的削减作用.

卫星AOD数据具有高空间分辨率(可至1公里),覆盖范围广 (全球覆盖)和历史长期连续观测(可追溯至2000年)等优势.

之前的研究表明AOD与地 面PMzs浓度之间存在一定的相关性.

因此,卫星遥感的AOD数据可以有效扩展地面监测网 在时间和空间上的覆盖,进而提供历史长期无间断的、全覆盖的大气污染数据.

已有研究通 过大气化学传输模型、统计模型及机器学习算法等方法定量AOD和PM2s浓度之间的关系, 以利用遥感的AOD数据预测地面PM2s浓度,定量描述在缺少PM2.s地面观测的地区或时间 段的PM2s时空分布.

例如,在关国新英格兰地区和东南部地区,研究者利用包括混合效应 模型和地理加权回归模型的两级空间统计学模型解析AOD和地面PM2s浓度之间的非线性关 系,预测没有观测数据地区的 PM2s浓度[XHuetal. 2014;1.Kloog etal 2014].

该两级模型 与地面观测值的相关系数可达0.85以上.类似的模型在中国同样准确预测了PM2s浓度,与 地面观测值的R²达到0.79[Maetal 2016].

得益于遥感技术和统计模型及大数据的发展,我 们在中国实现了1公里分辨率上对日平均的PMzs浓度的准确预测[Xiaoetal 2017]以及在6 公里分辨率上对小时平均的PMzs浓度的准确预测[Sheetal 2018].

卫星AOD和PMzs浓度间的关系存在复杂的时空变化,现有统计模型无法准确追算历史 PMzs浓度.

由于缺少地面观测PM2s浓度数据,现有模型依赖于2013年之后的数据来拟合 模型,确定模型参数.

然而之前的研究表明,当对训练数据时间区间之外的时间段的PMzs 浓度进行预测时,预测的准确性显著下降.

例如,Maet.al.(2016)报告,当用2013年训练 的数据预测2014年的PMzs浓度时,预测值和观测值相比的R²仅为0.41.

如何准确预测2013 年之前的PM2s浓度水平对于研究者是一个挑战.

相比于传统的统计模型,机器学习算法可 以更好的描述颗粒物浓度和卫星参数及气象参数间的复杂非线性关系.

通过训练随机森林和 XGBoost(extreme gradient boosting)等机器学习模型,并融合不同机器学习算法得到的预 测值,可以提高对PM2s历史数据的预测准确度.

我们之前的研究表明,在全国尺度上,包 含机器学习算法的融合模型对10公里网格化的历史数据的预测比之前报道的统计模型的 R²提高了约10%.

融合模型预测得到的PMzs浓度历史数据可以支持对PMzs的长期时空趋 势变化的研究[Xiaoetal 2018].

本研究利用卫星遥感数据以及大气化学传输模型模拟数据、土地利用数据、气象数据等,建 立基于机器学习算法的PM2s预测模型,并进一步得到2003-2016年济南市的高分辨率(1 平方公里)网格化PM2s浓度数据集.

利用这一基于卫星数据的PM2s浓度预测数据集,我 们有机会对济南市长期局部尺度的空气污染特征进行分析,寻找影响PMzs浓度的关键因素.

2
PlanetData 该项目建立的分析方法可以作为路线图促进对其他缺少PM2s浓度监测的地区的空气污染特 征进行分析,并为大气污染控制提供决策支持.

参考文献: Hu X Waller L Lyapustin A Wang Y Liu Y. 2014. 10-year spatial and temporal trends of pm 2.5 concentrations in the southeastern us estimated using high-resolution satellite data. Atmospheric Chemistry and Physics 14:6301-6314. Kloog 1 Chudnovsky AA Just AC Nordio F Koutrakis P Coull BA et al. 2014. A new hybrid spatio-temporal model for estimating daily multi-year pm 2.5 concentrations across northeastern USA using high resolution aerosol optical depth data. Atmospheric Environment 95:581-590. Ma Z Hu X Sayer AM Levy R Zhang O Xue Y et al. 2016. Satellite-based spatiotemporal trends in pm2. 5 concentrations: China 2004-2013. Environmental Health Perspectives (Online) 124:184. n ox high-resolution daily pm2. 5 estimation using maiac aod in the yangtze river delta of china. Remote Sensing of Environment 199:437-446. Xiao Q Chang H H Geng G et al. An ensemble machine-learning model to predict historical PM2. 5 concentrations in China from satelite data. Environmental Science & Technology 2018 52(22): 13260-13269. She Q Xiao Q Liu Y et al. 2018. Satelite-based estimation of hourly PM2.5 levels during heavy winter pollution episodes in the Yangtze River Delta China. AGU-JING Xian China. 2018.10 I.方法 1.数据收集与处理 为了得到足够的数据以支持模型训练,我们把研究区域扩展到覆盖整个山东省(图1).

本研究收集和处理了研究区域内的各类数据,包括地面PM2s观测数据、卫星气溶胶数据产 品、大气化学模式模拟结果、气象数据、土地利用参数等,并对数据进行空间匹配及网格化 处理,建立了约27万个1平方公里的网格,用于PM2s预测模型的建立和提供网格化PM25 浓度预测.

卫星AOD数据由搭载于Terra(过境时间为当地时间10:30)和Aqua(过境时间为当地时间 13:30)卫星的中等分辨率成像分光计(ModerateResolution Imaging Spectroradiometer, MODIS)传感器采集,并通过的最新 MAIAC(Multi-Angle Implementation of Atmospheric Correction)算法得到(Lyapustin et al. 2011a;Lyapustin et al.2011b).

MAIAC算法提供了 1 公里精度的网格化的AOD数据产品,使对局部尺度上气溶胶的异质性进行分析成为可能 (Emilietal.2011).

MAIAC算法利用时间序列分析得到光谱的地面反射特征,进一步进 行气溶胶反演.

通过结合时间序列分析和空间分析有助于提高对云层和雪的识别质量.

MAIAC算法提供了质量评估变量来标示反演质量,包括云检测、地面及水面检测、雪检 测等.

我们移除了被标记为云或雪覆盖的MAIAC像素(Kloogetal.2015).

为了使AOD数 值更有效反应每天平均气溶胶柱浓度以及增加卫星数据的覆盖,我们每天建立了TerraAOD 3
PlanetData 和AquaAOD间的线性回归关系,并利用该关系预测仅有TerraAOD或仅有AquaAOD时另一 卫星反演的AOD数值.

接下来,我们计算了Aqua AOD和Terra AOD的平均值以反映日平均 的气溶胶厚度(Jinnagara Puttaswamy et al.2014)并计算了月平均的 AOD值作为之后建模的 主要自变量.

的为了进行网格化数据整合,我们利用泰森多边形算法建立了基于MAIAC像 素经纬度的建模网格,并将其他数据集统一整合到该建模网格上.

我们收集处理了 2013-2016年间的数据用于构建并训练模型,并预测了2003-2016年的济南地区网格化 PM2.s浓度以支持时空分析.

地面PM2s观测数据收集自研究区域内的99个地面监测站点(图1),数据覆盖2013至2016 年.

国家空气质量监测站点观测的每小时PMzs浓度数据实时公布在中国国家环境监测中心 网站上( 连续三小时重复的PM2s观测值以及低于1ug/m?的PM2s观测值被认为是仪器异常产生的并 被移除(Rohde andMuller 2015).

为了确保计算的月均PMzs浓度能够正确反映每月的PMzs 水平,少于18个(60%)有效日均值的月份的月均PM2s值被移除.

我们收集了Terra卫星搭载的 MODIS的月平均归一化差分植被指数(Normalized Difference Vegetation Index NDVI)1公里数据产品(MOD13A3).

为了填补少量缺失的 NDVI 数据,我 们利用逆距离加权差值估算了缺失的NDVI数值,并将其空间整合到建模网格上.

我们从戈达德地球科学数据和信息服务中心( (Ozone Monitoring Instrument)传感器提供的二氧化氮柱浓度和气溶胶指数(aerosolindex).

我们从OMINO2二级数据集(OMNO2)中提取了参数ColumnAmountNO2Trop,并从OMI 气溶胶消光光学厚度和气溶胶种类二级数据集(OMAERO)中提取了参数AerosollndexUV.

这两个参数的分辨率均为13×24平方公里.

由于0MI传感器自2007年起存在扫描数据行 异常,为了降低这一系统噪声,我们移除了标记为异常的像素并对OMI数据进行了过 采样.

具体来说,对于二氧化氮对流层柱浓度数据,我们在每一个网格中心点建立了20公 里半径的采样区,并将每一季节落在采样区内的OMI像素取平均:对于气溶胶指数数据, 我们移除了低于0.5%百分率的异常值并在每一个网格中心点建立了30公里半径的采样区, 并将每一季节落在采样区内的OMI像素取平均.

气象数据主要来自欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF),分辨率为0.25".

我们提取并处理了地面2米温度、相对湿度、地表 气压、地面10米风速、地面10米风向、边界层高度、总降水等参数,并利用逆距离加权差 值将气象场数据空间整合到建模网格上.海拔数据来自于高级星载热辐射反射探测仪(ASTER) 的全球数字海拔模型(Global Digital Elevation Model,GDEM)版本2,分辨率为30米.

我 们计算了1平方公里建模网格内的平均海拔.人口数据来自于网格化世界人口数据(Gridded Populationofthe World,GPW)全球人口数据,分辨率为1公里.

我们利用空间整合将人口 数据和建模网格相匹配.

我们提耶 MERRA-2( Modern-Era Retrospective Analysis for Research and Applications Version 2)中的日均颗粒物浓度模拟结果(Randles et al.2017).MERRA-2重分析数据提供了从1980 年至今在0.5”纬度方向×0.625”经度方向上全覆盖较准确的不同组分的颗粒物浓度模拟.

这一重分析的大气化学模式模拟为我们提供了大尺度上PM2s分布的信息.

我们利用如下公 式计算总 PM2.s 浓度(Buchard et al. 2016;Provencal et al. 2017):
PlanetData 其中,灰尘2s和海盐2s是MERRA-2按颗粒物半径模拟结果中半径小于2.5微米的浓度求和.

MERRA-2按照五个半径区间模拟灰尘和海盐的浓度,我们计算了灰尘模拟结果中区间1(半 径0.1~1.0μm)、区间2(半径1~1.5μm)和区间3(半径1.5~3.0μm)的浓度和以及海盐模 拟结果中区间1(半径0.03~0.1μm)、区间2(半径0.1~0.5μm)和区间3(半径0.5~1.5μm) 的浓度和.

我们假设气溶胶中的硫酸盐主要以硫酸铵的形式存在,因此硫酸根质量浓度乘以 1.375得到硫酸铵的质量浓度.

有机碳和有机颗粒物质量比率,2.1,是通过比较中国 2013-2016年的PMzs观测值和 MERRA-2有机碳模拟值估算得到的(Xiao et al. 2018).

之后, 我们计算了月平均的PM2s浓度模拟数据并利用逆距离加权差值将MERRA-2数据空间整合到 1平方公里的建模网格上.

此外,我们还获取了0.1度网格化月平均排放清单数据 ( 格.

Main road ●PM2. 5 monitoring site Elevation(=) 10204060100300600 图1.研究区域(山东省)地形图.

空气质量监测站点显示为蓝点,济南市以紫色高亮显示.

2.模型训练和评估 本研究的技术路线如图2所示.

首先,我们采取机器学习算法建立PM2s浓度模型并利用十 乘交叉检验和逐年交叉检验筛选出合适的模型参数及评价模型表现:之后,我们把表现最好 的模型的预测值进行整合以提高历史追算的准确性和稳定性,并得到最终的PM2s浓度预测.

在模型拟合阶段,为了筛选出合适的机器学习算法并和统计模型对比,我们建立了随机森林、 XGBoost和线性混合模型(LME)三种模型预测月平均PMzs浓度.

线性混合模型被广泛应用 5

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)