半岛彩票7月29日至8月1日,台风“杜苏芮”残余环流携丰沛水汽北上,受到华北北部“高压坝”拦截,加上太行山和燕山山脉地形抬升等共同作用,导致京津冀地区出现一轮历史罕见的极端暴雨天气。复杂极端性天气气候事件,呼唤精细化的网格预测加持。传统上,气候预测业务通常基于动力模式和统计技术开展。而今,国家气候中心开始探索人工智能技术在气候预测中的应用。
与天气预报主要关注未来一到两周的天气不同,气候预测要预测未来一个月、一个季节、一年,甚至年代际的天气平均状况,这不仅需要监测大气圈,还需要了解海洋、陆面、冰雪圈、太阳活动等情况,以及气候变暖的背景。因此,气候预测本身不确定性较大,比天气预报更为复杂。
从复杂影响因素中抽丝剥茧,以期尽可能摸准气候的“脉搏”,需要不一样的“利器”。一般来说,传统工具有两类:一类是经验统计,另一类是气候预测动力模式。经验统计是利用前期观测到的环流信息来预测,通过对已有气候历史数据进行收集、处理、分析等,找到气候系统的可预报性,这种方法对数据和计算条件要求很低,预报技巧通常高于模式。动力模式则是通过对气候动力学方程组进行离散化和参数化,用数值积分来模拟和预测气候状况,可以给出极端性很强的气候预测。
目前,这两种工具都存在不足。对于经验统计来说,由于气候年代际变化导致预报因子-预报量之间的关系不够稳定,加上历史样本有限,很难对气候进行精确的非线性描述和气候转折预报,结果必然存在偏差。气候预测动力模式则需要巨型计算机支持,并且回算和业务预测耗时久,在长期积分下误差持续积累,实际上对气温、降水和极端气候事件的预测技巧并不高,尤其是公众最关注的次季节-季节尺度上。
事实上,随着观测技术和设备的快速发展,人们为了更好地监测、模拟和预测大气和海洋的变化,已利用卫星遥感、浮标、雷达、固定观测台站等各类手段收集了海量的地球系统数据,其PB级数据量已经远超过传统统计方法处理数据和理解数据的能力。
在高性能计算机、大数据、先进的机器学习和深度学习算法的支持下,人工智能为提高气候预测技巧提供了新的思路和契机。
“基于人工智能的气候预测技术比动力模式更易于实现,比经验统计方法更能建立复杂和贴近真实情况的统计模型,尤其是深度学习,它能够直接从原始环流场信息自动构建最优化的预报因子和非线性预测关系,突破了传统方法的根本弱点,因此能够提高预测技术的上限。”刘长征说,机器学习可以从再分析数据、模式数据中发现并提取新的相互关联的气候信号,如某个关键区的海温信息可以提高陆地某区域未来数月的气候预测技巧。
目前国内外气候模式分辨率通常为100公里左右,对未来一段时间的气候预测犹如“雾里看花”。为了看清细节,国家气候中心专家想到了图像超分辨率技术(以下简称“超分”)——一项通过一定算法将低分辨率的图像提升为高分辨率的技术。
事实上,深度学习技术早已被广泛用来做图像超分,就是同时给出低分辨率和高分辨率的图像,让人工智能模型自己学习如何从低分辨率图像中重建高分辨率图像,就如同还原粗糙模糊的老照片,使其细节变得清晰一样。
目前,国家气候中心延伸期气候预测主要参考世界气象组织(WMO)的次季节-季节预测模式数据,分辨率为1.5°(约150公里)。2022年,国家气候中心将深度学习的图像超分技术和专业气候知识相结合,将地形、大气低层环流场信息与粗分辨率气温、降水信息混合,针对我国候平均气温降水建立了一个条件性EDSR超分算法,将客观化模式预测产品的分辨率由150公里提升到25公里。
值得一提的是,该深度学习模型能够突出地形等因素在气温、降水中的局地作用,对极端气温和降水天气过程的预测误差明显低于传统方法,可以更精准地刻画局地性暴雨天气。以2021年7月河南特大暴雨为例,该算法能够给出降水量大于500毫米的空间分布区域。目前,该深度学习模型已经用于我国次季节-季节多模式集合1至12候的逐候平均气温、降水精细化网格预测,相关技术产品开始实时制作,并向省级单位下发。
作为热带大气季节内变率的主要模态,热带大气季节内振荡(MJO)不仅对热带地区,还对热带外地区的天气气候具有显著影响,是气候系统在厄尔尼诺/南方涛动(ENSO)之外最受关注的次季节-季节气候可预测性来源。研究表明,对模式中能够代表大气现象的MJO、陆地-海洋-冰冻圈耦合以及初始条件的深入分析,有助于全球次季节尺度预报能力的提升。然而,MJO的演化过程比ESNO更加不规律,预报难度很大。
国际上对MJO的业务预报水平公认度最高的是欧洲中期天气预报中心(ECMWF)的动力模式预测,预测时长为27天。2022年夏天,国家气候中心和吉林大学计算机科学与技术学院李洪亮博士课题组合作,用1年左右的时间开发出深度学习模型DK-STN,目前独立预报技巧达到28—29天,已经达到和初步超过ECMWF模式水平。在国际上,MJO的人工智能模型还处于起步阶段,尚未投入业务应用。国外通常利用时间序列模型对MJO的两个指数RMM1和RMM2进行预报,预测技巧在25—28天左右。
“与国外做法不同,我们把临近一段时间的大气和海洋环流信息当作MJO指数预测的信号来源,采用图像卷积网络和Transformer方法进行建模。在理论上,这种思路更符合真实的气候系统情况,技巧上限更高。” 刘长征说。
虽然人工智能特别是深度学习方法中,通过大数据驱动建立基于物理解释的预测模型有望成为一种有力工具,但当前利用人工智能进行气候预测仍然面临诸多难题,比如缺乏高质量的样本数据、模型的适用性和物理可解释性不足等。而其中最主要的挑战是如何实现与真实气候系统接近的多样性,因为只有这样才能实现对极端气候的有效预测。人工智能只能从已有的非常有限的样本中进行学习,而真实的气候状况过于复杂,加上气候变暖和年代际变化的影响,因此很难预测极端气候和气候突变。但无论如何,基于数据驱动的人工智能是气候预测最有潜力的技术方向。
为了建立预测技巧较高的机器学习气候预测模型,需要充分了解大数据背后的气候动力学。换言之,将人工智能和动力模式相结合,在气候动力学等专业知识的约束下建立机器学习模型,利用模式弥补人工智能的不足,对于充分发挥机器学习在气候预测中的潜力、提升人工智能对极端气候的预测能力至关重要。