期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘要 基于歐洲中期天氣預報中心(the European Centre for Medium-Range Weather Forecasts,ECMWF)2015年2月8日—2016年12月31日中國華東及華南地區24~168 h預報時效的逐日24 h累積降水集合預報資料,利用前饋神經網絡建立NN(Neutral Network)模型及NN-GI(Neutral Network-Geographic Information)模型進行概率預報試驗,并對兩個模型輸出的概率預報結果進行評估。結果表明,經NN模型和NN-GI模型訂正后,降水概率預報結果得到明顯改進,在168 h預報時效時,降水概率預報的CRPS值與原始集合預報相比分別下降了約16.00%、21.27%。與NN模型相比,NN-GI模型由于考慮到各格點的地理信息差異,在區域內預報技巧整體改進更優。這表明,在利用機器學習方法改進降水預報時,在模型中加入各個格點的地理信息非常重要。
關鍵詞降水;概率預報;神經網絡;地理信息;ECMWF集合預報
隨著人類活動對氣候變化的影響日益顯著,暴雨等極端天氣事件頻發,對人民生命及財產安全造成重大影響,人們對降水預報準確性的要求也越來越高。同時,準確的降水預報是制定科學合理的政府決策的重要前提,也是人民生命財產安全的重要保證。因此,提高降水預報準確性,減小預報誤差一直是氣象業務和科研工作的重點。但是,降水受到多種不同尺度天氣系統的共同作用,這使得降水相較于其他氣象要素,預報難度更大,是天氣預報和氣候預測中最具挑戰性的氣象要素之一。
由于大氣是一個高度非線性的混沌系統,誤差會隨著數值預報模式積分時間的增加而增加,從而導致預報的不確定性(Lorenz et al.,1965)。另外,數值預報模式在處理大氣中物理過程,如微物理過程、邊界層過程、陸面過程等,往往通過假設、近似、參數化等方法對這些作用進行簡化,從而對預報結果產生影響(Moghim and Bras,2017)。比如,云物理過程、積云對流參數化等方案就對降水預報,特別是由中尺度系統引起的暴雨預報產生重要影響(崔文君等,2016)。不同的參數化方案得到的云微物理特征相關變量存在較大差異,而多方案集成方法能夠有效地降低這種不確定性,使得模擬結果更加穩定(智協飛等,2020a)。因此,近年來數值預報逐漸由確定性預報轉變為多成員集合預報。與確定性預報相比,基于Epstein動力隨機預報理論(Epstein,1969)和Leith蒙特卡羅預報法的集合預報(Leith,1974)能夠模擬大氣可能的變化,從而更加接近大氣的實際狀況。20世紀90年代后,隨著大規模并行計算機的發展,集合預報系統在美國國家環境中心(National Centers for Environmental Prediction,NCEP)和歐洲中期天氣預報中心投入業務運行,隨后成為這兩個中心數值天氣預報的重要組成部分。
集合預報由于初值擾動、模式設置等方面的原因,常存在一階系統偏差及二階離散度偏差(蘇翔和袁慧玲,2020),所以對集合預報進行評估及偏差訂正具有重要意義。國內外學者嘗試采用多種方法對集合預報進行后處理(Applequist et al.,2002;Hamill et al.,2004;張海鵬等,2020;智協飛和趙忱,2020),從而提高預報的準確性。智協飛等(2016)通過建立降水的分級回歸統計降尺度模型,獲得更加精細化的預報結果;王姝蘇等(2018)在此基礎上,采用Schaake Shuffle方法重建降水丟失的空間相關性和時間連續性,使之更接近實況觀測。智協飛和呂游(2019)將全國分為7個子區域,并分別用頻率匹配法進行訂正,有效減少了降水預報的誤差。Ji et al.(2020)嘗試將基于對象的診斷方法(the Method for Object-based Diagnostic Evaluation,MODE)用于多模式集合預報,發現該方法能夠較好地保留降水的空間相關性,使降水落區更加完整。但是,這些方法僅得到一些確定性的預報結果,難以包含實際大氣可能發生的各種情況。對于降水而言,能夠定量計算不同量級降水出現的可能性大小,即采用概率預報,較傳統的確定性預報具有更大的應用價值(林春澤等,2013)。
近年來,隨著計算機技術的發展及相關理論的完善,機器學習方法廣泛應用于氣象領域中,如短時臨近預報(Shi et al.,2015;陳元昭等,2019)、空氣質量預報(張庭玉,2018)、統計降尺度(任梅芳等,2018;商琪等,2020)、臺風路徑分類(耿煥同等,2017)及云圖分類(韓丁等,2011;李林等,2015;胡凱等,2017)等方面。其中,神經網絡模型可以從訓練期的數據中,深入挖掘輸入數據和目標數據之間的關系,從而對新的數據進行分類、預測等處理。Liu and Racah(2016)利用卷積神經網絡,對熱帶氣旋、大氣環流和鋒面現象進行識別,準確率達到99%、90%和89.4%。最近,智協飛等(2020b)和Peng et al.(2020)利用深度學習方法對地面氣溫進行多模式集成預報,所得結果優于傳統超級集合等線性統計后處理方法。陳昱文等(2020)使用Stacking方法將人工神經網絡模型和長短期記憶神經網絡模型進行集成,建立ALS(ANN-LSTM-Stacking)模型,以均方根誤差為損失函數,對地面氣溫進行偏差訂正,在氣溫預報誤差較大的區域和氣溫峰值預報有顯著的訂正效果。Rasp and Lerch(2018)針對德國地區2 m氣溫48 h預報,建立神經網絡,得到其概率分布的均值及方差,從而求得其氣溫的概率分布。所得結果與EMOS方法相比,在連續分級概率評分上有較大改進。目前基于神經網絡的概率預報研究主要集中于氣溫等正態分布的氣象要素中,對于降水這種非正態分布的氣象要素研究較少。