天氣預報是研究大氣系統演變的重要科學手段,同時對社會發展和國家戰略至關重要。它帶來的經濟效益和社會價值巨大。在世界范圍內,天氣預報所貢獻的經濟效益高達1620億美元,至少占全球GDP的0.185%。在中國,約40%的GDP受到天氣和氣候的影響,尤其在農業生產中,天氣預報的作用更為突出。近年來,全球氣候變暖加劇,極端氣象災害頻發,給人類生產生活帶來巨大挑戰。普及早期預警機制,不僅每年可避免高達130億美元的財產損失,更能拯救無數生命。
傳統天氣預報的歷史、原理和瓶頸
數值天氣預報理論源于上世紀初。1904年,挪威科學家Bjerknes便提出通過數學物理方程來預測天氣,但因算力不足難以實踐。1922年,英國氣象學家Richardson動員大量人力,歷經6周,以手工紙筆的方式完成了首次6h“預報”。1950年,美國氣象學家Charney首次利用電子計算機,“僅”花費24h便完成了24h的預報,在氣象學界引起巨大轟動。隨著計算機性能提升,數值天氣預報逐步成熟,預報時長延長至5—7天,分辨率也從數百公里精細至幾公里。
數值天氣預報的基本原理在于,首先將雷達、衛星等觀測資料,形成網格化的溫度、氣壓、濕度、風速等氣象變量,并通過求解大氣動力學方程模擬其未來演變。數十年來,科學家們不斷完善復雜的偏微分方程系統,力求更準確地描述大氣的變化動態。
近年來,數值預報方法在精度和速度上遭遇瓶頸。精度提升緩慢,時效性平均每十年才提升一天。歐洲中期天氣預報中心(ECMWF)數據顯示,2012—2022年間,多個氣象要素的3—7天預報誤差減少不到5%,原因是偏微分方程的誤差累積和觀測數據的不完整和不準確性。同時,天氣預報對計算資源的消耗巨大,需要超級計算機持續不斷地運算才能滿足實際需求,使許多欠發達國家難以建立自己的數值預報系統。
人工智能大模型讓天氣預報越來越準
人工智能技術的飛速發展,深刻改變了人們的生產和生活。當傳統數值預報面臨挑戰時,人們好奇人工智能能否用于天氣預報,并超越傳統方法?2023年7月,我國科研團隊給出了積極回應。華為云計算技術有限公司田奇團隊開展的“盤古氣象大模型”項目,采用適配地球坐標的三維神經網絡與層次化時域聚合策略,實現了精準的全球中期氣象預報。經過全球天氣再分析數據訓練,該模型能準確預報7天內多層氣象要素等,相比全球領先的ECMWF系統,預報時效提高約0.6天,熱帶氣旋路徑預報誤差降低25%。該模型僅需10秒即可完成全球7天預報,計算速度提升萬倍以上。這一成果入選了2023年度“中國科學十大進展”。他們在《自然》雜志上發表論文,提出了可用于全球中期氣象預報的“盤古氣象大模型”,不僅首次超越了傳統數值預報的精度,還在臺風路徑預報上表現卓越。盤古氣象大模型基于深度學習理論,不同于傳統數值預報:不依賴于大氣動力學方程,而是構建深度神經網絡,將歷史上的氣象數據作為訓練資料,對神經網絡進行調優。田奇團隊率先意識到這類方法的巨大潛力,構建了適用于全球高分辨率中長期天氣預報的三維神經網絡大模型。該模型應用三維transformer網絡架構,采用經典的編碼器—解碼器設計模式,并引入地球位置先驗和層次化時域聚合策略,有效地提升了訓練效率,降低了推理功耗。
團隊用1979—2017年全球再分析數據訓練盤古氣象模型,并在2018年數據上進行了詳盡的測試。整個訓練過程在192塊GPU上耗時約兩個月,訓練資料超60TB。實驗結果顯示,盤古在數值天氣預報領域展現出驚人的性能,當以再分析數據作為輸入時,其精度甚至超越了公認最精確的傳統數值預報模型,即歐洲氣象中心的集成預報系統(IFS)。它僅需10秒即可完成全球7天高分辨率數值天氣預報,推理速度提升了萬倍以上,而計算功耗則降低了十萬倍以上。盤古氣象大模型的優勢,主要體現在這些方面。
一是在確定性天氣預報方面。盤古氣象大模型在2018年ERA5數據測試中,在溫度、氣壓、濕度、風速等氣象變量上,預報精度均超越IFS,增加預報時效0.6天,成為首個超越IFS的人工智能模型。
二是在極端天氣預報方面。盤古氣象大模型基于其預測的平均海面氣壓(MSLP)變量,通過迭代算法,能夠精確預測未來一段時間內每6h的臺風眼位置,進而推算出臺風路徑。2018年全球88個命名臺風的測試結果表明,其對臺風眼位置的3天和5天預測的絕對位置誤差比歐洲氣象中心的高分辨率系統低25%以上。
三是在集成天氣預報方面。盤古氣象大模型的推理速度極快,能夠大幅降低集成天氣預報的計算開銷。在包含100個成員變量的集成預報中,其中長期預報精度得到了顯著提升,并能夠對預報結果的不確定性進行定量分析。
人工智能大模型在氣象預報場景的實際應用
基于前述研究成果,盤古氣象大模型團隊積極攜手中國氣象局、香港天文臺、歐洲氣象中心及世界氣象組織等合作伙伴,將科研成果轉化為實際應用。目前,這些努力已經取得實質性的成果。
2023年汛期,盤古氣象大模型與中國氣象局深入合作,成功追蹤多個臺風并將相關成果納入常態化會商機制。以2302號臺風瑪娃和2305號臺風杜蘇芮為例,盤古氣象大模型精準預判其路徑,為大陸臺風防御提供關鍵支持。香港天文臺亦驗證盤古氣象大模型在2309號臺風蘇拉預報中優于包括IFS在內的傳統方法,展現了卓越性能。
此外,歐洲氣象中心亦對盤古氣象大模型進行了實際測試,涵蓋了2023年2月的冬季風暴Otto、南半球熱帶氣旋Freddy等多個極端天氣過程。同年7月,歐洲氣象中心正式將盤古氣象大模型的預報結果納入其官方網站,為全球用戶提供實時、準確的參考數據。
世界氣象組織在聽取團隊的技術報告后,對盤古氣象大模型給予了高度評價,認為其低推理計算開銷的特點使其在發展中國家具有廣闊的應用前景。盤古團隊將與世界氣象組織緊密合作,計劃將盤古氣象大模型引入世界上30個最不發達國家,為這些地區提供早期災害預警能力。
我國數值氣象預報發展可能遭受的風險和挑戰
盡管以盤古為代表的人工智能方法已經展現出巨大的潛力,但我國在數值氣象預報領域仍面臨諸多風險和挑戰,亟待解決。
首先,數據對外存在依賴。目前,我國在數值氣象預報中主要依賴外部數據源,如國際共享的氣象數據,存在潛在風險。一旦外部數據源出現問題或限制訪問,我國數值氣象預報的準確性和時效性就會受到嚴重影響。因此,構建全面、自主的天氣數據體系成為迫切需求。這需要我國加快自主研發和部署氣象觀測設備,整合衛星、地面觀測等多源數據,形成完整、可靠的數據鏈條,為數值氣象預報提供堅實的數據支撐。
其次,算力瓶頸是挑戰。氣象預報涉及大量的計算和分析工作,對計算資源的需求極高。然而,目前我國在高性能計算領域仍存在不足,難以滿足算力需求。這可能導致預報模型的訓練和優化受限,影響預報的精度和效率。因此,我國應加大投入,研發自主可控的高性能計算硬件和軟件,加強人工智能算力集群的建設,為數值氣象預報提供強大的底層算力保障。
最后,跨學科研究不足。氣象預報涉及數學、物理、計算機等多個學科領域,然而,目前我國還存在缺乏跨學科的研究團隊和合作機制等不足。因此,我國應加強對創新性理論研究和實踐探索的支持,促進不同學科之間的交叉融合,培養并吸引頂尖人才,為未來技術的突破儲備強大的智力資源。
