FourCastNet: A Global Data-driven High-resolution Weather Forecasting Model
FourCastNet: 글로벌 데이터 기반 고해상도 기상 예보 모델
Jaideep Pathak, Shashank Subramanian, Peter Harrington, et al. (2022)
적응적 푸리에 신경 연산자(AFNO)를 활용하여 ERA5 재분석 데이터로 학습한 글로벌 고해상도(0.25도) 기상 예보 모델이다. 기존 수치 기상 예보(NWP) 대비 수만 배 빠른 속도로 경쟁력 있는 예보 정확도를 달성하며, 대규모 앙상블 예보를 실시간으로 가능하게 했다.
배경
전통적인 수치 기상 예보(NWP)는 대기의 물리 방정식을 이산화하여 슈퍼컴퓨터에서 푸는 방식으로, ECMWF의 IFS 모델이 현재 최고 수준의 정확도를 제공한다. 그러나 이 방법은 막대한 계산 자원(수천 CPU 코어, 수 시간의 연산)을 필요로 하여 앙상블 예보의 규모나 해상도에 제한이 있었다. 딥러닝 기반 대리 모델(surrogate model)의 가능성이 탐색되었지만, 글로벌 규모에서 0.25도(약 25km) 해상도를 달성한 데이터 기반 모델은 없었다. 또한 기상 데이터의 본질적인 공간 주기성과 스펙트럼 특성을 효과적으로 활용하는 아키텍처 설계가 필요했다.
핵심 아이디어
FourCastNet은 비전 트랜스포머의 자기 어텐션을 푸리에 영역에서의 토큰 믹싱으로 대체한 적응적 푸리에 신경 연산자(AFNO)를 핵심 아키텍처로 사용한다. 기상 데이터의 글로벌 구형 특성상 주파수 영역에서의 처리가 자연스러우며, 2D 이산 푸리에 변환(DFT)을 통해 공간 믹싱을 수행하면 O(N log N)의 계산 복잡도로 전역적 수용 영역(global receptive field)을 확보할 수 있다. 입력은 현재 시점의 기상 변수(온도, 풍속, 습도, 지위고도 등)이고, 출력은 6시간 후의 동일 변수를 예측한다. 자기회귀적으로 6시간 예측을 반복하여 장기 예보를 생성한다.
방법론
720x1440 격자(0.25도 해상도)의 26개 대기 변수를 입력으로 받는다. 이미지를 패치로 분할한 뒤 AFNO 블록을 통과시킨다. 각 AFNO 블록에서는 (1) 2D FFT로 공간 차원을 주파수 영역으로 변환, (2) 주파수별 학습 가능한 가중치로 스펙트럼 필터링, (3) IFFT로 공간 영역 복원의 과정을 거친다. 희소성 제약(sparsity constraint)으로 주파수 가중치를 정규화하여 과적합을 방지한다. ERA5 재분석 데이터(1979-2015)로 학습하고 2016-2017을 검증, 2018을 테스트에 사용한다. 손실 함수는 위도 가중 MSE이다.
주요 결과
500hPa 지위고도(Z500) 예보에서 5일 선행 시간 기준으로 IFS와 경쟁력 있는 정확도를 달성했으며, 850hPa 온도(T850), 10m 풍속(U10, V10) 등 주요 변수에서도 우수한 성능을 보였다. 추론 속도는 단일 GPU에서 수 초 이내로 기존 NWP 대비 약 45,000배 빠르다. 이 속도 덕분에 수천 멤버의 대규모 앙상블 예보를 실시간으로 수행할 수 있으며, 열대 저기압 경로 예측에서 앙상블의 이점을 시연했다. 단, 10일 이상의 장기 예보에서는 자기회귀 오류 누적으로 정확도가 하락하는 한계를 보였다.
임팩트
데이터 기반 기상 예보가 전통적 NWP와 경쟁할 수 있음을 처음으로 글로벌 고해상도에서 실증하여 AI 기상 예보의 본격적인 경쟁 시대를 열었다. 이후 Pangu-Weather, GraphCast, GenCast 등 더 정확한 데이터 기반 모델이 잇따라 발표되는 촉매가 되었으며, ECMWF도 AI 기반 예보 시스템을 공식 운영에 통합하기 시작했다. 푸리에 신경 연산자를 대규모 지구과학 데이터에 적용한 선구적 사례로서, 기후 모델링, 해양 예측 등 관련 분야에도 영향을 미치고 있다.