NatureCitations: 25,000+

Highly accurate protein structure prediction with AlphaFold

AlphaFold를 이용한 고정밀 단백질 구조 예측

John Jumper, Richard Evans, Alexander Pritzel, et al. (2021)

Evoformer와 구조 모듈을 결합하여 원자 수준의 정확도로 단백질 3D 구조를 예측, 50년 난제인 단백질 접힘 문제를 사실상 해결한 논문.

배경

단백질의 아미노산 서열로부터 3D 구조를 예측하는 문제는 1972년 Anfinsen의 열역학 가설 이래 생물학의 최대 난제 중 하나였다. CASP(Critical Assessment of protein Structure Prediction) 대회에서 수십 년간 점진적 개선만 있었으며, 실험적 구조 결정(X-선 결정학, cryo-EM)은 비용과 시간이 막대했다.

핵심 아이디어

AlphaFold2는 두 가지 핵심 모듈로 구성된다. Evoformer는 MSA(다중 서열 정렬) 표현과 쌍별(pairwise) 표현 사이에 정보를 반복적으로 교환하는 새로운 어텐션 아키텍처로, 진화적 공변이(covariation)와 공간적 관계를 동시에 추론한다. 구조 모듈(Structure Module)은 SE(3)-등변(equivariant) 변환을 사용하여 각 잔기의 3D 좌표를 직접 예측하며, 반복적 정제(recycling)를 통해 정확도를 높인다. 전체가 end-to-end로 미분 가능하여, FAPE 손실로 직접 3D 좌표를 학습한다.

방법론

입력 서열에서 MSA와 템플릿을 검색하고, 48층 Evoformer로 표현을 구축한 뒤 구조 모듈에서 원자 좌표를 생성한다. 3회 반복(recycling)으로 정제하며, 학습 시 PDB의 실험적 구조를 정답으로 사용한다.

주요 결과

CASP14에서 GDT 점수 중앙값 92.4를 달성하여 2위(약 67)를 압도적으로 앞섰다. 이는 실험적 방법에 필적하는 정확도로, 대부분의 예측 구조가 1Å 이내의 오차를 보였다.

임팩트

구조 생물학을 근본적으로 변혁하여, 2억 개 이상 단백질 구조의 예측 데이터베이스가 공개되었다. 신약 개발, 효소 설계, 질병 이해 등 광범위한 생명과학 분야에 혁명적 영향을 미쳤으며, 2024년 노벨 화학상 수상으로 이어졌다.

관련 Foundation 논문

관련 논문