AI Paper Research
AI 분야의 주요 논문들을 요약, 수식, 임팩트와 함께 정리합니다.
Foundations
전체 보기 →ImageNet Classification with Deep Convolutional Neural Networks
심층 합성곱 신경망을 이용한 ImageNet 분류
Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton (2012)
Generative Adversarial Nets
생성적 적대 신경망
Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza et al. (2014)
Deep Residual Learning for Image Recognition
이미지 인식을 위한 심층 잔차 학습
Kaiming He, Xiangyu Zhang, Shaoqing Ren et al. (2015)
Attention Is All You Need
어텐션이 전부다
Ashish Vaswani, Noam Shazeer, Niki Parmar et al. (2017)
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
BERT: 언어 이해를 위한 심층 양방향 트랜스포머 사전 학습
Jacob Devlin, Ming-Wei Chang, Kenton Lee et al. (2018)
Language Models are Few-Shot Learners
언어 모델은 퓨샷 학습자이다
Tom Brown, Benjamin Mann, Nick Ryder et al. (2020)
최근 추가된 논문
Mixtral of Experts
Mixtral: 전문가 혼합 모델
Albert Q. Jiang, Alexandre Sablayrolles, Antoine Roux et al. (2024)
Gemma: Open Models Based on Gemini Research and Technology
Gemma: Gemini 연구와 기술 기반의 오픈 모델
Gemma Team, Thomas Mesnard, Cassidy Hardin et al. (2024)
Gemini: A Family of Highly Capable Multimodal Models
Gemini: 고성능 멀티모달 모델 패밀리
Gemini Team, Google DeepMind (2024)
InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks
InternVL: 범용 시각-언어 과제를 위한 비전 파운데이션 모델 스케일링 및 정렬
Zhe Chen, Jiannan Wu, Wenhai Wang et al. (2024)
Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
Mobile ALOHA: 저비용 전신 원격조작을 이용한 양손 이동 조작 학습
Zipeng Fu, Tony Z. Zhao, Chelsea Finn (2024)
Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training
슬리퍼 에이전트: 안전 훈련에도 지속되는 기만적 LLM 훈련
Evan Hubinger, Carson Denison, Jesse Mu et al. (2024)
Fields
자연어처리
언어모델, 번역, QA, 요약, 토크나이저 등 텍스트 이해와 생성에 관한 연구
컴퓨터 비전
분류, 검출, 분할, 3D 비전, 비디오 분석 등 시각 정보 처리 연구
생성 모델
GAN, VAE, Diffusion, Flow 등 데이터 생성에 관한 연구
강화학습
MDP, 정책 경사, Actor-Critic, MARL, 게임 AI 등
대규모 언어모델
스케일링, RLHF, 프롬프팅, RAG, 에이전트, 추론 등
멀티모달
비전-언어, 오디오-텍스트, 통합 모델 연구
그래프 ML
GNN, Knowledge Graph, 분자 그래프 등 그래프 구조 학습
로보틱스
조작, 내비게이션, Sim2Real, 체화 에이전트 연구
AI 안전성·정렬
정렬, 해석 가능성, 레드팀, 거버넌스 연구
최적화·학습이론
SGD, Adam, 수렴 이론, 일반화, 손실 함수 연구
표현 학습
자기지도학습, 대조학습, 사전학습, 전이학습 연구
AI for Science
단백질 접힘, 신약, 기후, 수학 증명 등 과학 연구에 AI 적용
경량화·효율화
양자화, 프루닝, 증류, NAS, 추론 최적화 연구
월드 모델
비디오 예측, 시뮬레이션, 내부 세계 모델 연구
음성·오디오
ASR, TTS, 음악 생성, 오디오 이해 연구