AI Paper Research

AI 분야의 주요 논문들을 요약, 수식, 임팩트와 함께 정리합니다.

Foundations

전체 보기 →

NeurIPS 2012Best Paper120,000+

ImageNet Classification with Deep Convolutional Neural Networks

심층 합성곱 신경망을 이용한 ImageNet 분류

Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton (2012)

NeurIPS 201460,000+

Generative Adversarial Nets

생성적 적대 신경망

Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza et al. (2014)

CVPR 2016Best Paper200,000+

Deep Residual Learning for Image Recognition

이미지 인식을 위한 심층 잔차 학습

Kaiming He, Xiangyu Zhang, Shaoqing Ren et al. (2015)

NeurIPS 2017130,000+

Attention Is All You Need

어텐션이 전부다

Ashish Vaswani, Noam Shazeer, Niki Parmar et al. (2017)

NAACL 2019Best Paper100,000+

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT: 언어 이해를 위한 심층 양방향 트랜스포머 사전 학습

Jacob Devlin, Ming-Wei Chang, Kenton Lee et al. (2018)

NeurIPS 202040,000+

Language Models are Few-Shot Learners

언어 모델은 퓨샷 학습자이다

Tom Brown, Benjamin Mann, Nick Ryder et al. (2020)

최근 추가된 논문

arXiv2,000+

Mixtral of Experts

Mixtral: 전문가 혼합 모델

Albert Q. Jiang, Alexandre Sablayrolles, Antoine Roux et al. (2024)

arXiv1,000+

Gemma: Open Models Based on Gemini Research and Technology

Gemma: Gemini 연구와 기술 기반의 오픈 모델

Gemma Team, Thomas Mesnard, Cassidy Hardin et al. (2024)

arXiv3,000+

Gemini: A Family of Highly Capable Multimodal Models

Gemini: 고성능 멀티모달 모델 패밀리

Gemini Team, Google DeepMind (2024)

CVPR 20241,000+

InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks

InternVL: 범용 시각-언어 과제를 위한 비전 파운데이션 모델 스케일링 및 정렬

Zhe Chen, Jiannan Wu, Wenhai Wang et al. (2024)

arXiv200+

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation

Mobile ALOHA: 저비용 전신 원격조작을 이용한 양손 이동 조작 학습

Zipeng Fu, Tony Z. Zhao, Chelsea Finn (2024)

arXiv (Anthropic)300+

Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training

슬리퍼 에이전트: 안전 훈련에도 지속되는 기만적 LLM 훈련

Evan Hubinger, Carson Denison, Jesse Mu et al. (2024)

Fields

Natural Language Processing

자연어처리

언어모델, 번역, QA, 요약, 토크나이저 등 텍스트 이해와 생성에 관한 연구

10개 논문

Computer Vision

컴퓨터 비전

분류, 검출, 분할, 3D 비전, 비디오 분석 등 시각 정보 처리 연구

11개 논문

Generative Models

생성 모델

GAN, VAE, Diffusion, Flow 등 데이터 생성에 관한 연구

11개 논문

Reinforcement Learning

강화학습

MDP, 정책 경사, Actor-Critic, MARL, 게임 AI 등

10개 논문

Large Language Models

대규모 언어모델

스케일링, RLHF, 프롬프팅, RAG, 에이전트, 추론 등

10개 논문

Multimodal AI

멀티모달

비전-언어, 오디오-텍스트, 통합 모델 연구

10개 논문

Graph Machine Learning

그래프 ML

GNN, Knowledge Graph, 분자 그래프 등 그래프 구조 학습

10개 논문

Robotics & Embodied AI

로보틱스

조작, 내비게이션, Sim2Real, 체화 에이전트 연구

10개 논문

AI Safety & Alignment

AI 안전성·정렬

정렬, 해석 가능성, 레드팀, 거버넌스 연구

10개 논문

Optimization & Learning Theory

최적화·학습이론

SGD, Adam, 수렴 이론, 일반화, 손실 함수 연구

10개 논문

Representation Learning

표현 학습

자기지도학습, 대조학습, 사전학습, 전이학습 연구

10개 논문

AI for Science

단백질 접힘, 신약, 기후, 수학 증명 등 과학 연구에 AI 적용

10개 논문

Efficient AI

경량화·효율화

양자화, 프루닝, 증류, NAS, 추론 최적화 연구

10개 논문

World Models

월드 모델

비디오 예측, 시뮬레이션, 내부 세계 모델 연구

9개 논문

Audio & Speech

음성·오디오

ASR, TTS, 음악 생성, 오디오 이해 연구

10개 논문