강화학습

Reinforcement Learning

MDP, 정책 경사, Actor-Critic, MARL, 게임 AI 등

10개 논문

20231편

arXiv1,000+

Mastering Diverse Domains through World Models

월드 모델을 통한 다양한 도메인 마스터하기

Danijar Hafner, Jurgis Pasukonis, Jimmy Ba et al. (2023)

20211편

NeurIPS 20212,500+

Decision Transformer: Reinforcement Learning via Sequence Modeling

결정 트랜스포머: 시퀀스 모델링을 통한 강화학습

Lili Chen, Kevin Lu, Aravind Rajeswaran et al. (2021)

20192편

Nature 20203,000+

Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model

학습된 모델로 계획하여 Atari, 바둑, 체스, 장기 마스터하기

Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert et al. (2019)

Nature3,000+

Grandmaster level in StarCraft II using multi-agent reinforcement learning

다중 에이전트 강화학습을 이용한 스타크래프트 II 그랜드마스터 달성

Oriol Vinyals, Igor Babuschkin, et al. (2019)

20181편

ICML 20188,000+

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

소프트 액터-크리틱: 확률적 액터를 이용한 오프폴리시 최대 엔트로피 딥 강화학습

Tuomas Haarnoja, Aurick Zhou, Pieter Abbeel et al. (2018)

20172편

arXiv15,000+

Proximal Policy Optimization Algorithms

근접 정책 최적화 알고리즘

John Schulman, Filip Wolski, Prafulla Dhariwal et al. (2017)

arXiv5,000+

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

범용 강화학습 알고리즘의 자기대국으로 체스와 쇼기 마스터하기

David Silver, Thomas Hubert, Julian Schrittwieser et al. (2017)

20162편

Nature18,000+

Mastering the game of Go with deep neural networks and tree search

심층 신경망과 트리 탐색으로 바둑 마스터하기

David Silver, Aja Huang, Chris J. Maddison et al. (2016)

ICML 201612,000+

Asynchronous Methods for Deep Reinforcement Learning

딥 강화학습을 위한 비동기 방법

Volodymyr Mnih, Adrià Puigdomènech Badia, et al. (2016)

20131편

NeurIPS 2013 Workshop15,000+

Playing Atari with Deep Reinforcement Learning

심층 강화학습으로 Atari 게임하기

Volodymyr Mnih, Kavukcuoglu, Silver et al. (2013)

← 전체 분야 목록으로