강화학습
Reinforcement Learning
MDP, 정책 경사, Actor-Critic, MARL, 게임 AI 등
10개 논문
20231편
20211편
20192편
Nature 20203,000+
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model
학습된 모델로 계획하여 Atari, 바둑, 체스, 장기 마스터하기
Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert et al. (2019)
Nature3,000+
Grandmaster level in StarCraft II using multi-agent reinforcement learning
다중 에이전트 강화학습을 이용한 스타크래프트 II 그랜드마스터 달성
Oriol Vinyals, Igor Babuschkin, et al. (2019)
20181편
20172편
arXiv15,000+
Proximal Policy Optimization Algorithms
근접 정책 최적화 알고리즘
John Schulman, Filip Wolski, Prafulla Dhariwal et al. (2017)
arXiv5,000+
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
범용 강화학습 알고리즘의 자기대국으로 체스와 쇼기 마스터하기
David Silver, Thomas Hubert, Julian Schrittwieser et al. (2017)