최적화·학습이론
Optimization & Learning Theory
SGD, Adam, 수렴 이론, 일반화, 손실 함수 연구
10개 논문
20241편
20232편
NeurIPS 2023500+
Symbolic Discovery of Optimization Algorithms
최적화 알고리즘의 기호적 발견
Xiangning Chen, Chen Liang, Da Huang et al. (2023)
ICLR 2024300+
Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training
Sophia: 언어 모델 사전학습을 위한 확장 가능한 확률적 2차 최적화기
Hong Liu, Zhiyuan Li, David Hall et al. (2023)
20221편
20201편
20192편
ICLR 2019Best Paper5,000+
The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks
복권 가설: 희소하고 학습 가능한 신경망 찾기
Jonathan Frankle, Michael Carlin (2019)
ICLR 20201,500+
Large Batch Optimization for Deep Learning: Training BERT in 76 minutes
딥러닝을 위한 대규모 배치 최적화: BERT 76분 학습
Yang You, Jing Li, Sashank Reddi et al. (2019)