대규모 언어모델
Large Language Models
스케일링, RLHF, 프롬프팅, RAG, 에이전트, 추론 등
10개 논문
20242편
20234편
arXiv8,000+
LLaMA: Open and Efficient Foundation Language Models
LLaMA: 개방적이고 효율적인 기초 언어 모델
Hugo Touvron, Thibaut Lavril, Gautier Izacard et al. (2023)
arXiv5,000+
GPT-4 Technical Report
GPT-4 기술 보고서
OpenAI (2023)
NeurIPS 20204,000+
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
지식 집약적 NLP 태스크를 위한 검색 증강 생성
Patrick Lewis, Ethan Perez, Aleksandra Piktus et al. (2020)
arXiv10,000+
Llama 2: Open Foundation and Fine-Tuned Chat Models
Llama 2: 개방형 파운데이션 및 미세조정 채팅 모델
Hugo Touvron, Louis Martin, Kevin Stone et al. (2023)
20223편
NeurIPS 20223,000+
Training Compute-Optimal Large Language Models
계산 최적 대규모 언어 모델 학습
Jordan Hoffmann, Sebastian Borgeaud, Arthur Mensch et al. (2022)
NeurIPS 2022Outstanding5,000+
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
연쇄 사고 프롬프팅은 대규모 언어 모델에서 추론을 이끌어낸다
Jason Wei, Xuezhi Wang, Dale Schuurmans et al. (2022)
arXiv7,000+
PaLM: Scaling Language Modeling with Pathways
PaLM: Pathways를 활용한 언어 모델링 스케일링
Aakanksha Chowdhery, Sharan Narang, Jacob Devlin et al. (2022)