대규모 언어모델

Large Language Models

스케일링, RLHF, 프롬프팅, RAG, 에이전트, 추론 등

10개 논문

20242편

Mixtral: 전문가 혼합 모델

Albert Q. Jiang, Alexandre Sablayrolles, Antoine Roux et al. (2024)

Gemma: Gemini 연구와 기술 기반의 오픈 모델

Gemma Team, Thomas Mesnard, Cassidy Hardin et al. (2024)

LLaMA: 개방적이고 효율적인 기초 언어 모델

Hugo Touvron, Thibaut Lavril, Gautier Izacard et al. (2023)

GPT-4 기술 보고서

OpenAI (2023)

지식 집약적 NLP 태스크를 위한 검색 증강 생성

Patrick Lewis, Ethan Perez, Aleksandra Piktus et al. (2020)

Llama 2: 개방형 파운데이션 및 미세조정 채팅 모델

Hugo Touvron, Louis Martin, Kevin Stone et al. (2023)

계산 최적 대규모 언어 모델 학습

Jordan Hoffmann, Sebastian Borgeaud, Arthur Mensch et al. (2022)

연쇄 사고 프롬프팅은 대규모 언어 모델에서 추론을 이끌어낸다

Jason Wei, Xuezhi Wang, Dale Schuurmans et al. (2022)

PaLM: Pathways를 활용한 언어 모델링 스케일링

Aakanksha Chowdhery, Sharan Narang, Jacob Devlin et al. (2022)

코드로 학습된 대규모 언어 모델 평가

Mark Chen, Jerry Tworek, Heewoo Jun et al. (2021)