음성·오디오 — 2023
3편의 논문
arXiv1,000+
Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers
신경 코덱 언어 모델은 제로샷 텍스트 음성 합성기이다
Chengyi Wang, Sanyuan Chen, Yu Wu et al. (2023)
arXiv1,000+
MusicLM: Generating Music From Text
MusicLM: 텍스트로부터 음악 생성
Andrea Agostinelli, Timo I. Denk, Zalán Borsos et al. (2023)
GitHub / Suno AI500+
Bark: Text-Prompted Generative Audio Model
Bark: 텍스트 프롬프트 기반 생성 오디오 모델
Suno AI (2023)