AI Paper Research

AI 논문 조사 및 정리

음성·오디오 — 2023

3편의 논문

Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers

신경 코덱 언어 모델은 제로샷 텍스트 음성 합성기이다

Chengyi Wang, Sanyuan Chen, Yu Wu et al. (2023)

MusicLM: Generating Music From Text

MusicLM: 텍스트로부터 음악 생성

Andrea Agostinelli, Timo I. Denk, Zalán Borsos et al. (2023)

GitHub / Suno AI500+

Bark: Text-Prompted Generative Audio Model

Bark: 텍스트 프롬프트 기반 생성 오디오 모델

Suno AI (2023)

← 음성·오디오 전체