Google Gemini TTS 모델로 텍스트를 음성으로 변환합니다. 위쪽은 단일 화자, 아래쪽은 다중 화자 TTS입니다.
화자이름: 대사
출력 오디오는 24kHz · 16-bit · 모노 WAV입니다. 언어는 텍스트에서 자동 감지됩니다(한국어 포함 다국어 지원).