DPmind

AI 대화 생성

Google Gemini TTS 모델로 텍스트를 음성으로 변환합니다. 위쪽은 단일 화자, 아래쪽은 다중 화자 TTS입니다.

관리자만 음성 생성 기능을 사용할 수 있습니다.

단일 화자 TTS Single-speaker

모델

음성 (voice_name)

온도 (temperature) 1.0

낮을수록 안정적, 높을수록 표현이 다양해집니다.

스타일 지시문 (선택)

속도·톤·감정을 자연어로 지시합니다. 본문 앞에 자동으로 붙습니다.

텍스트

오디오 태그:

다중 화자 TTS Multi-speaker · 최대 2명

모델

온도 (temperature) 1.0

화자 1

화자 2

스타일 지시문 (선택)

대화 내용

각 줄을 화자이름: 대사 형식으로 작성하세요. 화자 이름은 위에서 지정한 이름과 일치해야 합니다.

출력 오디오는 24kHz · 16-bit · 모노 WAV입니다. 언어는 텍스트에서 자동 감지됩니다(한국어 포함 다국어 지원).