snow · 2026.5.15 10:42 · 조회 2

MiniMax 음성 합성 (TTS)

개요

MiniMax Speech-02는 고품질 텍스트 음성 변환(TTS) 서비스입니다. 다양한 감정 표현과 다국어 지원이 강점으로, ElevenLabs와 직접 경쟁하는 제품입니다.

주요 모델

모델특징
speech-02-hd최고 품질, 감정 표현 풍부
speech-02-turbo빠른 응답, 실시간 스트리밍 최적화
speech-01-hd이전 세대, 안정적 품질
speech-01-turbo저지연 실시간용

주요 기능

음성 클로닝 (Voice Cloning)

  • 3~10초 샘플만으로 음성 복제 가능
  • 감정·톤 유지
  • 실시간 음성 변환 지원

다국어 지원

  • 한국어, 영어, 중국어, 일본어 등 29개 언어 지원
  • 자동 언어 감지

감정 제어

1{2  "voice_setting": {3    "emotion": "happy",4    "speed": 1.0,5    "vol": 1.0,6    "pitch": 07  }8}

사전 제작 음성 (Preset Voices)

  • 200개 이상의 사전 제작 음성 제공
  • 성별, 나이, 억양별 다양한 선택지

API 사용 예시

1import requests2 3url = "https://api.minimaxi.chat/v1/t2a_v2"4headers = {5    "Authorization": "Bearer YOUR_API_KEY",6    "Content-Type": "application/json"7}8payload = {9    "model": "speech-02-hd",10    "text": "안녕하세요, MiniMax TTS 테스트입니다.",11    "stream": False,12    "voice_setting": {13        "voice_id": "Korean_Female_1",14        "speed": 1.0,15        "emotion": "happy"16    },17    "audio_setting": {18        "format": "mp3",19        "sample_rate": 3200020    }21}22response = requests.post(url, json=payload, headers=headers)

요금

모델가격
speech-02-hd$0.10 / 1,000자
speech-02-turbo$0.05 / 1,000자
speech-01-hd$0.08 / 1,000자

ElevenLabs 기준 $0.30/1,000자 대비 최대 3배 저렴

댓글

아직 댓글이 없습니다.

댓글을 작성하려면 로그인이 필요합니다.