- https://elevenlabs.io/docs/product
- Create
- Text to Speech (Speech Synthesis)
- Voice Selection
- Default : 모든 사용자에게 제공되고 품질이 보장된최신모델 지원 음성.
- Clone Instant : 짧은 음성으로 (광범위한 훈련없이) 빠르게 복제하여 간편히 사용가능.
- Clone Professional : 더 큰 데이터셋으로 훈련하여, 사실적인 복제가능. (Creator 플랜 이상만)
- Design(Synthetic) : 프롬프트,성별,나이,악센트 등으로 디자인한 음성. (인간목소리기반X, 공유X, 유니크O)
- Library : PCV 를 공유할수있는 마켓플래이스.
- Voice Settings
- Stability : 낮을수록 더 큰 감정의 범위로 흥분되게 말함. 높을수록 더 절제됨 감정으로 단조롭게 말함.
- Similarity : 얼마나 밀접하게 따라할지를 정함. (원본 품질에 소음도 포함해서...)
- Style Exaggeration : 더 극적인 과장을 적용함. (지연시간 추가 및 안정성 낮춤)
- Speaker Boost : 더 많은 계산을 통해 미묘하게 유사성을 높임.
- Model Selection
- Multilingual v2 :
- 품질과 정확성에 최적화되어 있으며, 콘텐츠 생성에 이상적입니다.
- 지연 시간은 더 김.
- Turbo v2.5 :
- Multilingual v2 보다 300% 더 빠르며 32개 언어 지원.
- Multilingual v2 보다 정확도는 약간 낮음.
- low-latency applications like real-time conversational AI.
- Multilingual v2 :
- Prompting
- Pause : 과도하게 사용 금지. 예) <break time="1.5s" />
- Alt Pause : dash(-) 를 사용하여 할수도있지만, 보장안함. 그리고 ... 은 뤼앙스까지 영향줘서 비추!
- Pronunciation : 구 모델에서는 IPA 이나 CMU 발음 양식을 지원하긴하는데...
- Emotion : 소설책 처럼 작성하면 된다는데... ?!?!?!
- Pacing : 음성 복제시, "단일 긴 샘플 >>> 여러 개의 작은 샘플" 이론이 있다고 함...
- Voice Selection
- Speech to Speech (Voice Changer)
- ...
- Sound Effects
- ...
- Text to Speech (Speech Synthesis)
- Voices
- Default
- Long-term availability, Consistent quality, Priority model support
- (Multilingual v2 혹은 Turbo v2.5 같은) Multilingual-Models 을 통해 32 개국 언어를 지원함.
- 가끔씩 특정 언어들에서 삑~사리가 날수 있음...
- Design(Generate)
- 프롬프트 등등을 기반으로 나만의 유니크한 음성을 만들 수 있음!
- Realistic Type : ...
- Character Type : ...
- Cloning Instant
- TODO : ...
- Cloning Professional
- TODO : ...
- Library : ...
- Default
- Workflows
- Projects
- Dubbing Studio
- Voiceover Studio
- Audio Native
-끝-
'AI' 카테고리의 다른 글
Elevenlabs Docs (dev/api) (0) | 2024.12.08 |
---|---|
Lang🦜 (feat. teddynote) (0) | 2024.10.24 |
OpenAI Cookbook (0) | 2024.05.25 |
OpenAI Doc2 (0) | 2024.05.25 |
OpenAI Cookbook (CHAT COMPLETIONS) (0) | 2024.05.24 |