Spaces:

WSYBYT
/

ybtts

Running

App Files Files Community

masbudjj commited on Oct 22, 2025

Commit

1ee51d6

verified ·

1 Parent(s): dcf8ebd

Major Update: Kokoro-82M with 54 Premium Voices

Browse files

# 🎙️ Kokoro-82M Implementation - 54 Premium Voices

## Major Changes:
- ✅ Replace SpeechT5 with Kokoro-82M
- ✅ 54 premium voices (American & British)
- ✅ StyleTTS 2 architecture (82M parameters)
- ✅ Gradio backend for better UX
- ✅ HF Inference API integration

## Voice Categories:
1. 🇺🇸 American Female (11 voices)
2. 🇺🇸 American Male (8 voices)
3. 🇬🇧 British Female (4 voices)
4. 🇬🇧 British Male (4 voices)

## Technology:
- Model: hexgrad/Kokoro-82M
- Architecture: StyleTTS 2 + ISTFTNet
- Backend: Gradio 4.x
- API: Hugging Face Inference

## Features:
- 54 unique voice characters
- Speed control (0.5x - 2x)
- High-quality audio output
- Natural prosody & emotion
- Fast generation (~2-5s)

Files changed (1) hide show

requirements.txt +4 -0

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+gradio>=4.0.0
+numpy
+scipy
+requests