Text-to-speech datasets - a bezzam Collection

bezzam 's Collections

Omnilingual ASR (1,600+ Languages)

Multimodel audio

Speech recognition datasets

Text-to-speech datasets

DigiCam (CelebA)

DiffuserCam Mirflickr

Text-to-speech datasets

updated Dec 8, 2025

Wenetspeech4TTS/WenetSpeech4TTS

Updated Jul 25, 2024 • 2.49k • 86

Note Mandarin
Seed-TTS: A Family of High-Quality Versatile Speech Generation Models

Paper • 2406.02430 • Published Jun 4, 2024 • 38

Note English and Mandarin seed-tts-eval dataset: https://github.com/BytedanceSpeech/seed-tts-eval
HKUSTAudio/Llasa_opensource_speech_data_160k_hours_tokenized

Updated Feb 13, 2025 • 547 • 30