Text-to-Speech
Chatterbox
Safetensors
Arabic
Saudi
Arabic
Saudi-Dialect
Chatterbox
TTS
voice-cloning
multilingual-tts
Instructions to use NAMAA-Space/NAMAA-Saudi-TTS with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Chatterbox
How to use NAMAA-Space/NAMAA-Saudi-TTS with Chatterbox:
# pip install chatterbox-tts import torchaudio as ta from chatterbox.tts import ChatterboxTTS model = ChatterboxTTS.from_pretrained(device="cuda") text = "Ezreal and Jinx teamed up with Ahri, Yasuo, and Teemo to take down the enemy's Nexus in an epic late-game pentakill." wav = model.generate(text) ta.save("test-1.wav", wav, model.sr) # If you want to synthesize with a different voice, specify the audio prompt AUDIO_PROMPT_PATH="YOUR_FILE.wav" wav = model.generate(text, audio_prompt_path=AUDIO_PROMPT_PATH) ta.save("test-2.wav", wav, model.sr) - Notebooks
- Google Colab
- Kaggle
ملاحظاتي على النموذج بعد عده تجارب
#3
by xyousefx - opened
جربت النموذج في مشروع بودكاست متعدد الشخصيات وعندي ملاحظات:
١. مخارج الحروف تميل للفصحى حتى مع نصوص عامية واضحة
٢. اللهجة الحجازية غير مدعومة بشكل واضح
٣. النصوص الطويلة تسبب تذبذب في جودة الصوت
٤. ملفات المرجع القصيرة لا تكفي لتثبيت اللهجة
هل هناك خطط لدعم اللهجات الحجازية من مكة والطائف و جدة والمدينة في الإصدارات القادمة؟
Thanks for the feedback, we work on second version of the model where we are willing to solve these issues.. We also want to makw it support other sub dialect of Saudi Arabia but there is a shortage in the dataset, soon we will see more models with better coverage and performance
Omartificial-Intelligence-Space changed discussion status to closed