XurmoTTS

XurmoTTS — o‘zbek tilidagi neural Text-to-Speech (TTS) modeli bo‘lib, matndan tabiiy ovoz sintezi yaratish uchun ishlab chiqilgan.

Model Coqui TTS framework’i asosida Google Colab muhitida o‘qitilgan va o‘zbek tilidagi real nutq namunalaridan foydalanilgan.


Loyiha haqida

Ushbu modelni yaratish jarayoni taxminan 1 hafta davom etdi. Dataset tayyorlash va tozalashning katta qismi qo‘lda va maxsus skriptlar yordamida bajarildi. Butun loyiha davomida hech qancha pul sarflanmadi va mutlaqo BEPULGA yaratildi.

Dataset manbasi sifatida YouTube’dagi Xurmo Media kanalidagi ochiq videolardan foydalanilgan:

https://www.youtube.com/@Xurmomedia


Dataset tayyorlash jarayoni

Dataset oddiy audio yig‘ish orqali emas, bir nechta bosqichli pipeline yordamida tayyorlangan.

Jarayon quyidagilarni o‘z ichiga oladi:

  • Videolardan audio ajratib olish
  • Maxsus algoritmlar yordamida audioni kichik segmentlarga bo‘lish
  • AI Speech Recognition tizimlari yordamida transkripsiya yaratish
  • Audio va matn mosligini tekshirish
  • Shovqinli va sifatsiz segmentlarni filtrlash
  • Maxsus Python skriptlari yordamida dataset tozalash
  • O‘zbek kirill va lotin yozuvlarini normallashtirish
  • Modelni Coqui TTS yordamida o‘qitish

Dataset sifati imkon qadar yaxshilanishi uchun ko‘plab segmentlar qo‘lda tekshirilgan.


Model imkoniyatlari

  • O‘zbek tilida nutq sintezi
  • Neural voice synthesis
  • Lotin va kirill yozuvlarini qo‘llab-quvvatlash
  • Tabiiyroq intonatsiya
  • Coqui TTS bilan mos ishlash

Ishlatish namunasi

pip install --upgrade pip
pip install cython
pip install llvmlite
pip install coqui-tts
from TTS.api import TTS
from huggingface_hub import snapshot_download
import os

# Hugging Face-dan model papkasini kompyuter keshiga yuklab olish
model_dir = snapshot_download(repo_id="jahongirtech/XurmoTTS")

model_path = os.path.join(model_dir, "model.pth") # Repodagi .pth fayl nomi
config_path = os.path.join(model_dir, "config.json")

# Modelni ishga tushirish
tts = TTS(model_path=model_path, config_path=config_path, gpu=False)

tts.tts_to_file(
    text="Xurmo media loyihasi muvoffaqqiyatli ishlayapdi",
    file_path="output.wav"
)

Muhim eslatma

Ushbu loyiha tadqiqot va ta’lim maqsadlarida yaratilgan.

Modeldagi ovozlar real insonlarga tegishli bo‘lishi mumkin. Har bir insonning ovozi o‘ziga tegishli hisoblanadi va undan mas’uliyat bilan foydalanish kerak.

Quyidagilar tavsiya etilmaydi:

  • Boshqa inson ovozini o‘zingizniki sifatida ko‘rsatish
  • YouTube yoki boshqa platformalardagi insonlar ovozini noqonuniy nusxalash
  • Aldov, fake kontent yoki impersonation yaratish
  • Tijoriy maqsadlarda foydalanish
  • Ovoz klonlash orqali insonlarni chalg‘itish

Muallif modeldan noto‘g‘ri foydalanish uchun javobgar emas.


License

GPL License

Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support