Spaces:

alidw
/

voice

Sleeping

App Files Files Community

alidw commited on Dec 5, 2025

Commit

4a37de7

verified ·

1 Parent(s): b050106

Create app.py

Browse files

Files changed (1) hide show

app.py +146 -0

app.py ADDED Viewed

	@@ -0,0 +1,146 @@

+import gradio as gr
+import numpy as np
+from tts_arabic import tts as arabic_tts
+# حسب كارت الموديل، الـ vocoder يخرج 22.05 kHz
+SAMPLE_RATE = 22050
+def generate_tts(
+    text,
+    speaker,
+    pace,
+    denoise,
+    volume,
+    vowelizer,
+    model_id,
+    vocoder_id,
+):
+    text = (text or "").strip()
+    if not text:
+        return None, "❌ الرجاء إدخال نص عربي."
+    # اختيار موديول التشكيل
+    if vowelizer == "بدون تشكيل":
+        vowelizer_arg = None
+    else:
+        vowelizer_arg = vowelizer  # مثل: "shakkelha" أو "catt_eo"
+    try:
+        # استدعاء مكتبة tts_arabic
+        wave = arabic_tts(
+            text,
+            speaker=int(speaker),      # 0–3
+            pace=float(pace),          # سرعة الكلام
+            denoise=float(denoise),    # إزالة الضوضاء
+            volume=float(volume),      # مستوى الصوت
+            play=False,                # لا نستخدم تشغيل داخلي
+            pitch_mul=1.0,
+            pitch_add=0.0,
+            vowelizer=vowelizer_arg,   # موديول التشكيل أو None
+            model_id=model_id,         # fastpitch / mixer128 / mixer80
+            vocoder_id=vocoder_id,     # hifigan / vocos / vocos44
+            cuda=None,                 # CPU فقط
+            save_to=None,              # لا نحفظ تلقائيًا
+        )
+        # wave هو numpy array
+        if isinstance(wave, list):
+            wave = np.array(wave, dtype=np.float32)
+        return (SAMPLE_RATE, wave), "✅ تم توليد الصوت بنجاح."
+    except Exception as e:
+        return None, f"❌ حدث خطأ أثناء التوليد: {e}"
+with gr.Blocks(title="Arabic TTS (ONNX / CPU)") as demo:
+    gr.Markdown(
+        """
+        # 🔊 Arabic TTS (FastPitch + HiFi-GAN ONNX)
+        نموذج تحويل النص العربي إلى كلام، خفيف وسريع، يعمل بالكامل على **CPU المجاني** في Hugging Face.
+        - يدعم ٤ متحدثين (0–3)
+        - يمكن استخدام تشكيل تلقائي للنص لتحسين النطق
+        - مبني على مكتبة [`tts_arabic`](https://github.com/nipponjo/tts_arabic)
+        """
+    )
+    with gr.Row():
+        text = gr.Textbox(
+            label="النص العربي",
+            lines=4,
+            placeholder="اكتب هنا الجملة أو الفقرة التي تريد تحويلها إلى صوت...",
+        )
+    with gr.Row():
+        speaker = gr.Dropdown(
+            choices=["0", "1", "2", "3"],
+            value="1",
+            label="المتحدث (Speaker ID)",
+            info="جرّب أرقام مختلفة لاختيار صوت مختلف.",
+        )
+        pace = gr.Slider(
+            minimum=0.6,
+            maximum=1.4,
+            value=1.0,
+            step=0.05,
+            label="سرعة الكلام (pace)",
+        )
+    with gr.Row():
+        denoise = gr.Slider(
+            minimum=0.0,
+            maximum=0.02,
+            value=0.005,
+            step=0.001,
+            label="إزالة الضوضاء (denoise)",
+        )
+        volume = gr.Slider(
+            minimum=0.4,
+            maximum=1.0,
+            value=0.9,
+            step=0.05,
+            label="مستوى الصوت (volume)",
+        )
+    vowelizer = gr.Dropdown(
+        choices=["بدون تشكيل", "shakkelha", "catt_eo"],
+        value="بدون تشكيل",
+        label="تشكيل تلقائي للنص (Vowelizer)",
+        info="اختَر 'shakkelha' لتحسين النطق إذا كان النص غير مشكّل (أبطأ قليلاً).",
+    )
+    with gr.Row():
+        model_id = gr.Radio(
+            choices=["fastpitch", "mixer128", "mixer80"],
+            value="fastpitch",
+            label="موديل Text→Mel",
+            info="fastpitch عادةً أعلى جودة، mixer أسرع وأخف.",
+        )
+        vocoder_id = gr.Radio(
+            choices=["hifigan", "vocos", "vocos44"],
+            value="hifigan",
+            label="Vocoder",
+            info="vocos44 يعطي جودة أعلى (44.1kHz) لكنه أبطأ قليلاً.",
+        )
+    btn = gr.Button("🎙️ توليد الصوت")
+    out_audio = gr.Audio(
+        label="الصوت الناتج",
+        type="numpy",
+    )
+    status = gr.Textbox(
+        label="الحالة",
+        interactive=False,
+    )
+    btn.click(
+        fn=generate_tts,
+        inputs=[text, speaker, pace, denoise, volume, vowelizer, model_id, vocoder_id],
+        outputs=[out_audio, status],
+    )
+if __name__ == "__main__":
+    demo.launch()