Spaces:

Rezfars
/

Ttskhodam

Configuration error

App Files Files Community

Rezfars commited on Nov 10, 2025

Commit

d3d6012

verified ·

1 Parent(s): e1987b8

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -53

app.py CHANGED Viewed

@@ -1,58 +1,20 @@
-import gradio as gr
-import pyttsx3
-from pydub import AudioSegment
-import tempfile
-import os
-def tts_dialogue(text, speed_a, tone_a, speed_b, tone_b):
-    lines = [l.strip() for l in text.split("\n") if l.strip()]
-    engine = pyttsx3.init()
-    voices = engine.getProperty("voices")
-    voice_a = voices[0].id if len(voices) > 0 else None
-    voice_b = voices[1].id if len(voices) > 1 else voices[0].id
-    combined_audio = AudioSegment.silent(duration=0)
-    for line in lines:
-        if line.startswith("A:"):
-            voice = voice_a
-            rate = 150 + int(speed_a)
-        elif line.startswith("B:"):
-            voice = voice_b
-            rate = 150 + int(speed_b)
-        else:
-            voice = voice_a
-            rate = 150
-        text_to_speak = line.split(":", 1)[-1].strip()
-        engine.setProperty("voice", voice)
-        engine.setProperty("rate", rate)
-        tmp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
-        engine.save_to_file(text_to_speak, tmp_file.name)
-        engine.runAndWait()
-        segment = AudioSegment.from_wav(tmp_file.name)
-        combined_audio += segment + AudioSegment.silent(duration=300)
-        os.remove(tmp_file.name)
-    out_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
-    combined_audio.export(out_path, format="wav")
-    return out_path
-demo = gr.Interface(
-    fn=tts_dialogue,
-    inputs=[
-        gr.Textbox(label="متن گفت‌وگو (A و B)", lines=8, placeholder="A: سلام، خوبی؟\nB: ممنون، تو چطوری؟"),
-        gr.Slider(-50, 50, value=0, step=5, label="سرعت صدا A"),
-        gr.Slider(-50, 50, value=0, step=5, label="لحن صدا A (pitch)"),
-        gr.Slider(-50, 50, value=0, step=5, label="سرعت صدا B"),
-        gr.Slider(-50, 50, value=0, step=5, label="لحن صدا B (pitch)"),
-    ],
-    outputs=gr.Audio(label="فایل صوتی ترکیبی نهایی", type="filepath"),
-    title="🗣️ گفت‌وگوی دو نفره فارسی بدون API",
-    description="هر خط گفت‌وگو را با A: یا B: شروع کنید. خروجی ترکیبی با دو صدا تولید می‌شود."
-)
-if __name__ == "__main__":
-    demo.launch()

+import gradio as gr from gtts import gTTS from pydub import AudioSegment import tempfile import os
+def tts_dialogue_gtts(text, pause_ms=300): """ تولید فایل صوتی ترکیبی از گفت‌وگوی دو نفره فارسی با gTTS. هر خط با A: یا B: شروع شود. :param text: متن گفت‌وگو :param pause_ms: فاصله بین دیالوگ‌ها به میلی‌ثانیه :return: مسیر فایل WAV ترکیبی """ lines = [l.strip() for l in text.split("\n") if l.strip()] combined_audio = AudioSegment.silent(duration=0)
+for line in lines:
+    speaker_text = line.split(":", 1)[-1].strip()
+    tts = gTTS(text=speaker_text, lang="fa")
+    tmp = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
+    tts.save(tmp.name)
+    segment = AudioSegment.from_mp3(tmp.name)
+    combined_audio += segment + AudioSegment.silent(duration=pause_ms)
+    os.remove(tmp.name)
+out_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
+combined_audio.export(out_path, format="wav")
+return out_path
+demo = gr.Interface( fn=tts_dialogue_gtts, inputs=[ gr.Textbox(label="متن گفت‌وگو (A و B)", lines=8, placeholder="A: سلام، خوبی؟\nB: ممنون، تو چطوری؟"), gr.Slider(100, 1000, value=300, step=50, label="فاصله بین دیالوگ‌ها (میلی‌ثانیه)"), ], outputs=gr.Audio(label="فایل صوتی ترکیبی نهایی", type="filepath"), title="🗣️ گفت‌وگوی دو نفره فارسی بدون API", description="هر خط گفت‌وگو را با A: یا B: شروع کنید. خروجی ترکیبی با gTTS تولید می‌شود.", )
+if name == "main": demo.launch()