Spaces:

Opera8
/

Podgen2

Paused

App Files Files Community

Opera8 commited on May 11

Commit

a812348

verified ·

1 Parent(s): 090ff20

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -11

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ import logging
 import random
 import base64
 import atexit
 from datetime import datetime, timedelta
 from itertools import cycle
 from flask import Flask, request, jsonify, render_template, send_file
@@ -186,7 +187,8 @@ def generate_podcast_in_background(task_id, system_prompt, safety_settings):
                 if not raw_text: raise ValueError("بدون پاسخ از مدل هوش مصنوعی")
                 json_string = None
-                match = re.search(r"```json\s*(\{.*?\})\s*```", raw_text, re.DOTALL)
                 if match: json_string = match.group(1)
                 else:
                     s_idx = raw_text.find('{')
@@ -291,20 +293,41 @@ Dialogue rules: No stage directions like [laugh], (sigh). Just spoken words."""
         combined_audio = AudioSegment.empty()
         for index, turn in enumerate(script_turns):
             speaker_id = turn.get("speaker_id")
-            dialogue = turn.get("dialogue")
-            payload = {"text": dialogue, "speaker": speaker_id, "temperature": 0.9, "is_custom": False}
-            idx, audio_seg = call_worker(index, payload)
-            if not audio_seg:
-                raise ValueError(f"خطا در تولید صدای نوبت {index+1} از سرورهای پردازش صدا")
-            combined_audio += audio_seg
-            with tasks_lock:
-                tasks[task_id]['progress'] = f'در حال تولید صدا ({index+1} از {total_turns} تکمیل شده)'
         # 3. میکس و ذخیره فایل
         with tasks_lock:

 import random
 import base64
 import atexit
+import concurrent.futures
 from datetime import datetime, timedelta
 from itertools import cycle
 from flask import Flask, request, jsonify, render_template, send_file
                 if not raw_text: raise ValueError("بدون پاسخ از مدل هوش مصنوعی")
                 json_string = None
+                match = re.search(r"```json\s*(\{.*?\})\s*
+```", raw_text, re.DOTALL)
                 if match: json_string = match.group(1)
                 else:
                     s_idx = raw_text.find('{')
         combined_audio = AudioSegment.empty()
+        valid_speaker_ids = [s['id'] for s in speakers]
+        default_speaker_id = speakers[0]['id'] if speakers else "Charon"
+        payloads = []
         for index, turn in enumerate(script_turns):
             speaker_id = turn.get("speaker_id")
+            # بررسی صحت شناسه گوینده، اگر معتبر نبود گوینده اول انتخاب می‌شود
+            if speaker_id not in valid_speaker_ids:
+                speaker_id = default_speaker_id
+            dialogue = turn.get("dialogue")
+            payloads.append((index, {"text": dialogue, "speaker": speaker_id, "temperature": 0.9, "is_custom": False}))
+        audio_segments = [None] * total_turns
+        # ارسال همزمان تمام درخواست‌های صدا به کارگرها
+        with concurrent.futures.ThreadPoolExecutor(max_workers=min(20, total_turns)) as executor:
+            futures = {executor.submit(call_worker, idx, payload): idx for idx, payload in payloads}
+            completed_count = 0
+            for future in concurrent.futures.as_completed(futures):
+                idx = futures[future]
+                res_idx, audio_seg = future.result()
+                if not audio_seg:
+                    raise ValueError(f"خطا در تولید صدای نوبت {idx+1} از سرورهای پردازش صدا")
+                audio_segments[idx] = audio_seg
+                completed_count += 1
+                with tasks_lock:
+                    tasks[task_id]['progress'] = f'در حال تولید صدا ({completed_count} از {total_turns} تکمیل شده)'
+        # چسباندن فایل‌ها به یکدیگر بر اساس ترتیب
+        for seg in audio_segments:
+            combined_audio += seg
         # 3. میکس و ذخیره فایل
         with tasks_lock: