Spaces:

farid678
/

lipsDetection

Running

farid678 commited on Oct 12, 2025

Commit

e900cc0

verified ·

1 Parent(s): 59b3f90

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,34 +7,35 @@ import os
 # -----------------------------
 # بارگذاری مدل Whisper
 # -----------------------------
-print("🎧 Loading Whisper model (base)...")
-model = whisper.load_model("large-v3")  # می‌توانید "small", "medium", یا "large" هم بگذارید
 # -----------------------------
 # تابع پردازش ویدیو و تبدیل به متن
 # -----------------------------
-def transcribe_video(video):
-    # ذخیره موقت ویدیو
-    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp4") as tmp_video:
-        tmp_video.write(video.read())
-        tmp_video_path = tmp_video.name
-    # استخراج صدا با ffmpeg
-    tmp_audio_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
-    subprocess.run(
-        ["ffmpeg", "-y", "-i", tmp_video_path, "-ar", "16000", "-ac", "1", tmp_audio_path],
-        stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL
-    )
-    # تبدیل صدا به متن
-    result = model.transcribe(tmp_audio_path, fp16=False)
-    text = result["text"].strip()
-    # پاک کردن فایل‌های موقت
-    os.remove(tmp_video_path)
-    os.remove(tmp_audio_path)
-    return text or "متنی شناسایی نشد."
 # -----------------------------
 # رابط کاربری Gradio

 # -----------------------------
 # بارگذاری مدل Whisper
 # -----------------------------
+print("🎧 Loading Whisper model (large-v3)...")
+model = whisper.load_model("large-v3")  # می‌توانید small, medium, large هم انتخاب کنید
 # -----------------------------
 # تابع پردازش ویدیو و تبدیل به متن
 # -----------------------------
+def transcribe_video(video_path):  # video_path یک رشته مسیر فایل است
+    try:
+        # ایجاد فایل صوتی موقت
+        tmp_audio_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
+        # استخراج صدا با ffmpeg
+        subprocess.run(
+            ["ffmpeg", "-y", "-i", video_path, "-ar", "16000", "-ac", "1", tmp_audio_path],
+            stdout=subprocess.DEVNULL,
+            stderr=subprocess.DEVNULL
+        )
+        # تبدیل صدا به متن
+        result = model.transcribe(tmp_audio_path, fp16=False)
+        text = result["text"].strip()
+        # پاک کردن فایل صوتی موقت
+        os.remove(tmp_audio_path)
+        return text or "متنی شناسایی نشد."
+    except Exception as e:
+        return f"⚠️ خطا در پردازش ویدیو: {e}"
 # -----------------------------
 # رابط کاربری Gradio