Spaces:

FaizTech
/

my-whispers-api

Sleeping

App Files Files Community

FaizTech commited on Jul 23, 2025

Commit

6ade6c2

verified ·

1 Parent(s): f6af0d3

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -35

app.py CHANGED Viewed

@@ -1,49 +1,35 @@
-# import gradio as gr
-# from transformers import pipeline
-# import torch
-# # اختر الجهاز: استخدم GPU إذا كان متاحاً في الـ Space، وإلا CPU
-# device = "cuda:0" if torch.cuda.is_available() else "cpu"
-# # تحميل الـ pipeline للنموذج العربي البديل والممتاز
-# pipe = pipeline(
-#     "automatic-speech-recognition",
-#     model="openai-community/whisper-large-v3-arabic", # <<<--- هذا هو التغيير
-#     device=device
-# )
-# def transcribe(audio):
-#     if audio is None:
-#         return "لم يتم رفع أي ملف صوتي."
-#     # استدعاء النموذج لتحويل الصوت (المسار المؤقت للملف)
-#     text = pipe(audio)["text"]
-#     return text
-# # بناء واجهة Gradio التي ستوفر لنا الـ API
-# gr.Interface(
-#     fn=transcribe,
-#     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
-#     outputs=gr.Textbox(label="النص المُحوَّل"),
-#     title="API لتحويل الكلام العربي إلى نص",
-#     description="واجهة لنموذج Whisper المتخصص باللغة العربية (openai-community/whisper-large-v3-arabic).",
-#     allow_flagging="never"
-# ).launch()
-import gradio as gr
-from transformers import pipeline
-import torch
 # اختر الجهاز
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
-# تحميل الـ pipeline للنموذج العربي الجديد والمتاح
 pipe = pipeline(
     "automatic-speech-recognition",
-    model="bakri/whisper-large-v2-arabic", # <<<--- هذا هو النموذج الجديد والمتاح حالياً
     device=device,
-    torch_dtype=torch.float16 if device != "cpu" else torch.float32 # تحسين الأداء على الـ GPU
 )
 def transcribe(audio):
@@ -51,7 +37,6 @@ def transcribe(audio):
         return "لم يتم رفع أي ملف صوتي."
     # استدعاء النموذج لتحويل الصوت
-    # إضافة chunk_length_s و stride_length_s يمكن أن يساعد في معالجة الملفات الطويلة
     result = pipe(audio, chunk_length_s=30, stride_length_s=5, return_timestamps=False)
     return result["text"]
@@ -61,6 +46,6 @@ gr.Interface(
     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
     outputs=gr.Textbox(label="النص المُحوَّل"),
     title="API لتحويل الكلام العربي إلى نص",
-    description="واجهة لنموذج Whisper المتخصص باللغة العربية (bakri/whisper-large-v2-arabic).",
     allow_flagging="never"
 ).launch()

+import gradio as gr
+from transformers import pipeline
+import torch
+import os # <<< إضافة جديدة لقراءة المتغيرات
+# --- بداية التعديلات المهمة ---
+# 1. اقرأ الـ Token من الـ Secrets الخاصة بالـ Space
+# استخدمنا os.getenv لقراءته
+HF_TOKEN = os.getenv("HUGGING_FACE_TOKEN")
+# 2. تحقق من وجود الـ Token (للأمان)
+if HF_TOKEN is None:
+    raise ValueError("لم يتم العثور على HUGGING_FACE_TOKEN في أسرار الـ Space. يرجى إضافته.")
+# 3. اختر النموذج الذي تريده. لنبدأ بنموذج bakri لأنه موثوق.
+MODEL_NAME = "bakri/whisper-large-v2-arabic"
+# --- نهاية التعديلات المهمة ---
 # اختر الجهاز
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
+torch_dtype = torch.float16 if device != "cpu" else torch.float32
+# تحميل الـ pipeline مع تمرير الـ Token بشكل صريح
 pipe = pipeline(
     "automatic-speech-recognition",
+    model=MODEL_NAME,
+    token=HF_TOKEN,  # <<<--- هذه هي الإضافة السحرية التي تجبره على استخدام الـ Token
     device=device,
+    torch_dtype=torch_dtype
 )
 def transcribe(audio):
         return "لم يتم رفع أي ملف صوتي."
     # استدعاء النموذج لتحويل الصوت
     result = pipe(audio, chunk_length_s=30, stride_length_s=5, return_timestamps=False)
     return result["text"]
     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
     outputs=gr.Textbox(label="النص المُحوَّل"),
     title="API لتحويل الكلام العربي إلى نص",
+    description=f"واجهة لنموذج Whisper المتخصص باللغة العربية ({MODEL_NAME}).",
     allow_flagging="never"
 ).launch()