Spaces:

FaizTech
/

my-whispers-api

Sleeping

App Files Files Community

FaizTech commited on Jul 23, 2025

Commit

f6af0d3

verified ·

1 Parent(s): e189346

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -9

app.py CHANGED Viewed

@@ -1,31 +1,66 @@
 import gradio as gr
 from transformers import pipeline
 import torch
-# اختر الجهاز: استخدم GPU إذا كان متاحاً في الـ Space، وإلا CPU
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
-# تحميل الـ pipeline للنموذج العربي البديل والممتاز
 pipe = pipeline(
     "automatic-speech-recognition",
-    model="openai-community/whisper-large-v3-arabic", # <<<--- هذا هو التغيير
-    device=device
 )
 def transcribe(audio):
     if audio is None:
         return "لم يتم رفع أي ملف صوتي."
-    # استدعاء النموذج لتحويل الصوت (المسار المؤقت للملف)
-    text = pipe(audio)["text"]
-    return text
-# بناء واجهة Gradio التي ستوفر لنا الـ API
 gr.Interface(
     fn=transcribe,
     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
     outputs=gr.Textbox(label="النص المُحوَّل"),
     title="API لتحويل الكلام العربي إلى نص",
-    description="واجهة لنموذج Whisper المتخصص باللغة العربية (openai-community/whisper-large-v3-arabic).",
     allow_flagging="never"
 ).launch()

+# import gradio as gr
+# from transformers import pipeline
+# import torch
+# # اختر الجهاز: استخدم GPU إذا كان متاحاً في الـ Space، وإلا CPU
+# device = "cuda:0" if torch.cuda.is_available() else "cpu"
+# # تحميل الـ pipeline للنموذج العربي البديل والممتاز
+# pipe = pipeline(
+#     "automatic-speech-recognition",
+#     model="openai-community/whisper-large-v3-arabic", # <<<--- هذا هو التغيير
+#     device=device
+# )
+# def transcribe(audio):
+#     if audio is None:
+#         return "لم يتم رفع أي ملف صوتي."
+#     # استدعاء النموذج لتحويل الصوت (المسار المؤقت للملف)
+#     text = pipe(audio)["text"]
+#     return text
+# # بناء واجهة Gradio التي ستوفر لنا الـ API
+# gr.Interface(
+#     fn=transcribe,
+#     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
+#     outputs=gr.Textbox(label="النص المُحوَّل"),
+#     title="API لتحويل الكلام العربي إلى نص",
+#     description="واجهة لنموذج Whisper المتخصص باللغة العربية (openai-community/whisper-large-v3-arabic).",
+#     allow_flagging="never"
+# ).launch()
 import gradio as gr
 from transformers import pipeline
 import torch
+# اختر الجهاز
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
+# تحميل الـ pipeline للنموذج العربي الجديد والمتاح
 pipe = pipeline(
     "automatic-speech-recognition",
+    model="bakri/whisper-large-v2-arabic", # <<<--- هذا هو النموذج الجديد والمتاح حالياً
+    device=device,
+    torch_dtype=torch.float16 if device != "cpu" else torch.float32 # تحسين الأداء على الـ GPU
 )
 def transcribe(audio):
     if audio is None:
         return "لم يتم رفع أي ملف صوتي."
+    # استدعاء النموذج لتحويل الصوت
+    # إضافة chunk_length_s و stride_length_s يمكن أن يساعد في معالجة الملفات الطويلة
+    result = pipe(audio, chunk_length_s=30, stride_length_s=5, return_timestamps=False)
+    return result["text"]
+# بناء واجهة Gradio
 gr.Interface(
     fn=transcribe,
     inputs=gr.Audio(sources=["upload"], type="filepath", label="ارفع ملفاً صوتياً"),
     outputs=gr.Textbox(label="النص المُحوَّل"),
     title="API لتحويل الكلام العربي إلى نص",
+    description="واجهة لنموذج Whisper المتخصص باللغة العربية (bakri/whisper-large-v2-arabic).",
     allow_flagging="never"
 ).launch()