Spaces:

sassil
/

maverick-engineer

Sleeping

App Files Files Community

sassil commited on Oct 11, 2025

Commit

46a744c

verified ·

1 Parent(s): 4842030

Update app.py

Browse files

Files changed (1) hide show

app.py +87 -46

app.py CHANGED Viewed

@@ -1,15 +1,15 @@
 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
-import spaces
-# إعدادات النموذج
-MODEL_NAME = "Qwen/Qwen2.5-14B-Instruct"
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"🚀 تحميل النموذج: {MODEL_NAME}")
 print(f"💻 الجهاز المستخدم: ZeroGPU (مجاني)")
-print(f"🎉 الإصدار: Qwen2.5-Instruct (محسّن للمحادثة)")
 # تحميل Tokenizer والنموذج
 tokenizer = AutoTokenizer.from_pretrained(
@@ -26,7 +26,7 @@ model = AutoModelForCausalLM.from_pretrained(
 print("✅ تم تحميل النموذج بنجاح على ZeroGPU!")
-@spaces.GPU
 def generate_response(
     message,
     history,
@@ -38,7 +38,10 @@ def generate_response(
     repetition_penalty=1.1,
     do_sample=True
 ):
-    """دالة توليد الردود مع جميع الخيارات المتقدمة"""
     # بناء المحادثة
     messages = [{"role": "system", "content": system_message}]
@@ -82,7 +85,7 @@ def generate_response(
     return response
-# واجهة Gradio
 with gr.Blocks(
     theme=gr.themes.Soft(),
     css="""
@@ -102,9 +105,8 @@ with gr.Blocks(
     gr.Markdown(
         """
-        # 🤖 Qwen2.5-14B-Instruct - محرك ذكاء اصطناعي متقدم
-        ### نموذج محادثة قوي - مجاني 100% على ZeroGPU ⚡
-        #### 🎯 محسّن للمحادثات | متخصص في البرمجة والعلوم | دعم عربي ممتاز
         """,
         elem_classes="rtl"
     )
@@ -112,19 +114,20 @@ with gr.Blocks(
     gr.HTML(
         """
         <div class="gpu-badge">
-            ⚡ Qwen2.5-Instruct - يعمل على ZeroGPU المجاني (Nvidia H200)
         </div>
         """
     )
     with gr.Row():
         with gr.Column(scale=2):
             chatbot = gr.Chatbot(
                 height=500,
                 label="المحادثة",
                 rtl=True,
                 show_copy_button=True,
-                type="messages"
             )
             with gr.Row():
@@ -142,6 +145,7 @@ with gr.Blocks(
                 retry = gr.Button("إعادة المحاولة 🔄")
         with gr.Column(scale=1):
             gr.Markdown("### ⚙️ الإعدادات المتقدمة")
             system_message = gr.Textbox(
@@ -156,7 +160,8 @@ with gr.Blocks(
                 maximum=4096,
                 value=2048,
                 step=128,
-                label="الحد الأقصى للكلمات (Max Tokens)"
             )
             temperature = gr.Slider(
@@ -164,7 +169,8 @@ with gr.Blocks(
                 maximum=2.0,
                 value=0.7,
                 step=0.1,
-                label="الإبداع (Temperature)"
             )
             top_p = gr.Slider(
@@ -172,7 +178,8 @@ with gr.Blocks(
                 maximum=1.0,
                 value=0.9,
                 step=0.05,
-                label="Top-p (Nucleus Sampling)"
             )
             top_k = gr.Slider(
@@ -180,7 +187,8 @@ with gr.Blocks(
                 maximum=100,
                 value=50,
                 step=1,
-                label="Top-k Sampling"
             )
             repetition_penalty = gr.Slider(
@@ -188,61 +196,93 @@ with gr.Blocks(
                 maximum=2.0,
                 value=1.1,
                 step=0.05,
-                label="عقوبة التكرار"
             )
             do_sample = gr.Checkbox(
                 value=True,
-                label="استخدام Sampling"
             )
     with gr.Accordion("💡 أمثلة سريعة", open=False):
         gr.Examples(
             examples=[
                 ["اشرح لي ما هو إنترنت الأشياء IoT بطريقة مبسطة"],
-                ["اكتب كود Arduino للتحكم في محرك DC بواسطة L298N"],
-                ["ما أفضل microcontroller لمشروع IoT منزلي؟"],
-                ["اقترح مشروع أتمتة صناعية باستخدام PLC"],
-                ["كيف أربط مستشعر DHT22 مع ESP32؟"],
             ],
             inputs=msg,
             label="جرب هذه الأمثلة"
         )
-    with gr.Accordion("ℹ️ معلومات النموذج", open=False):
         gr.Markdown(
-            """
             ### 🎯 تفاصيل النموذج
-            - **النموذج**: Qwen2.5-14B-Instruct
-            - **المعاملات**: 14.7 مليار
-            - **السياق**: 32K token
-            - **GPU**: Nvidia H200 (مجاني)
             - **السرعة**: 30-50 token/ثانية
             ### ⚠️ ملاحظات
-            - مجاني 100% على ZeroGPU
-            - قد يكون هناك انتظار في أوقات الذروة
             """
         )
     # منطق التفاعل
     def user_message(message, history):
-        return "", history + [{"role": "user", "content": message}]
     def bot_response(history, system_msg, max_tok, temp, top_p_val, top_k_val, rep_pen, do_samp):
-        if not history or "role" not in history[-1]:
-            return history
-        user_msg = history[-1]["content"]
-        history_tuples = []
-        for i in range(0, len(history)-1, 2):
-            if i+1 < len(history):
-                history_tuples.append((history[i]["content"], history[i+1]["content"]))
         bot_msg = generate_response(
             user_msg,
-            history_tuples,
             system_msg,
             max_tok,
             temp,
@@ -251,10 +291,10 @@ with gr.Blocks(
             rep_pen,
             do_samp
         )
-        history.append({"role": "assistant", "content": bot_msg})
         return history
     msg.submit(
         user_message,
         [msg, chatbot],
@@ -277,10 +317,10 @@ with gr.Blocks(
         chatbot
     )
-    clear.click(lambda: [], None, chatbot, queue=False)
     retry.click(
-        lambda h: h[:-1] if h and len(h) > 0 else [],
         chatbot,
         chatbot,
         queue=False
@@ -290,6 +330,7 @@ with gr.Blocks(
         chatbot
     )
 if __name__ == "__main__":
     demo.queue(max_size=20)
     demo.launch(

 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import spaces  # مكتبة ZeroGPU المجانية
+# إعدادات النموذج - Qwen3 الأحدث للاستخدام المجاني
+MODEL_NAME = "Qwen/Qwen3-14B"  # Qwen3 الأحدث - مجاني 100%
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"🚀 تحميل النموذج: {MODEL_NAME}")
 print(f"💻 الجهاز المستخدم: ZeroGPU (مجاني)")
+print(f"🎉 الإصدار: Qwen3 (أحدث إصدار - مايو 2025)")
 # تحميل Tokenizer والنموذج
 tokenizer = AutoTokenizer.from_pretrained(
 print("✅ تم تحميل النموذج بنجاح على ZeroGPU!")
+@spaces.GPU  # هذا السطر مهم جداً للـ ZeroGPU المجاني!
 def generate_response(
     message,
     history,
     repetition_penalty=1.1,
     do_sample=True
 ):
+    """
+    دالة توليد الردود مع جميع الخيارات المتقدمة
+    تعمل على ZeroGPU المجاني من Hugging Face
+    """
     # بناء المحادثة
     messages = [{"role": "system", "content": system_message}]
     return response
+# واجهة Gradio المتقدمة
 with gr.Blocks(
     theme=gr.themes.Soft(),
     css="""
     gr.Markdown(
         """
+        # 🤖 Qwen2.5-14B - محرك الذكاء الاصطناعي المتقدم
+        ### نموذج قوي مجاني 100% على ZeroGPU ⚡
         """,
         elem_classes="rtl"
     )
     gr.HTML(
         """
         <div class="gpu-badge">
+            ⚡ يعمل على ZeroGPU المجاني (Nvidia H200) - بدون أي تكلفة!
         </div>
         """
     )
     with gr.Row():
         with gr.Column(scale=2):
+            # منطقة الدردشة
             chatbot = gr.Chatbot(
                 height=500,
                 label="المحادثة",
                 rtl=True,
                 show_copy_button=True,
+                avatar_images=(None, "https://huggingface.co/datasets/huggingface/brand-assets/resolve/main/hf-logo.png")
             )
             with gr.Row():
                 retry = gr.Button("إعادة المحاولة 🔄")
         with gr.Column(scale=1):
+            # الإعدادات المتقدمة
             gr.Markdown("### ⚙️ الإعدادات المتقدمة")
             system_message = gr.Textbox(
                 maximum=4096,
                 value=2048,
                 step=128,
+                label="الحد الأقصى للكلمات (Max Tokens)",
+                info="عدد الكلمات في الإجابة"
             )
             temperature = gr.Slider(
                 maximum=2.0,
                 value=0.7,
                 step=0.1,
+                label="الإبداع (Temperature)",
+                info="أعلى = أكثر إبداعاً، أقل = أكثر دقة"
             )
             top_p = gr.Slider(
                 maximum=1.0,
                 value=0.9,
                 step=0.05,
+                label="Top-p (Nucleus Sampling)",
+                info="يحدد تنوع الكلمات"
             )
             top_k = gr.Slider(
                 maximum=100,
                 value=50,
                 step=1,
+                label="Top-k Sampling",
+                info="عدد الكلمات المحتملة"
             )
             repetition_penalty = gr.Slider(
                 maximum=2.0,
                 value=1.1,
                 step=0.05,
+                label="عقوبة التكرار",
+                info="يمنع تكرار نفس الكلمات"
             )
             do_sample = gr.Checkbox(
                 value=True,
+                label="استخدام Sampling",
+                info="للنتائج الإبداعية والمتنوعة"
             )
+    # أمثلة سريعة
     with gr.Accordion("💡 أمثلة سريعة", open=False):
         gr.Examples(
             examples=[
                 ["اشرح لي ما هو إنترنت الأشياء IoT بطريقة مبسطة"],
+                ["كيف أصمم دائرة Arduino للتحكم في محرك؟"],
+                ["ما الفرق بين PLC و Microcontroller؟"],
+                ["اقترح مشروع أتمتة منزلية بسيط"],
+                ["اكتب لي كود Python لقراءة مستشعر حرارة"],
             ],
             inputs=msg,
             label="جرب هذه الأمثلة"
         )
+    # معلومات النموذج
+    with gr.Accordion("ℹ️ معلومات النموذج والنظام", open=False):
         gr.Markdown(
+            f"""
             ### 🎯 تفاصيل النموذج
+            - **النموذج**: Qwen2.5-14B-Instruct (14 مليار معامل)
+            - **المنصة**: Hugging Face ZeroGPU (مجاني 100%)
+            - **GPU**: Nvidia H200 (ديناميكي)
+            - **نوع البيانات**: Float16
+            - **الذاكرة**: ~28GB VRAM
             - **السرعة**: 30-50 token/ثانية
+            ### 🌟 المميزات
+            - ✅ مجاني تماماً بدون حدود يومية
+            - ✅ دعم كامل للغة العربية
+            - ✅ يفهم السياق حتى 32K token
+            - ✅ متخصص في البرمجة والعلوم
+            - ✅ آمن ومراقب من Hugging Face
             ### ⚠️ ملاحظات
+            - قد يكون هناك انتظار قصير في أوقات الذروة
+            - ZeroGPU يخصص GPU ديناميكياً عند الحاجة
+            - الجلسة تنتهي بعد 60 ثانية من عدم النشاط
+            """
+        )
+    # معلومات للمطورين
+    with gr.Accordion("👨‍💻 للمطورين - تفاصيل تقنية", open=False):
+        gr.Markdown(
+            """
+            ### كيف يعمل ZeroGPU؟
+            ```python
+            import spaces
+            @spaces.GPU  # يخصص GPU مجاناً عند استدعاء الدالة
+            def generate_response(...):
+                # الكود هنا
+            ```
+            ### المكتبات المستخدمة:
+            - `transformers`: لتحميل النموذج
+            - `torch`: للحسابات العصبية
+            - `spaces`: للوصول إلى ZeroGPU
+            - `gradio`: للواجهة التفاعلية
+            ### كيف تنسخ هذا المشروع؟
+            1. Duplicate هذا Space
+            2. غيّر MODEL_NAME إلى أي نموذج آخر (7B أو 14B)
+            3. عدّل system_message حسب احتياجك
+            4. انشر وشارك!
             """
         )
     # منطق التفاعل
     def user_message(message, history):
+        return "", history + [[message, None]]
     def bot_response(history, system_msg, max_tok, temp, top_p_val, top_k_val, rep_pen, do_samp):
+        user_msg = history[-1][0]
         bot_msg = generate_response(
             user_msg,
+            history[:-1],
             system_msg,
             max_tok,
             temp,
             rep_pen,
             do_samp
         )
+        history[-1][1] = bot_msg
         return history
+    # ربط الأحداث
     msg.submit(
         user_message,
         [msg, chatbot],
         chatbot
     )
+    clear.click(lambda: None, None, chatbot, queue=False)
     retry.click(
+        lambda h: h[:-1] if h else h,
         chatbot,
         chatbot,
         queue=False
         chatbot
     )
+# تشغيل التطبيق
 if __name__ == "__main__":
     demo.queue(max_size=20)
     demo.launch(