Spaces:

sassil
/

maverick-engineer

Sleeping

App Files Files Community

sassil commited on Oct 4, 2025

Commit

7d85ac1

1 Parent(s): 652d7f7

1

Browse files

Files changed (2) hide show

app.py +58 -83
requirements.txt +6 -4

app.py CHANGED Viewed

@@ -1,84 +1,59 @@
 import gradio as gr
-import requests
-import os
-import json
-from huggingface_hub import HfFolder
-# 1. إعداد API الداخلي (Hugging Face Inference API)
-# يتم استخدام نقطة النهاية الرسمية لـ HF Inference API
-API_URL = "https://api-inference.huggingface.co/models/"
-# DeepSeek-V3.2-Exp هو نموذج ضخم، سنستخدم نموذج DeepSeek V3.1-Terminus المتاح للاستدلال
-# NOTE: DeepSeek V3.2 Exp is not yet widely available on the free Inference API tier.
-MODEL_ID = "deepseek-ai/DeepSeek-V3.1-Terminus"
-# يتم سحب مفتاح HF_TOKEN من إعدادات Space Secrets
-# يجب أن يكون لديك HF_TOKEN أو MAVERICK_API_KEY مع صلاحية (Write/Read)
-# الكود يبحث عن المفتاح في المتغيرات البيئية
-API_KEY = os.environ.get("MAVERICK_API_KEY") or HfFolder.get_token()
-# 2. دالة توليد الاستجابة (API Call)
-def generate_response(message, history):
-    # 2.1 التحقق من المفتاح السري (Critical Check)
-    if not API_KEY:
-        yield "⚠️ فشل المصادقة: يرجى إضافة مفتاح API لـ Hugging Face باسم HF_TOKEN أو MAVERICK_API_KEY في إعدادات Space Secrets."
-        return
-    # 2.2 بناء سياق الدردشة لـ API
-    # يجب تحويل سجل الدردشة إلى سلسلة نصية بسيطة لأن Inference API لا يدعم تنسيق OpenAI Messages بالكامل
-    conversation = [f"System: أنت مساعد هندسي متخصص. أجب بدقة ومباشرة.\n"]
-    for user_msg, bot_msg in history:
-        conversation.append(f"User: {user_msg}\nAssistant: {bot_msg}\n")
-    # إضافة الرسالة الحالية
-    conversation.append(f"User: {message}\nAssistant:")
-    full_prompt = "".join(conversation)
-    # 2.3 تنفيذ طلب API (Hugging Face)
-    headers = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}
-    # نقطة النهاية الفعلية للموديل
-    endpoint = f"{API_URL}{MODEL_ID}"
-    # إعداد الـ payload
-    payload = {
-        "inputs": full_prompt,
-        "parameters": {
-            "max_new_tokens": 512,
-            "temperature": 0.1,
-            "do_sample": True,
-            "return_full_text": False # لتجنب تكرار البرومبت في الإخراج
-        }
-    }
-    try:
-        response = requests.post(endpoint, headers=headers, json=payload, timeout=120)
-        response.raise_for_status()
-        # تحليل استجابة Hugging Face Inference API
-        data = response.json()
-        if isinstance(data, list) and data:
-            generated_text = data[0]['generated_text']
-            yield generated_text
-        else:
-            yield "خطأ في تنسيق استجابة Hugging Face API."
-    except requests.exceptions.HTTPError as err:
-        yield f"خطأ في الاتصال بـ Hugging Face API: رمز الحالة {err.response.status_code}. قد يكون السبب ضغط على الموديل."
-    except Exception as e:
-        yield f"حدث خطأ غير متوقع: {e}"
-# 3. واجهة Gradio النهائية (تشغيل على CPU)
-iface = gr.ChatInterface(
-    fn=generate_response,
-    chatbot=gr.Chatbot(label="DeepSeek Engineer Chatbot"),
-    textbox=gr.Textbox(placeholder="أدخل سؤالك هنا...", container=False),
-    title="✅ المهندس المتمرد (المرحلة التشغيلية - DeepSeek API عبر HF)",
-    description="يعمل على عتاد CPU مستقر، والاستدلال يتم عبر Hugging Face API.",
-    theme="soft"
-)
-iface.queue().launch()

 import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+# تحديد اسم نموذج DeepSeek الذي تريد استخدامه
+# يمكنك تغييره إلى أي نموذج DeepSeek آخر متوفر على HF
+MODEL_NAME = "deepseek-ai/DeepSeek-Coder-V2-Lite-Base"
+# التحميل يتم مرة واحدة عند بدء تشغيل الـ Space
+try:
+    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+    model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,
+        torch_dtype=torch.bfloat16, # استخدام Bfloat16 لتحسين الذاكرة على GPU
+        device_map="auto" # التوزيع التلقائي على GPU
+    )
+except Exception as e:
+    print(f"Error loading model: {e}")
+    tokenizer = None
+    model = None
+def generate_response(prompt):
+    if not model or not tokenizer:
+        return "Failed to load the DeepSeek model. Check your hardware (need GPU) and logs."
+    # تحويل النص إلى تنسيق الإدخال للنموذج
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    # توليد الرد
+    with torch.no_grad():
+        outputs = model.generate(
+            **inputs,
+            max_new_tokens=256,
+            do_sample=True,
+            temperature=0.7,
+            pad_token_id=tokenizer.eos_token_id
+        )
+    # فك ترميز الرد
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return response
+# إنشاء واجهة Gradio
+if model and tokenizer:
+    gr.Interface(
+        fn=generate_response,
+        inputs=gr.Textbox(lines=5, label="أدخل سؤالك/طلبك للنموذج"),
+        outputs=gr.Textbox(label="رد DeepSeek"),
+        title="DeepSeek Model on Hugging Face Space",
+        description=f"Running {MODEL_NAME} using a GPU on Hugging Face Spaces."
+    ).launch()
+else:
+    # واجهة بسيطة في حالة فشل التحميل
+    gr.Interface(
+        fn=lambda x: "Initialization Error: Model did not load.",
+        inputs="text",
+        outputs="text",
+        title="Model Load Failed",
+    ).launch()

requirements.txt CHANGED Viewed

@@ -1,5 +1,7 @@
-gradio
-transformers
 torch
-huggingface-hub
-accelerate

 torch
+transformers
+accelerate
+gradio
+# إضافة أي مكتبات أخرى قد تحتاجها، مثل:
+# deepspeed
+# bitsandbytes # قد تحتاجه إذا قمت بالتحميل بكميات أقل (4bit/8bit)