Spaces:

anes174
/

AnesAI

Runtime error

App Files Files Community

anes174 commited on Dec 7, 2025

Commit

02beb74

verified ·

1 Parent(s): 38afcf1

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -50

app.py CHANGED Viewed

@@ -3,24 +3,25 @@ import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
-# --- 1. إعدادات النموذج ---
-# اسم النموذج الذي سنستخدمه
-MODEL_ID = "google/gemma-3-4b-it"
-# --- 2. تهيئة النموذج والتوكنايزر (يتم التحميل مرة واحدة فقط) ---
 def load_model():
-    """تحميل نموذج Gemma 3 4B المكمم والمحسّن للتشغيل على Hugging Face Space."""
     try:
-        # تحديد جهاز التشغيل: يختار GPU إذا كان متاحًا، وإلا فـ CPU
-        device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         print(f"✅ سيتم تشغيل النموذج على: {device}")
         # التكميم 4-bit ضروري جداً لتقليل استهلاك الذاكرة
-        # هذا يسمح للنموذج بالعمل ضمن الموارد المتاحة في الطبقة المجانية
         model = AutoModelForCausalLM.from_pretrained(
             MODEL_ID,
-            torch_dtype=torch.bfloat16,
-            load_in_4bit=True,
             device_map="auto"
         ).to(device)
@@ -29,48 +30,11 @@ def load_model():
         return model, tokenizer, device
     except Exception as e:
-        print(f"❌ فشل تحميل نموذج Gemma 3 4B: {e}")
-        # رسالة للمطور إذا لم يتم التحميل
         return None, None, None
 # تحميل النموذج عند بدء تشغيل الـ Space
 model, tokenizer, device = load_model()
-# --- 3. وظيفة المحادثة الأساسية لـ AnesAI ---
-def anesai_chat(message, history):
-    """المنطق الأساسي لمحرك AnesAI - يستخدم لتوليد الردود النصية."""
-    if model is None:
-        return "عذراً، لم يتم تحميل نموذج الذكاء الاصطناعي بنجاح. يرجى مراجعة سجل الـ Space."
-    # بناء سياق المحادثة (للحفاظ على الذاكرة)
-    chat_history = ""
-    for user_msg, ai_msg in history:
-        chat_history += f"المستخدم: {user_msg}\nAnesAI: {ai_msg}\n"
-    final_prompt = f"{chat_history}المستخدم: {message}\nAnesAI:"
-    input_ids = tokenizer(final_prompt, return_tensors="pt").to(device)
-    # توليد الرد
-    with torch.no_grad():
-        output_tokens = model.generate(
-            **input_ids,
-            max_new_tokens=256,
-            do_sample=True,
-            temperature=0.7
-        )
-    output_text = tokenizer.decode(output_tokens[0], skip_special_tokens=True)
-    # استخلاص الرد الجديد فقط
-    response = output_text.split("AnesAI:")[-1].strip()
-    return response
-# --- 4. واجهة Gradio التفاعلية ---
-gr.ChatInterface(
-    anesai_chat,
-    title="AnesAI Chatbot (Gemma 3 4B)",
-    description="تحدث مع محرك AnesAI. (النسخة الأولية تعمل على موارد Hugging Face المجانية)."
-).launch()

 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
+# --- 1. إعدادات النموذج (تغيير اسم النموذج) ---
+# Phi-3 Mini هو البديل الأقوى والأكثر كفاءة للذاكرة
+MODEL_ID = "microsoft/Phi-3-mini-4k-instruct"
+# ... (بقية الدالة load_model() تظل كما هي) ...
+# --- 2. تهيئة النموذج والتوكنايزر (نفس الكود) ---
 def load_model():
+    """تحميل نموذج Phi-3-Mini المكمم (أقل استهلاكاً للذاكرة)."""
     try:
+        # تحديد جهاز التشغيل (cpu هو الأكيد في الطبقة المجانية)
+        device = torch.device("cpu") # نركز على CPU لضمان النجاح
         print(f"✅ سيتم تشغيل النموذج على: {device}")
         # التكميم 4-bit ضروري جداً لتقليل استهلاك الذاكرة
         model = AutoModelForCausalLM.from_pretrained(
             MODEL_ID,
+            torch_dtype=torch.float32, # قد نحتاج إلى float32 إذا كان على CPU
+            load_in_4bit=True,
             device_map="auto"
         ).to(device)
         return model, tokenizer, device
     except Exception as e:
+        print(f"❌ فشل تحميل نموذج Phi-3-Mini: {e}")
         return None, None, None
 # تحميل النموذج عند بدء تشغيل الـ Space
 model, tokenizer, device = load_model()
+# ... (دالة anesai_chat() تظل كما هي) ...
+# ... (واجهة Gradio التفاعلية تظل كما هي) ...