Spaces:

kawkabelaloom
/

X

Runtime error

App Files Files Community

kawkabelaloom commited on Jan 20

Commit

f9cd102

verified ·

1 Parent(s): bb96229

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -12

app.py CHANGED Viewed

@@ -1,36 +1,51 @@
 import gradio as gr
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-import traceback
-# 👈 استخدم موديلك انت
 MODEL_NAME = "kawkabelaloom/astramindx"
 SYSTEM_PROMPT = "أنت مساعد عربي ذكي، تجيب بوضوح وبأسلوب بسيط ومفيد."
 print("🔄 Loading tokenizer...")
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_NAME,
     trust_remote_code=True
 )
-print("🔄 Loading model (CPU)...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
-    device_map="cpu",
-    torch_dtype=torch.float32,
-    low_cpu_mem_usage=True,
-    trust_remote_code=True
 )
-print("✅ Model loaded")
 generator = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer
 )
 def build_prompt(history, user_message):
     prompt = SYSTEM_PROMPT + "\n\n"
     for user, bot in history:
@@ -38,13 +53,14 @@ def build_prompt(history, user_message):
     prompt += f"المستخدم: {user_message}\nالمساعد:"
     return prompt
 def chat(user_message, history):
     try:
         prompt = build_prompt(history, user_message)
         output = generator(
             prompt,
-            max_new_tokens=128,  # 👈 قللها للسرعة
             temperature=0.7,
             top_p=0.9,
             do_sample=True
@@ -55,13 +71,16 @@ def chat(user_message, history):
         return history, ""
     except Exception as e:
-        history.append((user_message, str(e)))
         return history, ""
 with gr.Blocks() as demo:
     gr.Markdown("# 🤖 Astramindx Chatbot")
     chatbot = gr.Chatbot(height=450)
-    msg = gr.Textbox()
     msg.submit(chat, [msg, chatbot], [chatbot, msg])
 demo.launch()

 import gradio as gr
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+# =========================
+# CONFIG
+# =========================
 MODEL_NAME = "kawkabelaloom/astramindx"
 SYSTEM_PROMPT = "أنت مساعد عربي ذكي، تجيب بوضوح وبأسلوب بسيط ومفيد."
+# =========================
+# LOAD TOKENIZER
+# =========================
 print("🔄 Loading tokenizer...")
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_NAME,
     trust_remote_code=True
 )
+# =========================
+# LOAD MODEL (FORCE CPU – NO QUANTIZATION)
+# =========================
+print("🔄 Loading model (CPU, no quantization)...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
+    device_map=None,                # ❌ لا device_map auto
+    torch_dtype=torch.float32,       # CPU safe
+    low_cpu_mem_usage=False,         # مهم
+    trust_remote_code=True,
+    quantization_config=None         # 🔥 الحل الأساسي
 )
+model.eval()
+print("✅ Model loaded successfully")
+# =========================
+# PIPELINE
+# =========================
 generator = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer
 )
+# =========================
+# CHAT LOGIC
+# =========================
 def build_prompt(history, user_message):
     prompt = SYSTEM_PROMPT + "\n\n"
     for user, bot in history:
     prompt += f"المستخدم: {user_message}\nالمساعد:"
     return prompt
 def chat(user_message, history):
     try:
         prompt = build_prompt(history, user_message)
         output = generator(
             prompt,
+            max_new_tokens=128,
             temperature=0.7,
             top_p=0.9,
             do_sample=True
         return history, ""
     except Exception as e:
+        history.append((user_message, f"❌ Error: {str(e)}"))
         return history, ""
+# =========================
+# GRADIO UI
+# =========================
 with gr.Blocks() as demo:
     gr.Markdown("# 🤖 Astramindx Chatbot")
     chatbot = gr.Chatbot(height=450)
+    msg = gr.Textbox(placeholder="اكتب سؤالك هنا...")
     msg.submit(chat, [msg, chatbot], [chatbot, msg])
 demo.launch()