Spaces:

SafaaAI
/

LLM-Darija-FR-Tech

Sleeping

SafaaAI commited on Sep 3, 2025

Commit

50a0022

verified ·

1 Parent(s): fe0e125

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,51 +1,49 @@
 import gradio as gr
-from transformers import pipeline
 import os
-# 🔹 Récupère le token Hugging Face depuis les secrets du Space
 hf_token = os.environ.get("HF_TOKEN")
 if hf_token is None:
-    raise ValueError("⚠️ Le token Hugging Face (HF_TOKEN) n'est pas trouvé. "
-                     "Ajoute-le dans les secrets du Space.")
 # 🔹 ID du modèle
 model_id = "SafaaAI/final_llm_darija_fr_tech"
-# 🔹 Création de la pipeline (texte uniquement) avec trust_remote_code=True
-pipe = pipeline(
-    "text-generation",
-    model=model_id,
     token=hf_token,
-    device_map="auto",   # CPU si pas de GPU
-    trust_remote_code=True  # ✅ Autoriser le code custom
 )
-# 🔹 Fonction de chat
 def chat_with_model(message, history):
     history = history or []
-    outputs = pipe(
-        message,
-        max_new_tokens=200,
-        do_sample=True,
-        top_p=0.9,
-        temperature=0.7,
-    )
-    response = outputs[0]["generated_text"]
-    # Nettoyage
-    if response.startswith(message):
-        response = response[len(message):].strip()
     history.append((message, response))
     return history, history
-# 🔹 Interface Gradio
 with gr.Blocks() as demo:
-    gr.Markdown("## 💬 Chatbot SafaaAI - LLM (Darija + Français + Technique)")
     chatbot = gr.Chatbot(type="messages")
     msg = gr.Textbox(label="Écris ton message ici")
-    clear = gr.Button("🧹 Effacer la conversation")
     state = gr.State([])

 import gradio as gr
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
 import os
+# 🔹 Token Hugging Face
 hf_token = os.environ.get("HF_TOKEN")
 if hf_token is None:
+    raise ValueError("⚠️ HF_TOKEN manquant dans les secrets du Space.")
 # 🔹 ID du modèle
 model_id = "SafaaAI/final_llm_darija_fr_tech"
+# 🔹 Charger tokenizer + modèle (forcé en text-only)
+tokenizer = AutoTokenizer.from_pretrained(model_id, token=hf_token, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
     token=hf_token,
+    trust_remote_code=True,
+    device_map="auto"
 )
+# 🔹 Fonction de génération texte
 def chat_with_model(message, history):
     history = history or []
+    inputs = tokenizer(message, return_tensors="pt").to(model.device)
+    with torch.no_grad():
+        outputs = model.generate(
+            **inputs,
+            max_new_tokens=200,
+            do_sample=True,
+            temperature=0.7,
+            top_p=0.9
+        )
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     history.append((message, response))
     return history, history
+# 🔹 UI Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("## 💬 SafaaAI - Multimodal LLM (mode texte seulement)")
     chatbot = gr.Chatbot(type="messages")
     msg = gr.Textbox(label="Écris ton message ici")
+    clear = gr.Button("🧹 Effacer")
     state = gr.State([])