Spaces:

SafaaAI
/

LLM-Darija-FR-Tech

Sleeping

App Files Files Community

SafaaAI commited on Aug 30, 2025

Commit

0959f0c

verified ·

1 Parent(s): 3c2d14f

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -57

app.py CHANGED Viewed

@@ -1,63 +1,50 @@
 import gradio as gr
-import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
-# 🔹 Utiliser le token Hugging Face stocké dans les secrets du Space
-# Assurez-vous d'ajouter votre HF_TOKEN dans la section Secrets
-HF_TOKEN = "use_auth_token_from_secret"  # NE PAS mettre votre vrai token ici
-# 🔹 Charger le tokenizer
-tokenizer = AutoTokenizer.from_pretrained(
-    "SafaaAI/final_llm_darija_fr_tech",
-    use_auth_token=True,   # prend le token du Space si configuré
-    trust_remote_code=True
-)
-# 🔹 Charger le modèle
-model = AutoModelForCausalLM.from_pretrained(
-    "SafaaAI/final_llm_darija_fr_tech",
-    use_auth_token=True,
-    trust_remote_code=True,
-    device_map="auto"  # pour GPU si disponible
-)
-# 🔹 Fonction d'inférence
-def inference(input_text, input_image=None):
-    """
-    input_text: texte utilisateur
-    input_image: image (optionnelle) pour contexte multimodal
-    """
-    # Encode texte
-    inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
-    # Générer la réponse
-    with torch.no_grad():
-        output_ids = model.generate(
-            **inputs,
-            max_length=512,
-            do_sample=True,
-            top_p=0.9,
-            temperature=0.7
-        )
-    # Décoder la sortie
-    response = tokenizer.decode(output_ids[0], skip_special_tokens=True)
-    return response
-# 🔹 Interface Gradio
-iface = gr.Interface(
-    fn=inference,
-    inputs=[
-        gr.Textbox(lines=5, label="Entrez votre texte"),
-        gr.Image(type="pil", label="Image (optionnelle)")
-    ],
-    outputs=[
-        gr.Textbox(lines=10, label="Réponse du modèle")
-    ],
-    title="SafaaAI LLM Darija-FR-Tech",
-    description="Modèle multimodal léger pour comprendre la Darija, le français et le langage technique."
 )
-# 🔹 Lancer l'application
 if __name__ == "__main__":
-    iface.launch()

+import os
 import gradio as gr
+from huggingface_hub import InferenceClient
+# Récupération du token depuis les secrets
+hf_token = os.environ.get("HF_TOKEN")
+# Vérification si le token est bien chargé
+if hf_token is None:
+    raise ValueError("⚠️ Le token Hugging Face (HF_TOKEN) n'est pas trouvé. "
+                     "Vérifie que tu l’as bien ajouté dans les secrets du Space.")
+# Initialisation du client Hugging Face Inference
+client = InferenceClient(
+    "SafaaAI/final_llm_darija_fr_tech",
+    token=hf_token
 )
+# Fonction de génération de texte
+def chat_with_model(message, history):
+    history = history or []
+    response = ""
+    # Appel au modèle Hugging Face
+    for output in client.text_generation(
+        message,
+        max_new_tokens=256,
+        stream=True
+    ):
+        response += output.token.text
+    history.append((message, response))
+    return history, history
+# Interface Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("## 💬 Chatbot SafaaAI - LLM (Darija + Français + Technique)")
+    chatbot = gr.Chatbot()
+    msg = gr.Textbox(label="Écris ton message ici")
+    clear = gr.Button("🧹 Effacer la conversation")
+    state = gr.State([])
+    msg.submit(chat_with_model, [msg, state], [chatbot, state])
+    clear.click(lambda: ([], []), None, [chatbot, state])
+# Lancer l’app
 if __name__ == "__main__":
+    demo.launch()