Spaces:

SafaaAI
/

LLM-Darija-FR-Tech

Running

SafaaAI commited on Aug 30, 2025

Commit

eb77eeb

verified ·

1 Parent(s): bd94b1a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,40 +1,46 @@
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-# Chemin vers ton modèle sur HF Hub
 MODEL_PATH = "SafaaAI/final_llm_darija_fr_tech"
 print("Chargement du tokenizer...")
-tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH, trust_remote_code=True)
 print("Chargement du modèle...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_PATH,
-    trust_remote_code=True,
-    device_map="auto",   # utilise GPU si dispo, sinon CPU
-    load_in_4bit=False,  # désactive BitsAndBytes pour éviter l'erreur
-    load_in_8bit=False
 )
-# Crée un pipeline text generation
-generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 # Fonction pour Gradio
-def chat_with_model(prompt, image=None):
-    """
-    prompt: texte de l'utilisateur
-    image: optionnel, pour futur traitement multimodal
-    """
-    response = generator(prompt, max_length=200, do_sample=True)[0]["generated_text"]
-    return response
 # Interface Gradio
-iface = gr.Interface(
-    fn=chat_with_model,
-    inputs=[gr.Textbox(label="Votre question"), gr.Image(label="Image (optionnel)")],
-    outputs=[gr.Textbox(label="Réponse du modèle")],
-    title="SafaaAI LLM - Darija & Français Technique",
-    description="Chattez avec le LLM multimodal léger (texte et image)."
-)
-iface.launch()

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+import torch
+# Chemins locaux sur Spaces
 MODEL_PATH = "SafaaAI/final_llm_darija_fr_tech"
+TOKENIZER_PATH = "tokenizer_safe"
+# Chargement du tokenizer sans trust_remote_code
 print("Chargement du tokenizer...")
+tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH)
+# Chargement du modèle
 print("Chargement du modèle...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_PATH,
+    device_map="auto"  # utilise le GPU si disponible
 )
+# Création du pipeline de génération de texte
+generator = pipeline(
+    "text-generation",
+    model=model,
+    tokenizer=tokenizer,
+    device=0 if torch.cuda.is_available() else -1
+)
 # Fonction pour Gradio
+def generate_text(prompt, max_length=200):
+    output = generator(prompt, max_length=max_length, do_sample=True, top_p=0.95)
+    return output[0]["generated_text"]
 # Interface Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("# SafaaAI LLM - Chat Texte")
+    with gr.Row():
+        prompt_input = gr.Textbox(label="Entrez votre texte ici", lines=3)
+        submit_btn = gr.Button("Générer")
+    output_text = gr.Textbox(label="Résultat généré", lines=10)
+    submit_btn.click(generate_text, inputs=prompt_input, outputs=output_text)
+# Lancer l'application
+demo.launch()