Spaces:

AllanF-SSU
/

Chat-Sovereign

Running

FAllan07 commited on Feb 8

Commit

c42e795

verified ·

1 Parent(s): 548ebff

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,28 +1,26 @@
 import gradio as gr
-import torch
 from transformers import pipeline
-# On charge le modèle directement dans la mémoire du Space
-# Note : Si le nom a une faute (Sovreign), garde-la ici aussi !
 model_id = "AllanF-SSU/Qwen2.5-G3V-Sovereign"
 try:
-    # On crée un pipeline de conversation
     pipe = pipeline(
         "text-generation",
         model=model_id,
-        torch_dtype=torch.float16,
         device_map="auto"
     )
     def predict(message, history):
-        messages = [{"role": "user", "content": message}]
-        # Génération de la réponse
-        out = pipe(messages, max_new_tokens=512)[0]
-        return out['generated_text'][-1]['content']
     gr.ChatInterface(predict).launch()
 except Exception as e:
-    # Si la machine gratuite n'a pas assez de RAM, on affiche l'erreur précise
-    gr.Interface(lambda x: f"Erreur de mémoire : {e}", "text", "text").launch()

 import gradio as gr
+import os
 from transformers import pipeline
+# Récupération du jeton
+token = os.getenv("HF_TOKEN")
 model_id = "AllanF-SSU/Qwen2.5-G3V-Sovereign"
 try:
+    # On charge le modèle de façon ultra-légère (8-bit ou 4-bit non supporté en gratuit, on reste en float16)
     pipe = pipeline(
         "text-generation",
         model=model_id,
+        token=token,
         device_map="auto"
     )
     def predict(message, history):
+        # Formatage minimaliste
+        out = pipe(message, max_new_tokens=256)
+        return out[0]['generated_text']
     gr.ChatInterface(predict).launch()
 except Exception as e:
+    gr.Markdown(f"### ⚠️ Statut du Système\nLe modèle est en cours de chargement ou rencontre une limite de ressources.\nDétail : {e}")