Spaces:

AllanF-SSU
/

Chat-Sovereign

Sleeping

FAllan07 commited on 29 days ago

Commit

def22e8

verified ·

1 Parent(s): 8aadda4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,14 +1,31 @@
-def predict(message, history):
-    # On augmente la température pour plus de créativité
-    # On ajoute la pénalité de répétition pour casser les boucles
-    response = chatbot(
-        message,
-        max_new_tokens=1024,
-        do_sample=True,
-        temperature=0.85, # Plus de liberté
-        top_p=0.9,
-        repetition_penalty=1.2 # Anti-bégaiement
     )
-    # On nettoie la réponse pour ne pas qu'il répète la question
-    full_text = response[0]['generated_text']
-    return full_text.split(message)[-1].strip()

+import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+# Chargement robuste
+model_name = "AllanF-SSU/Qwen2.5-G3V-Sovereign"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
+def chat_res(message, history):
+    # On prépare l'entrée
+    inputs = tokenizer(message, return_tensors="pt").to(model.device)
+    # On génère avec des réglages "Souverains" (anti-répétition et température)
+    outputs = model.generate(
+        **inputs,
+        max_new_tokens=512,        # Plus de place pour répondre
+        do_sample=True,            # Active la créativité
+        temperature=0.8,           # Équilibre entre logique et intuition
+        repetition_penalty=1.2,    # CASSE les boucles de bégaiement
+        pad_token_id=tokenizer.eos_token_id
     )
+    # ON COUPE LA QUESTION : on ne décode que ce qui vient APRÈS l'entrée
+    input_length = inputs.input_ids.shape[1]
+    response_tokens = outputs[0][input_length:]
+    return tokenizer.decode(response_tokens, skip_special_tokens=True)
+# L'interface avec un titre digne du G3V
+gr.ChatInterface(chat_res, title="Qwen2.5-G3V-Sovereign").launch()