Spaces:

witflag
/

helixa-api

Sleeping

App Files Files Community

witflag commited on 18 days ago

Commit

55d370c

verified ·

1 Parent(s): f6abe62

Ajout app.py – interface chat HelixaV2

Browse files

Files changed (1) hide show

app.py +52 -0

app.py ADDED Viewed

	@@ -0,0 +1,52 @@

+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+import torch
+# Charge ton modèle (witflag/HelixaV2)
+model_id = "witflag/HelixaV2"
+# On essaie de charger avec device_map pour utiliser GPU si disponible
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
+    device_map="auto",
+    trust_remote_code=True,   # souvent nécessaire pour DeepSeek
+)
+pipe = pipeline(
+    "text-generation",
+    model=model,
+    tokenizer=tokenizer,
+)
+def chat_with_model(message, history):
+    # Formatte l'historique pour DeepSeek (chat template)
+    messages = []
+    for user_msg, assistant_msg in history:
+        messages.append({"role": "user", "content": user_msg})
+        if assistant_msg:
+            messages.append({"role": "assistant", "content": assistant_msg})
+    messages.append({"role": "user", "content": message})
+    # Génération
+    output = pipe(
+        messages,
+        max_new_tokens=400,
+        do_sample=True,
+        temperature=0.7,
+        top_p=0.9,
+    )
+    return output[0]["generated_text"][-1]["content"]  # on renvoie seulement la dernière réponse
+# Interface Gradio avec historique de chat
+demo = gr.ChatInterface(
+    fn=chat_with_model,
+    title="HelixaV2 – Ton modèle DeepSeek dupliqué",
+    description="Pose-moi toutes les questions que tu veux ! (60 requêtes/jour possible si tu espaces)",
+    examples=["Explique-moi la relativité en 3 phrases", "Écris un poème sur Casablanca", "Comment faire un tagine simple ?"],
+)
+if __name__ == "__main__":
+    demo.launch()