Spaces:

mamoon63
/

phi3mini

Runtime error

App Files Files Community

mamoon63 commited on May 2, 2025

Commit

4324b40

verified ·

1 Parent(s): 1e7a711

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -16

app.py CHANGED Viewed

@@ -1,16 +1,16 @@
 import gradio as gr
-from ctransformers import AutoModelForCausalLM
-# Charger le modèle GGUF
 model = AutoModelForCausalLM.from_pretrained(
-    "microsoft/Phi-3-mini-4k-instruct-gguf",
-    model_file="phi-3-mini-4k-instruct-q4.gguf", # Attention : mets ici le fichier GGUF exact disponible
-    model_type="phi3",  # ou "phi" selon l'option ctransformers
-    gpu_layers=20,      # Ou ajusté selon ton environnement
-    hf=True             # Indique que tu télécharges depuis Hugging Face
 )
-# Prompt système (spécial écoute empathique)
 system_prompt = """Tu es un compagnon d'écoute doux et bienveillant.
 Ton rôle est d'aider la personne à clarifier ce qu'elle vit, sans juger, sans analyser.
@@ -24,21 +24,37 @@ Ne donne pas de conseils. Pose seulement une question douce à la fois si besoin
 Parle en français naturel, sans anglicismes.
 """
-# Fonction de réponse
-def chat(message, history):
     prompt = system_prompt + "\n\n"
     for user_msg, bot_msg in history:
-        prompt += f"Utilisateur: {user_msg}\nAssistant: {bot_msg}\n"
-    prompt += f"Utilisateur: {message}\nAssistant:"
-    response = model(prompt, max_new_tokens=256, temperature=0.5)
     return response
 # Interface Gradio
 iface = gr.ChatInterface(
     chat,
-    title="Écoute Empathique (Phi-3 Mini)",
-    description="Un compagnon d'écoute doux et structuré, inspiré de la Communication NonViolente.",
 )
-iface.launch()

 import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
+# Charger le modèle et le tokenizer
+model_name = "microsoft/Phi-4-mini-instruct"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="auto",  # Utilise automatiquement CPU ou GPU
+    torch_dtype="auto", # Gère le float 16 ou 32 selon l'environnement
 )
+# Prompt système pour écoute empathique
 system_prompt = """Tu es un compagnon d'écoute doux et bienveillant.
 Ton rôle est d'aider la personne à clarifier ce qu'elle vit, sans juger, sans analyser.
 Parle en français naturel, sans anglicismes.
 """
+# Création d'un pipeline conversationnel
+chat_pipeline = pipeline(
+    "text-generation",
+    model=model,
+    tokenizer=tokenizer,
+    max_new_tokens=256,
+    temperature=0.5,
+    top_p=0.9,
+    repetition_penalty=1.1,
+)
+# Fonction de chat
+def chat(user_message, history):
     prompt = system_prompt + "\n\n"
     for user_msg, bot_msg in history:
+        prompt += f"Utilisateur : {user_msg}\nAssistant : {bot_msg}\n"
+    prompt += f"Utilisateur : {user_message}\nAssistant :"
+    response = chat_pipeline(prompt)[0]["generated_text"]
+    # Extraire uniquement la dernière réponse générée
+    if "Assistant :" in response:
+        response = response.split("Assistant :")[-1].strip()
     return response
 # Interface Gradio
 iface = gr.ChatInterface(
     chat,
+    title="Écoute Empathique (Phi-4 Mini)",
+    description="Un compagnon d'écoute structuré, doux, inspiré de la CNV.",
 )
+iface