Garabatos
/

amigo

Garabatos commited on Jan 31, 2025

Commit

49606a1

1 Parent(s): 5b9030b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # ======== Cargar el modelo DialoGPT =========
-MODEL_NAME = "microsoft/DialoGPT-medium"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
@@ -21,13 +21,24 @@ class Message(BaseModel):
 @app.post("/chat")
 def chat(msg: Message):
     """Genera respuesta basada en el input del usuario."""
-    input_text = msg.text
-    print(msg.text)
     inputs = tokenizer.encode(input_text + tokenizer.eos_token, return_tensors="pt")
-    response_ids = model.generate(inputs, max_length=100, pad_token_id=tokenizer.eos_token_id)
     response_text = tokenizer.decode(response_ids[:, inputs.shape[-1]:][0], skip_special_tokens=True)
-    print(response_text)
     return {"response": response_text}

 import torch
 # ======== Cargar el modelo DialoGPT =========
+MODEL_NAME = "gpt2"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
 @app.post("/chat")
 def chat(msg: Message):
     """Genera respuesta basada en el input del usuario."""
+    input_text = msg.text  # Texto de entrada
+    print(f"Mensaje recibido: {input_text}")
+    # Codificar el texto de entrada y agregar el token de fin de secuencia
     inputs = tokenizer.encode(input_text + tokenizer.eos_token, return_tensors="pt")
+    # Generar la respuesta
+    response_ids = model.generate(inputs,
+                                  max_length=100,   # Longitud máxima de la respuesta
+                                  pad_token_id=tokenizer.eos_token_id,
+                                  no_repeat_ngram_size=2,  # Evitar repeticiones
+                                  top_p=0.95,         # Top-p sampling para mayor diversidad
+                                  top_k=60)          # Top-k sampling
+    # Decodificar la respuesta generada
     response_text = tokenizer.decode(response_ids[:, inputs.shape[-1]:][0], skip_special_tokens=True)
+    print(f"Respuesta generada: {response_text}")
     return {"response": response_text}