Spaces:

M4sterStudy
/

LLama3

Paused

M4sterStudy commited on Aug 14, 2024

Commit

65e1e1f

verified ·

1 Parent(s): 4bad5f1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,7 +14,15 @@ model = AutoModelForCausalLM.from_pretrained(model_name)
 def chat_with_gpt2_spanish(input_text):
     inputs = tokenizer(input_text, return_tensors="pt", truncation=True, max_length=512)
-    outputs = model.generate(**inputs, max_length=200, num_beams=4, early_stopping=True)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
@@ -27,4 +35,4 @@ iface = gr.Interface(
     description="Interfaz simple para comunicarte con el modelo GPT-2 en español."
 )
-iface.launch()

 def chat_with_gpt2_spanish(input_text):
     inputs = tokenizer(input_text, return_tensors="pt", truncation=True, max_length=512)
+    outputs = model.generate(
+        **inputs,
+        max_length=100,  # Limitar la longitud de la respuesta
+        num_beams=1,     # Usar solo un haz para velocidad
+        temperature=0.7, # Ajustar la temperatura para respuestas menos repetitivas
+        top_p=0.9,       # Usar top-p (nucleus sampling) para variedad
+        no_repeat_ngram_size=2,  # Evitar la repetición de n-gramas
+        early_stopping=True
+    )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
     description="Interfaz simple para comunicarte con el modelo GPT-2 en español."
 )
+iface.launch()