Spaces:

edusc182
/

TryModel

Running

edusc182 commited on 10 days ago

Commit

a0d522c

verified ·

1 Parent(s): 50870b8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,37 +1,37 @@
 import gradio as gr
 from transformers import pipeline
-# 1. Cargamos el modelo en modo estándar (Ideal para CPU gratuita)
-# Quitamos device_map y torch_dtype para que Hugging Face use la configuración por defecto más estable.
 generador = pipeline(
     "text-generation",
-    model="edusc182/Gemma_2B"
 )
 def predecir(pregunta):
-    # 2. Preparamos el formato (Prompt)
     prompt = f"Pregunta: {pregunta}\nRespuesta:"
-    # 3. Generamos la respuesta
     resultados = generador(
         prompt,
-        max_new_tokens=150,
         return_full_text=False,
         temperature=0.7,
         do_sample=True
     )
-    # 4. Limpiamos y enviamos el texto
-    texto_generado = resultados[0]['generated_text'].strip()
-    return texto_generado
-# Creamos la interfaz
 iface = gr.Interface(
     fn=predecir,
     inputs=gr.Textbox(lines=2, placeholder="Escribe tu pregunta aquí..."),
-    outputs=gr.Textbox(label="Respuesta de Gemma"),
     title="Asistente Gemma 2B",
-    description="Hazme una pregunta y te responderé usando el modelo edusc182/Gemma_2B."
 )
 iface.launch()

 import gradio as gr
 from transformers import pipeline
+import torch
+# 1. Cargamos el modelo con optimización de memoria para el servidor gratuito
 generador = pipeline(
     "text-generation",
+    model="edusc182/Gemma_2B",
+    torch_dtype=torch.bfloat16, # ¡CRUCIAL! Reduce el peso del modelo a la mitad
+    device_map="cpu"            # Asegura que no busque tarjetas gráficas inexistentes
 )
 def predecir(pregunta):
+    # 2. Preparamos la pregunta
     prompt = f"Pregunta: {pregunta}\nRespuesta:"
+    # 3. Generamos la respuesta limitando los recursos para no saturar la CPU
     resultados = generador(
         prompt,
+        max_new_tokens=100,       # Reducido un poco para mayor velocidad en CPU
         return_full_text=False,
         temperature=0.7,
         do_sample=True
     )
+    return resultados[0]['generated_text'].strip()
+# 4. Interfaz simplificada
 iface = gr.Interface(
     fn=predecir,
     inputs=gr.Textbox(lines=2, placeholder="Escribe tu pregunta aquí..."),
+    outputs=gr.Textbox(label="Respuesta"),
     title="Asistente Gemma 2B",
+    description="Optimizado para servidor gratuito."
 )
 iface.launch()