Spaces:

edusc182
/

TryModel

Running

edusc182 commited on 12 days ago

Commit

bdbadf2

verified ·

1 Parent(s): 14932b3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,24 +8,34 @@ generador = None
 def predecir(pregunta):
     global generador
-    # Lazy Loading: El modelo se carga en memoria solo bajo demanda
     if generador is None:
-        print("Iniciando la carga del modelo por primera vez...")
         model_id = "edusc182/Gemma_2B"
-        # Cargamos el tokenizador explícitamente para evitar problemas de compatibilidad
-        tokenizer = AutoTokenizer.from_pretrained(model_id)
-        # Inicializamos el pipeline
         generador = pipeline(
             "text-generation",
             model=model_id,
             tokenizer=tokenizer,
             torch_dtype=torch.bfloat16,
-            device_map="cpu" # Optimizado para ejecución en CPU sin VRAM
         )
-        print("¡Modelo cargado con éxito en la memoria!")
     # Inferencia optimizada
     resultados = generador(
         pregunta,

 def predecir(pregunta):
     global generador
     if generador is None:
         model_id = "edusc182/Gemma_2B"
+        tokenizer = AutoTokenizer.from_pretrained(model_id, clean_up_tokenization_spaces=False)
         generador = pipeline(
             "text-generation",
             model=model_id,
             tokenizer=tokenizer,
             torch_dtype=torch.bfloat16,
+            device_map="cpu"
         )
+    # Inferencia limpia (sin parámetros de carga mezclados)
+    resultados = generador(
+        pregunta,
+        max_new_tokens=100,
+        temperature=0.7,
+        do_sample=True,
+        pad_token_id=generador.tokenizer.eos_token_id
+    )
+    # Extraemos el texto de forma segura
+    texto = resultados[0]['generated_text']
+    # Si el pipeline devuelve todo el prompt, limpiamos la parte de la pregunta
+    if texto.startswith(pregunta):
+        texto = texto[len(pregunta):].strip()
+    return texto
     # Inferencia optimizada
     resultados = generador(
         pregunta,