Spaces:

Ntdeseb
/

test

Sleeping

App Files Files Community

Ntdeseb commited on Jul 30, 2025

Commit

7873e0f

1 Parent(s): d2a0a21

Fix ZeroGPU - Deshabilitar CPU offload y mixed precision para evitar errores

Browse files

Files changed (1) hide show

app.py +53 -54

app.py CHANGED Viewed

@@ -142,7 +142,7 @@ def load_model(model_id):
             else:
                 print(f"📦 Cargando modelo público: {model_id}")
                 pipe = DiffusionPipeline.from_pretrained(
-                    model_id,
                     torch_dtype=torch_dtype,
                     variant="fp16" if use_fp16_variant else None
                 )
@@ -162,10 +162,10 @@ def load_model(model_id):
                     pipe.enable_attention_slicing()
                     print("✅ Attention slicing habilitado")
-                # Solo usar CPU offload para modelos grandes
-                if hasattr(pipe, 'enable_model_cpu_offload') and "sdxl" in model_id.lower():
-                    pipe.enable_model_cpu_offload()
-                    print("✅ CPU offload habilitado (modelo grande)")
                 if hasattr(pipe, 'enable_vae_slicing'):
                     pipe.enable_vae_slicing()
@@ -184,7 +184,7 @@ def load_model(model_id):
                             print(f"⚠️ XFormers no disponible: {e}")
                             print("🔄 Usando atención estándar")
-            current_model_id = model_id
             print(f"✅ Modelo {model_id} cargado exitosamente")
             if torch.cuda.is_available():
@@ -461,58 +461,57 @@ def infer(
             # Limpiar cache de GPU antes de la inferencia
             torch.cuda.empty_cache()
-            # Usar mixed precision para mayor velocidad
-            with torch.autocast(device_type='cuda', dtype=torch.float16):
-                print("⚡ Usando mixed precision para H200")
-                # Generar la imagen
-                result = pipe(
-                    prompt=prompt,
-                    negative_prompt=negative_prompt,
-                    guidance_scale=final_guidance_scale,
-                    num_inference_steps=final_inference_steps,
-                    width=width,
-                    height=height,
-                    generator=generator,
-                    **additional_params
-                )
-                # Verificar que la imagen se generó correctamente
-                if hasattr(result, 'images') and len(result.images) > 0:
-                    image = result.images[0]
-                    # Verificar que la imagen no sea completamente negra
-                    if image is not None:
-                        # Convertir a numpy para verificar
-                        img_array = np.array(image)
-                        if img_array.size > 0:
-                            # Verificar si la imagen es completamente negra
-                            if np.all(img_array == 0) or np.all(img_array < 10):
-                                print("⚠️ ADVERTENCIA: Imagen generada es completamente negra")
-                                print("🔄 Reintentando con parámetros ajustados...")
-                                # Reintentar con parámetros más conservadores
-                                result = pipe(
-                                    prompt=prompt,
-                                    negative_prompt=negative_prompt,
-                                    guidance_scale=max(1.0, final_guidance_scale * 0.8),
-                                    num_inference_steps=max(10, final_inference_steps),
-                                    width=width,
-                                    height=height,
-                                    generator=generator
-                                )
-                                image = result.images[0]
-                            else:
-                                print("✅ Imagen generada correctamente")
                         else:
-                            print("❌ Error: Imagen vacía")
-                            raise Exception("Imagen vacía generada")
                     else:
-                        print("❌ Error: Imagen es None")
-                        raise Exception("Imagen es None")
                 else:
-                    print("❌ Error: No se generaron imágenes")
-                    raise Exception("No se generaron imágenes")
         else:
             # Fallback para CPU
             result = pipe(

             else:
                 print(f"📦 Cargando modelo público: {model_id}")
                 pipe = DiffusionPipeline.from_pretrained(
+            model_id,
                     torch_dtype=torch_dtype,
                     variant="fp16" if use_fp16_variant else None
                 )
                     pipe.enable_attention_slicing()
                     print("✅ Attention slicing habilitado")
+                # Deshabilitar CPU offload temporalmente (causa problemas con ZeroGPU)
+                # if hasattr(pipe, 'enable_model_cpu_offload') and "sdxl" in model_id.lower():
+                #     pipe.enable_model_cpu_offload()
+                #     print("✅ CPU offload habilitado (modelo grande)")
                 if hasattr(pipe, 'enable_vae_slicing'):
                     pipe.enable_vae_slicing()
                             print(f"⚠️ XFormers no disponible: {e}")
                             print("🔄 Usando atención estándar")
+        current_model_id = model_id
             print(f"✅ Modelo {model_id} cargado exitosamente")
             if torch.cuda.is_available():
             # Limpiar cache de GPU antes de la inferencia
             torch.cuda.empty_cache()
+            # Generar la imagen (sin mixed precision para evitar problemas)
+            print("⚡ Generando imagen con H200...")
+            # Generar la imagen
+            result = pipe(
+                prompt=prompt,
+                negative_prompt=negative_prompt,
+                guidance_scale=final_guidance_scale,
+                num_inference_steps=final_inference_steps,
+                width=width,
+                height=height,
+                generator=generator,
+                **additional_params
+            )
+            # Verificar que la imagen se generó correctamente
+            if hasattr(result, 'images') and len(result.images) > 0:
+                image = result.images[0]
+                # Verificar que la imagen no sea completamente negra
+                if image is not None:
+                    # Convertir a numpy para verificar
+                    img_array = np.array(image)
+                    if img_array.size > 0:
+                        # Verificar si la imagen es completamente negra
+                        if np.all(img_array == 0) or np.all(img_array < 10):
+                            print("⚠️ ADVERTENCIA: Imagen generada es completamente negra")
+                            print("🔄 Reintentando con parámetros ajustados...")
+                            # Reintentar con parámetros más conservadores
+                            result = pipe(
+                                prompt=prompt,
+                                negative_prompt=negative_prompt,
+                                guidance_scale=max(1.0, final_guidance_scale * 0.8),
+                                num_inference_steps=max(10, final_inference_steps),
+                                width=width,
+                                height=height,
+                                generator=generator
+                            )
+                            image = result.images[0]
                         else:
+                            print("✅ Imagen generada correctamente")
                     else:
+                        print("❌ Error: Imagen vacía")
+                        raise Exception("Imagen vacía generada")
                 else:
+                    print("❌ Error: Imagen es None")
+                    raise Exception("Imagen es None")
+            else:
+                print("❌ Error: No se generaron imágenes")
+                raise Exception("No se generaron imágenes")
         else:
             # Fallback para CPU
             result = pipe(