Spaces:

iespsurmreqmer
/

DiffusersTransformers

No application file

App Files Files Community

psurmreqmer commited on 4 days ago

Commit

43555c1

1 Parent(s): 551e5e1

.

Browse files

Files changed (1) hide show

app6.py +44 -104

app6.py CHANGED Viewed

@@ -1,116 +1,56 @@
 import gradio as gr
-import torch
-from diffusers import DiffusionPipeline
 from PIL import Image
-# --- Configuración del Modelo Qwen (Forzado a CPU) ---
-# Establecemos el dispositivo a CPU (CUDA no está disponible en tu entorno).
-device = "cpu"
-dtype_config = torch.float32 # Usamos float32 para la CPU
-# Modelo Qwen para edición de imagen
-model_id = "Qwen/Qwen-Image-Edit-2509"
-pipe = None
 try:
-    # Carga sencilla, forzada a CPU. Qwen no requiere dtype especial ni device_map si no hay GPU.
-    pipe = DiffusionPipeline.from_pretrained(
-        model_id,
-        torch_dtype=dtype_config,
-        use_safetensors=True
-    ).to(device)
-    print("✅ Modelo Qwen-Image-Edit cargado con éxito en la CPU.")
-except Exception as e:
-    print(f"❌ Error CRÍTICO al cargar el modelo Qwen: {e}")
-    print("El modelo NO ha podido cargarse. Podría ser un problema de memoria RAM, incluso con CPU.")
-# --- Función de Procesamiento con Difusión (i2i) ---
-def procesar_con_difusion(imagen_entrada, estilo_radial):
     """
-    Modifica la imagen usando el pipeline de difusión con el estilo radial seleccionado.
     """
-    # Manejo de error de carga
-    if pipe is None:
-        return Image.new('RGB', (512, 512), color = 'red')
-    if imagen_entrada is None:
-        return None
-    # 1. Prompt Base Fijo
-    prompt_base = "fotografía de alta calidad, retrato detallado"
-    estilo_prompts = {
-        # El prompt fijo + el modificador del estilo
-        "Blanco y Negro (Monocromático)": ", monocromático, alto contraste, dramático, blanco y negro, película antigua",
-        "Alto Contraste y Saturación": ", colores vívidos, alto contraste, saturación extrema, cinematográfico, iluminación fuerte",
-        "Original (Poco Ruido)": ", fotografía de alta calidad, realista, colores naturales, sutil, cinematic lighting",
-    }
-    full_prompt = prompt_base + estilo_prompts.get(estilo_radial, "")
-    # 2. Fuerza de Difusión FIJA (Valor alto para asegurar el efecto)
-    STRENGTH_FIJA = 0.9
-    # 3. Preprocesar la imagen (Ajustamos el tamaño de entrada)
-    # Qwen-Image-Edit usa 512x512
-    init_image = imagen_entrada.convert("RGB").resize((512, 512))
-    try:
-        # 4. Ejecutar el pipeline de difusión i2i
-        # El modelo Qwen también acepta los parámetros strength y guidance_scale
-        image = pipe(
-            prompt=full_prompt,
-            image=init_image,
-            strength=STRENGTH_FIJA,
-            guidance_scale=7.5
-        ).images[0]
-        return image
-    except Exception as e:
-        print(f"Error durante la ejecución del pipeline: {e}")
-        # Devuelve un cuadro de error si el proceso falla
-        return Image.new('RGB', (512, 512), color = 'red')
-# --- Interfaz Gradio con gr.Blocks() ---
-with gr.Blocks(title="Qwen Image Edit Estilos Fijos") as demo:
-    gr.Markdown(
-        """
-        # 🖼️ Tarea de Difusión (Image-to-Image) con Qwen Edit
-        Carga una imagen y selecciona un **Estilo Radial** para que el modelo Qwen la transforme.
-        **Nota:** La generación puede ser lenta al ejecutarse en CPU.
-        """
-    )
-    with gr.Row():
-        with gr.Column(scale=1):
-            image_input = gr.Image(
-                type="pil",
-                label="1. Cargar Imagen Inicial",
-            )
-            estilo_radial = gr.Radio(
-                ["Original (Poco Ruido)", "Blanco y Negro (Monocromático)", "Alto Contraste y Saturación"],
-                label="2. Selecciona el Estilo de Transformación",
-                value="Blanco y Negro (Monocromático)"
-            )
-            process_button = gr.Button("✨ Aplicar Difusión Qwen", variant="primary")
-        with gr.Column(scale=1):
-            image_output = gr.Image(
-                type="pil",
-                label="Imagen Transformada por Difusión",
-                height=512
-            )
-    process_button.click(
-        fn=procesar_con_difusion,
-        inputs=[image_input, estilo_radial],
-        outputs=image_output
-    )
-demo.launch(inbrowser=True)

 import gradio as gr
 from PIL import Image
+from diffusers import StableDiffusionImg2ImgPipeline
+import torch
+# 1. Cargar el modelo ligero (Solo se ejecuta una vez al iniciar el Space)
+model_id = "runwayml/stable-diffusion-v1-5"
+device = "cuda" if torch.cuda.is_available() else "cpu"
+# Usamos StableDiffusionImg2ImgPipeline para Image-to-Image
 try:
+    pipe = StableDiffusionImg2ImgPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
+    pipe = pipe.to(device)
+except:
+    # Fallback si no hay GPU o si falla la carga con float16
+    pipe = StableDiffusionImg2ImgPipeline.from_pretrained(model_id)
+    pipe = pipe.to(device)
+# 2. Función de procesamiento (Aquí se ejecuta la inferencia)
+def convert_to_bn_diffusion(input_image: Image.Image, prompt: str, strength: float) -> Image.Image:
     """
+    Ejecuta el pipeline de difusión I2I para estilizar la imagen.
     """
+    # Aseguramos que la imagen esté en RGB y redimensionamos si es necesario
+    input_image = input_image.convert("RGB").resize((512, 512))
+    # Prompt forzando el estilo monocromático
+    bn_prompt = f"{prompt}, high contrast, black and white, monochrome, grayscale"
+    # Generación (Inferencia)
+    output_image = pipe(
+        prompt=bn_prompt,
+        image=input_image,
+        strength=strength, # Cuanto más alto, más se transforma (más BN)
+        guidance_scale=7.5
+    ).images[0]
+    return output_image
+# 3. Interfaz de Gradio
+iface = gr.Interface(
+    fn=convert_to_bn_diffusion,
+    inputs=[
+        gr.Image(type="pil", label="Sube tu imagen (se redimensionará a 512x512)"),
+        gr.Textbox(label="Prompt adicional (ej: 'a moody photo', 'vintage style')", value="A sharp, detailed photograph"),
+        gr.Slider(minimum=0.5, maximum=1.0, step=0.05, value=0.9, label="Fuerza de Estilización (Strength - Cuánto se convierte a B/N)")
+    ],
+    outputs="image",
+    title="Conversor a B/N con Modelo de Difusión (Img2Img)",
+    description="Sube una imagen y el modelo Stable Diffusion intentará convertirla a blanco y negro basado en el prompt y la fuerza de estilización."
+)
+if __name__ == "__main__":
+    iface.launch()