Spaces:

Carley1234
/

video

Sleeping

App Files Files Community

Carley1234 commited on Dec 15, 2025

Commit

2fc30dd

verified ·

1 Parent(s): 03e7b1a

Upload 4 files

Browse files

Files changed (3) hide show

README.md +7 -7
app.py +34 -36
requirements.txt +5 -2

README.md CHANGED Viewed

@@ -1,23 +1,23 @@
 ---
-title: VidSpri Animation Backend
 emoji: 🎬
-colorFrom: red
-colorTo: yellow
 sdk: docker
 sdk_version: 4.22.1
 app_port: 8000
-hardware: gpu-a10g-small
 python_version: 3.9
 ---
-# VidSpri - Servidor de Animación
-Este es el backend para la generación de animaciones de VidSpri. Utiliza el modelo **Stable Video Diffusion** para crear un video corto a partir de una imagen estática y una descripción de texto.
 ## Configuración del Space
 - **SDK:** Docker
-- **Hardware:** `gpu-a10g-small` (GPU A10G Small) - **Importante:** Se requiere una GPU para que el modelo funcione.
 - **Puerto de la App:** 8000
 ## Endpoint de la API

 ---
+title: VidSpri Animation Backend (CPU)
 emoji: 🎬
+colorFrom: blue
+colorTo: green
 sdk: docker
 sdk_version: 4.22.1
 app_port: 8000
+hardware: cpu-basic
 python_version: 3.9
 ---
+# VidSpri - Servidor de Animación (CPU)
+Este es el backend para la generación de animaciones de VidSpri. Utiliza el pipeline **TextToVideoZeroPipeline** con el modelo base **runwayml/stable-diffusion-v1-5** para crear un video corto a partir de una imagen estática y una descripción de texto, optimizado para ejecutarse en CPU.
 ## Configuración del Space
 - **SDK:** Docker
+- **Hardware:** `cpu-basic` (CPU Básico) - Configurado para el plan gratuito de Hugging Face.
 - **Puerto de la App:** 8000
 ## Endpoint de la API

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import torch
 from fastapi import FastAPI, File, UploadFile, Form, HTTPException
 from fastapi.responses import StreamingResponse
 from fastapi.middleware.cors import CORSMiddleware
-from diffusers import StableVideoDiffusionPipeline
 from PIL import Image
 import io
 import os
@@ -13,7 +13,7 @@ import imageio
 # --- Configuración de la Aplicación FastAPI ---
 app = FastAPI()
-# Configura CORS para permitir peticiones desde cualquier origen (puedes restringirlo si es necesario)
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
@@ -23,25 +23,27 @@ app.add_middleware(
 )
 # --- Carga del Modelo de IA ---
-# Esta sección carga el modelo de Stable Video Diffusion al iniciar el servidor.
-# Usamos un bloque try-except para manejar posibles errores si el modelo no se puede cargar.
 try:
-    # Asegúrate de que el dispositivo sea 'cuda' para usar la GPU, que es esencial para este modelo.
-    device = "cuda"
-    # Carga el pipeline del modelo pre-entrenado desde Hugging Face.
-    # El modelo se descargará automáticamente la primera vez que se ejecute.
-    # torch.float16 es una optimización para usar menos memoria de la GPU.
-    pipe = StableVideoDiffusionPipeline.from_pretrained(
-        "stabilityai/stable-video-diffusion-img2vid-xt",
-        torch_dtype=torch.float16,
-        variant="fp16"
     )
     pipe.to(device)
-    print("Modelo Stable Video Diffusion cargado exitosamente en la GPU.")
 except Exception as e:
     print(f"Error crítico al cargar el modelo: {e}")
-    # Si el modelo no se carga, el servidor no podrá funcionar.
-    # En un entorno de producción, podrías querer manejar esto de forma más robusta.
     pipe = None
 # --- Endpoints de la API ---
@@ -49,46 +51,42 @@ except Exception as e:
 @app.get("/")
 def read_root():
     """Endpoint raíz para verificar que el servidor está en funcionamiento."""
-    return {"status": "Servidor de Animación de VidSpri está funcionando"}
 @app.post("/generate-video/")
 async def generate_video(
     image: UploadFile = File(...),
-    prompt: str = Form("un personaje corriendo felizmente"), # Prompt por defecto
-    frames: int = Form(25) # Número de fotogramas por defecto
 ):
     """
-    Endpoint principal para generar un video a partir de una imagen y un prompt.
     """
     if pipe is None:
-        raise HTTPException(status_code=503, detail="El modelo de IA no está disponible en este momento. Por favor, revisa los logs del servidor.")
     try:
-        # 1. Cargar y preparar la imagen de entrada
         input_bytes = await image.read()
         image_pil = Image.open(io.BytesIO(input_bytes)).convert("RGB")
-        # El modelo SVD requiere que las imágenes tengan un tamaño específico.
-        # Redimensionamos la imagen si es necesario.
-        image_pil = image_pil.resize((1024, 576))
-        # 2. Generar el video usando el pipeline
-        # `decode_chunk_size` es una optimización para modelos grandes.
-        video_frames = pipe(image_pil, num_frames=frames, decode_chunk_size=8).frames[0]
-        # 3. Convertir los fotogramas a un video MP4 en memoria
-        # Convertimos las imágenes PIL a arrays de NumPy, que es el formato que necesita imageio.
         np_frames = [np.array(frame) for frame in video_frames]
         video_buffer = io.BytesIO()
-        # Usamos imageio para escribir los fotogramas en el buffer como un video MP4.
-        # El parámetro fps (fotogramas por segundo) controla la velocidad de la animación.
-        imageio.mimwrite(video_buffer, np_frames, format="mp4", fps=10)
         video_buffer.seek(0)
-        # 4. Devolver el video MP4 como una respuesta de streaming
         return StreamingResponse(video_buffer, media_type="video/mp4")
     except Exception as e:

 from fastapi import FastAPI, File, UploadFile, Form, HTTPException
 from fastapi.responses import StreamingResponse
 from fastapi.middleware.cors import CORSMiddleware
+from diffusers import TextToVideoZeroPipeline
 from PIL import Image
 import io
 import os
 # --- Configuración de la Aplicación FastAPI ---
 app = FastAPI()
+# Configura CORS para permitir peticiones desde cualquier origen
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
 )
 # --- Carga del Modelo de IA ---
+# Esta sección carga el modelo Zeroscope optimizado para CPU.
 try:
+    # IMPORTANTE: Especificamos "cpu" para asegurar que se ejecute en el hardware gratuito.
+    device = "cpu"
+    # El tipo de dato 'torch.float32' es el recomendado para CPU.
+    dtype = torch.float32
+    # Cargamos el pipeline del modelo Zeroscope v2 576w.
+    # El modelo se descargará automáticamente la primera vez.
+    pipe = TextToVideoZeroPipeline.from_pretrained(
+        "runwayml/stable-diffusion-v1-5",
+        torch_dtype=dtype
     )
+    # Movemos el pipeline al dispositivo CPU.
     pipe.to(device)
+    print("Modelo Zeroscope v2 cargado exitosamente en CPU.")
 except Exception as e:
     print(f"Error crítico al cargar el modelo: {e}")
     pipe = None
 # --- Endpoints de la API ---
 @app.get("/")
 def read_root():
     """Endpoint raíz para verificar que el servidor está en funcionamiento."""
+    return {"status": "Servidor de Animación (CPU) de VidSpri está funcionando"}
 @app.post("/generate-video/")
 async def generate_video(
     image: UploadFile = File(...),
+    prompt: str = Form("un personaje corriendo felizmente"),
+    frames: int = Form(25)
 ):
     """
+    Endpoint principal para generar un video a partir de una imagen y un prompt usando CPU.
     """
     if pipe is None:
+        raise HTTPException(status_code=503, detail="El modelo de IA no está disponible. Revisa los logs.")
     try:
+        # 1. Cargar la imagen de entrada. El prompt ya viene como texto.
         input_bytes = await image.read()
         image_pil = Image.open(io.BytesIO(input_bytes)).convert("RGB")
+        # 2. Generar el video usando el pipeline de Zeroscope.
+        # Este modelo usa el prompt para guiar la animación de la imagen.
+        result = pipe(prompt=prompt, image=image_pil, num_inference_steps=50, num_frames=frames)
+        video_frames = result.frames
+        # 3. Convertir los fotogramas (que están en formato PIL) a un video MP4 en memoria.
         np_frames = [np.array(frame) for frame in video_frames]
         video_buffer = io.BytesIO()
+        # Calculamos los FPS para que el video dure ~2 segundos.
+        fps = max(1, round(frames / 2))
+        # Usamos imageio para escribir los fotogramas en el buffer como MP4.
+        imageio.mimwrite(video_buffer, np_frames, format="mp4", fps=fps)
         video_buffer.seek(0)
+        # 4. Devolver el video MP4.
         return StreamingResponse(video_buffer, media_type="video/mp4")
     except Exception as e:

requirements.txt CHANGED Viewed

@@ -3,12 +3,15 @@ fastapi
 uvicorn
 python-multipart
-# Modelo de IA y procesamiento de imágenes
 torch
 diffusers
 transformers
-accelerate
 Pillow
 safetensors
 imageio
 imageio-ffmpeg

 uvicorn
 python-multipart
+# Modelo de IA y procesamiento
 torch
 diffusers
 transformers
 Pillow
 safetensors
 imageio
 imageio-ffmpeg
+# Dependencias adicionales para el modelo Zeroscope
+einops
+omegaconf