Spaces:

gnosticdev
/

INVIDEO_BASIC

Sleeping

App Files Files Community

gnosticdev commited on Jun 15

Commit

c9d2e08

verified ·

1 Parent(s): 323e604

Update app.py

Browse files

Files changed (1) hide show

app.py +160 -109

app.py CHANGED Viewed

@@ -1,125 +1,176 @@
 import os
 import requests
-import edge_tts
 import gradio as gr
-from moviepy.editor import *
-from PIL import Image
-import io
 import asyncio
-import json
-from openai import OpenAI
-# Configura APIs (gratis)
-client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))  # Para GPT-3.5-turbo
 PEXELS_API_KEY = os.getenv("PEXELS_API_KEY")
-# 1. Generar guion automático con IA (si el usuario no proporciona uno)
-async def generate_script(topic):
-    prompt = f"""
-    Genera un guion para un video de YouTube sobre '{topic}'.
-    Formato JSON ejemplo:
-    [
-        {{"prompt": "imagen de ejemplo", "text": "narración correspondiente"}},
-        ...
-    ]
-    """
-    response = client.chat.completions.create(
-        model="gpt-3.5-turbo",
-        messages=[{"role": "user", "content": prompt}],
-        temperature=0.7
-    )
-    return response.choices[0].message.content
-# 2. Descargar imágenes de Pexels/Unsplash
-def get_stock_media(query):
-    url = f"https://api.pexels.com/v1/photos/search?query={query}&per_page=1"
     headers = {"Authorization": PEXELS_API_KEY}
-    response = requests.get(url, headers=headers).json()
-    image_url = response["photos"][0]["src"]["large"]
-    return Image.open(io.BytesIO(requests.get(image_url).content))
-# 3. Generar voz con Edge TTS
-async def generate_voice(text, voice="es-ES-AlvaroNeural"):
-    communicate = edge_tts.Communicate(text=text, voice=voice)
-    await communicate.save("voice.mp3")
-    return AudioFileClip("voice.mp3")
-# 4. Crear video final
-async def create_video(script_json, voice_model, music_file=None):
-    try:
-        script = json.loads(script_json)
-    except json.JSONDecodeError:
-        raise gr.Error("¡Error en el formato del guion! Usa JSON válido.")
-    clips = []
-    for i, scene in enumerate(script):
-        img = get_stock_media(scene["prompt"])
-        img.save(f"scene_{i}.jpg")
-        audio = await generate_voice(scene["text"], voice_model)
-        clip = ImageClip(f"scene_{i}.jpg").set_duration(audio.duration)
-        # Subtítulos dinámicos
-        text_clip = TextClip(
-            scene["text"],
-            fontsize=30,
-            color="white",
-            stroke_color="black",
-            size=(clip.w * 0.9, None),
-            method="caption"
-        ).set_position(("center", "bottom")).set_duration(audio.duration)
-        clips.append(CompositeVideoClip([clip, text_clip]).set_audio(audio))
-    final_video = concatenate_videoclips(clips)
-    if music_file:
-        music = AudioFileClip(music_file).volumex(0.2)
-        final_video.audio = CompositeAudioClip([final_video.audio, music.set_start(0)])
-    output_path = "final_video.mp4"
-    final_video.write_videofile(output_path, fps=24, codec="libx264")
     return output_path
-# 5. Interfaz Gradio (2 modos: automático o manual)
-with gr.Blocks() as demo:
-    gr.Markdown("## 🎥 Generador de Videos con IA (Modo Automático o Manual)")
-    with gr.Tab("Modo Automático"):
-        topic_input = gr.Textbox(label="Tema del video (ej: 'Top 10 misterios del mundo')")
-        auto_voice = gr.Dropdown(label="Voz", choices=["es-ES-AlvaroNeural", "en-US-JennyNeural"])
-        generate_auto_btn = gr.Button("Generar Guion y Video")
-    with gr.Tab("Modo Manual"):
-        script_input = gr.Textbox(
-            label="Pega tu guion (JSON)",
-            placeholder='[{"prompt": "ciudad futurista", "text": "Bienvenidos al futuro..."}]',
-            lines=10
-        )
-        manual_voice = gr.Dropdown(label="Voz", choices=["es-ES-AlvaroNeural", "en-US-JennyNeural"])
-        music_upload = gr.File(label="Música de fondo (opcional)", type="filepath")
-        generate_manual_btn = gr.Button("Generar Video")
-    output_video = gr.Video(label="Video Generado", format="mp4")
-    # Modo Automático: Generar guion + video
-    async def auto_mode(topic, voice):
-        script = await generate_script(topic)
-        return await create_video(script, voice)
-    # Modo Manual: Usar guion existente
-    async def manual_mode(script, voice, music):
-        return await create_video(script, voice, music)
-    generate_auto_btn.click(
-        fn=auto_mode,
-        inputs=[topic_input, auto_voice],
-        outputs=output_video
-    )
-    generate_manual_btn.click(
-        fn=manual_mode,
-        inputs=[script_input, manual_voice, music_upload],
-        outputs=output_video
-    )
 demo.launch()

 import os
+import random
 import requests
 import gradio as gr
+from moviepy.editor import VideoFileClip, concatenate_videoclips, AudioFileClip, TextClip, CompositeVideoClip
+from moviepy.audio.fx.all import audio_loop
+import edge_tts
 import asyncio
+from datetime import datetime
+from pathlib import Path
+from transformers import pipeline
+# Pexels API key from Hugging Face Space environment variable
 PEXELS_API_KEY = os.getenv("PEXELS_API_KEY")
+# Ensure asyncio works with Gradio
+def run_async(coro):
+    loop = asyncio.new_event_loop()
+    asyncio.set_event_loop(loop)
+    result = loop.run_until_complete(coro)
+    loop.close()
+    return result
+# Load local text generation model (adjust based on Hugging Face Spaces resources)
+try:
+    generator = pipeline("text-generation", model="mistralai/Mistral-7B-Instruct-v0.2", device="cpu")
+except Exception as e:
+    print(f"Error loading model: {e}")
+    generator = None
+# Fetch videos from Pexels
+def fetch_pexels_videos(query, num_videos=5):
     headers = {"Authorization": PEXELS_API_KEY}
+    url = f"https://api.pexels.com/videos/search?query={query}&per_page={num_videos}"
+    response = requests.get(url, headers=headers)
+    if response.status_code == 200:
+        return [video["video_files"][0]["link"] for video in response.json()["videos"]]
+    return []
+# Generate script using local model or custom text
+def generate_script(prompt, custom_text=None):
+    if custom_text:
+        return custom_text.strip()
+    if not prompt:
+        return "Error: Debes proporcionar un prompt o un guion personalizado."
+    # Generate script with local model
+    if generator:
+        input_text = f"Genera un guion para un video sobre '{prompt}'. Crea una lista numerada con descripciones breves (máximo 20 palabras por ítem) para un top 10 relacionado con el tema."
+        try:
+            result = generator(input_text, max_length=300, num_return_sequences=1, do_sample=True)[0]['generated_text']
+            return result.strip()
+        except Exception as e:
+            print(f"Error generating script: {e}")
+    # Fallback mock response if model fails
+    if "recetas" in prompt.lower():
+        return """
+        1. Tacos al pastor: Jugosa carne marinada con piña.
+        2. Lasagna: Capas de pasta, carne y queso fundido.
+        3. Sushi: Arroz y pescado fresco en rollos delicados.
+        4. Pizza casera: Masa crujiente con tus ingredientes favoritos.
+        5. Paella: Arroz con mariscos y azafrán.
+        6. Ceviche: Pescado fresco marinado en limón.
+        7. Ramen: Caldo rico con fideos y cerdo.
+        8. Tiramisú: Postre cremoso con café y mascarpone.
+        9. Enchiladas: Tortillas rellenas con salsa picante.
+        10. Curry: Especias intensas con carne o vegetales.
+        """
+    return f"Top 10 sobre {prompt}: No se pudo generar un guion específico."
+# Generate voice using Edge TTS
+async def generate_voice(text, output_file="output.mp3"):
+    communicate = edge_tts.Communicate(text, voice="es-MX-DaliaNeural")
+    await communicate.save(output_file)
+    return output_file
+# Generate subtitles
+def generate_subtitles(text, duration, fps=24):
+    words = text.split()
+    avg_duration = duration / len(words)
+    subtitles = []
+    for i, word in enumerate(words):
+        start_time = i * avg_duration
+        end_time = (i + 1) * avg_duration
+        subtitle = TextClip(word, fontsize=30, color='white', bg_color='black', size=(1280, 100))
+        subtitle = subtitle.set_position(('center', 'bottom')).set_duration(avg_duration).set_fps(fps)
+        subtitles.append(subtitle)
+    return subtitles
+# Download and trim video
+def download_and_trim_video(url, duration, output_path):
+    response = requests.get(url, stream=True)
+    with open("temp_video.mp4", "wb") as f:
+        for chunk in response.iter_content(chunk_size=1024):
+            f.write(chunk)
+    clip = VideoFileClip("temp_video.mp4").subclip(0, min(duration, VideoFileClip("temp_video.mp4").duration))
+    clip.write_videofile(output_path, codec="libx264", audio_codec="aac")
+    clip.close()
+    os.remove("temp_video.mp4")
     return output_path
+# Main video creation function
+def create_video(prompt, custom_text, music_file):
+    output_dir = "output_videos"
+    os.makedirs(output_dir, exist_ok=True)
+    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+    output_video = f"{output_dir}/video_{timestamp}.mp4"
+    # Generate or use provided script
+    script = generate_script(prompt, custom_text)
+    if "Error" in script:
+        return script
+    # Generate voice
+    voice_file = "temp_audio.mp3"
+    run_async(generate_voice(script, voice_file))
+    audio = AudioFileClip(voice_file)
+    video_duration = audio.duration
+    # Fetch Pexels videos
+    query = prompt.split()[0] if prompt else "generic"
+    video_urls = fetch_pexels_videos(query, num_videos=5)
+    if not video_urls:
+        return "Error: No se encontraron videos en Pexels."
+    # Download and trim videos
+    clips = []
+    for i, url in enumerate(video_urls):
+        clip_path = f"temp_clip_{i}.mp4"
+        download_and_trim_video(url, video_duration / len(video_urls), clip_path)
+        clips.append(VideoFileClip(clip_path))
+    # Concatenate video clips
+    final_clip = concatenate_videoclips(clips, method="compose").set_duration(video_duration)
+    # Add looped music
+    if music_file:
+        music = AudioFileClip(music_file.name)
+        music = audio_loop(music, duration=video_duration)
+        final_audio = final_clip.set_audio(music.set_duration(video_duration))
+    else:
+        final_audio = final_clip.set_audio(audio)
+    # Add subtitles
+    subtitles = generate_subtitles(script, video_duration)
+    final_clip = CompositeVideoClip([final_clip] + subtitles)
+    # Write final video
+    final_clip.write_videofile(output_video, codec="libx264", audio_codec="aac", fps=24)
+    # Clean up
+    for clip in clips:
+        clip.close()
+    audio.close()
+    if music_file:
+        music.close()
+    final_clip.close()
+    os.remove(voice_file)
+    for i in range(len(video_urls)):
+        os.remove(f"temp_clip_{i}.mp4")
+    return output_video
+# Gradio interface
+with gr.Blocks() as demo:
+    gr.Markdown("# Generador de Videos")
+    gr.Markdown("Ingresa un prompt (ej., 'Top 10 recetas más ricas') o un guion personalizado. Sube música opcional (MP3).")
+    prompt = gr.Textbox(label="Prompt", placeholder="Ejemplo: Top 10 recetas más ricas")
+    custom_text = gr.Textbox(label="Guion Personalizado", placeholder="Ingresa tu propio guion aquí (opcional)")
+    music_file = gr.File(label="Subir Música (MP3, opcional)", file_types=[".mp3"])
+    submit = gr.Button("Generar Video")
+    output = gr.Video(label="Video Generado")
+    submit.click(fn=create_video, inputs=[prompt, custom_text, music_file], outputs=output)
 demo.launch()