Spaces:

dream2589632147
/

Dream-MultiStyle-Video-Colorizer

Running on Zero

App Files Files Community

dream2589632147 commited on Dec 10, 2025

Commit

5cedf62

verified ·

1 Parent(s): cecbfad

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -16

app.py CHANGED Viewed

@@ -6,15 +6,13 @@ from PIL import Image
 from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, DDIMScheduler
 from controlnet_aux import CannyDetector
 from diffusers.utils import load_image
-# تم إزالة: from moviepy.editor import VideoFileClip
 import os
 import shutil
 import tempfile
 import datetime
-import ffmpeg # المكتبة الجديدة
 # 1. تهيئة النموذج
-# ... (كود التهيئة يبقى كما هو)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if device == "cuda" else torch.float32
@@ -40,14 +38,11 @@ canny_processor = CannyDetector()
 # 2. دالة معالجة الفيديو والنموذج
 def colorize_video_multistyle(video_file, reference_image_path, prompt, style_choice, steps=25):
     timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
     output_temp_video_no_audio = os.path.join(tempfile.gettempdir(), f"temp_colored_{timestamp}_no_audio.mp4")
     final_output_name = f"colored_output_{timestamp}.mp4"
-    # === 1. استخراج الإطارات و الصوت (باستخدام FFMPEG مباشرةً عبر OpenCV) ===
-    # نستخدم FFMPEG-Python لاستخراج مسار ملف الصوت المؤقت
     # 1.1 استخراج الصوت
     audio_path = os.path.join(tempfile.gettempdir(), f"temp_audio_{timestamp}.aac")
     try:
@@ -68,7 +63,7 @@ def colorize_video_multistyle(video_file, reference_image_path, prompt, style_ch
     width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
     height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
-    # 2. تجهيز المدخلات للنموذج (كود الأنماط يبقى كما هو)
     style_prompts = {
         "Auto Color": "photorealistic color photo, cinematic, detailed, masterpiece",
         "Vivid": "highly saturated, vibrant color photo, pop art colors",
@@ -86,7 +81,7 @@ def colorize_video_multistyle(video_file, reference_image_path, prompt, style_ch
             break
         pil_image = Image.fromarray(cv2.cvtColor(frame, cv2.COLOR_BGR2RGB))
-        canny_image = canny_processor(pil_image)
         image_out = pipe(
             prompt=final_prompt,
@@ -101,7 +96,6 @@ def colorize_video_multistyle(video_file, reference_image_path, prompt, style_ch
     cap.release()
     # 4. تجميع الإطارات في فيديو مؤقت (MP4) باستخدام OpenCV
-    # نستخدم MP4V-2 لتجنب الاعتماد على الترميز الخارجي
     fourcc = cv2.VideoWriter_fourcc(*'mp4v')
     out = cv2.VideoWriter(output_temp_video_no_audio, fourcc, fps, (width, height))
@@ -128,22 +122,22 @@ def colorize_video_multistyle(video_file, reference_image_path, prompt, style_ch
     # 6. تنظيف الملفات المؤقتة
     if os.path.exists(audio_path):
         os.remove(audio_path)
     return final_output_name
-# 3. واجهة Gradio النهائية (بدون تغيير)
 iface = gr.Interface(
     fn=colorize_video_multistyle,
     inputs=[
         gr.Video(label="ملف الفيديو (إلزامي)"),
-        gr.Image(label="الصورة المرجعية (لنقل الألوان)", type="filepath", required=False),
-        gr.Textbox(label="المطالبة النصية (لتوجيه التلوين)", required=False, value=""),
         gr.Dropdown(["Auto Color", "Vivid", "Vintage"], label="اختيار النمط المسبق", value="Auto Color"),
-        gr.Slider(minimum=10, maximum=50, step=5, value=25, label="خطوات التوليد (للسرعة/الجودة)")
     ],
     outputs=gr.Video(label="الفيديو الملون (MP4)"),
     title="🎨 Multi-Style Video Colorizer",
-    description="تلوين احترافي للفيديو باستخدام ControlNet: يُحافظ على الهيكل وتتغير الألوان فقط."
 )
 if __name__ == "__main__":

 from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, DDIMScheduler
 from controlnet_aux import CannyDetector
 from diffusers.utils import load_image
 import os
 import shutil
 import tempfile
 import datetime
+import ffmpeg
 # 1. تهيئة النموذج
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if device == "cuda" else torch.float32
 # 2. دالة معالجة الفيديو والنموذج
 def colorize_video_multistyle(video_file, reference_image_path, prompt, style_choice, steps=25):
     timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
     output_temp_video_no_audio = os.path.join(tempfile.gettempdir(), f"temp_colored_{timestamp}_no_audio.mp4")
     final_output_name = f"colored_output_{timestamp}.mp4"
+    # === 1. استخراج الإطارات والصوت ===
     # 1.1 استخراج الصوت
     audio_path = os.path.join(tempfile.gettempdir(), f"temp_audio_{timestamp}.aac")
     try:
     width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
     height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
+    # 2. تجهيز المدخلات للنموذج
     style_prompts = {
         "Auto Color": "photorealistic color photo, cinematic, detailed, masterpiece",
         "Vivid": "highly saturated, vibrant color photo, pop art colors",
             break
         pil_image = Image.fromarray(cv2.cvtColor(frame, cv2.COLOR_BGR2RGB))
+        canny_image = canny_processor(pil_image)
         image_out = pipe(
             prompt=final_prompt,
     cap.release()
     # 4. تجميع الإطارات في فيديو مؤقت (MP4) باستخدام OpenCV
     fourcc = cv2.VideoWriter_fourcc(*'mp4v')
     out = cv2.VideoWriter(output_temp_video_no_audio, fourcc, fps, (width, height))
     # 6. تنظيف الملفات المؤقتة
     if os.path.exists(audio_path):
         os.remove(audio_path)
     return final_output_name
+# 3. واجهة Gradio النهائية
 iface = gr.Interface(
     fn=colorize_video_multistyle,
     inputs=[
         gr.Video(label="ملف الفيديو (إلزامي)"),
+        gr.Image(label="الصورة المرجعية (لنقل الألوان)", type="filepath"),
+        gr.Textbox(label="المطالبة النصية (لتوجيه التلوين)", value=""),
         gr.Dropdown(["Auto Color", "Vivid", "Vintage"], label="اختيار النمط المسبق", value="Auto Color"),
+        gr.Slider(minimum=10, maximum=50, step=5, value=25, label="خطوات التوليد")
     ],
     outputs=gr.Video(label="الفيديو الملون (MP4)"),
     title="🎨 Multi-Style Video Colorizer",
+    description="تلوين احترافي للفيديو باستخدام ControlNet."
 )
 if __name__ == "__main__":