ACE-Singer

Runtime error

App Files Files Community

ginipick commited on May 26, 2025

Commit

7e33408

verified ·

1 Parent(s): 2ce181a

Update ui/components.py

Browse files

Files changed (1) hide show

ui/components.py +217 -211

ui/components.py CHANGED Viewed

@@ -14,20 +14,20 @@ import hashlib
 import numpy as np
 import json
 from typing import Dict, List, Tuple, Optional
-from openai import OpenAI
 # OpenAI 클라이언트 초기화
 try:
     api_key = os.getenv("LLM_API") or os.getenv("OPENAI_API_KEY")
     if api_key:
         client = OpenAI(api_key=api_key)
-        print("OpenAI API client initialized successfully")
     else:
         client = None
-        print("Warning: No OpenAI API key found. AI lyrics generation will be disabled.")
 except Exception as e:
     client = None
-    print(f"Warning: Failed to initialize OpenAI client: {e}")
 TAG_DEFAULT = "funk, pop, soul, rock, melodic, guitar, drums, bass, keyboard, percussion, 105 BPM, energetic, upbeat, groovy, vibrant, dynamic, duet, male and female vocals"
 LYRIC_DEFAULT = """[verse - male]
@@ -118,12 +118,14 @@ LYRIC_SYSTEM_PROMPT = """너는 노래 가사를 작사하는 전문가 역할
 def generate_lyrics_with_ai(prompt: str, genre: str, song_style: str) -> str:
     """AI를 사용하여 가사 생성"""
     if not client:
-        print("OpenAI client not available, returning default lyrics")
         return LYRIC_DEFAULT
     if not prompt or prompt.strip() == "":
-        print("Empty prompt, returning default lyrics")
         return LYRIC_DEFAULT
     try:
@@ -148,10 +150,10 @@ def generate_lyrics_with_ai(prompt: str, genre: str, song_style: str) -> str:
 위 정보를 바탕으로 노래 가사를 작성해주세요. 입력된 언어와 동일한 언어로 작성하고, 구조 태그를 반드시 포함해주세요.
 """
-        print(f"Generating lyrics with prompt: {prompt}")
         response = client.chat.completions.create(
-            model="gpt-4o-mini",  # 모델명 수정
             messages=[
                 {"role": "system", "content": LYRIC_SYSTEM_PROMPT},
                 {"role": "user", "content": user_prompt}
@@ -161,11 +163,11 @@ def generate_lyrics_with_ai(prompt: str, genre: str, song_style: str) -> str:
         )
         generated_lyrics = response.choices[0].message.content
-        print(f"Generated lyrics successfully")
         return generated_lyrics
     except Exception as e:
-        print(f"AI 가사 생성 오류: {e}")
         return LYRIC_DEFAULT
 # 품질 프리셋 시스템 추가
@@ -295,35 +297,6 @@ def calculate_quality_score(audio_path: str) -> float:
     except:
         return 50.0  # 기본값
-def update_tags_from_preset(preset_name, current_tags, song_style):
-    """장르 프리셋 선택시 태그 업데이트"""
-    if preset_name == "Custom":
-        return current_tags
-    base_tags = GENRE_PRESETS.get(preset_name, "")
-    # 스타일 태그 추가
-    if song_style in SONG_STYLES:
-        style_tags = SONG_STYLES[song_style]
-        return f"{base_tags}, {style_tags}"
-    return base_tags
-def update_quality_preset(preset_name):
-    """품질 프리셋 적용"""
-    if preset_name not in QUALITY_PRESETS:
-        return (100, 15.0, "euler", 10.0, True, True)
-    preset = QUALITY_PRESETS[preset_name]
-    return (
-        preset.get("infer_step", 100),
-        preset.get("guidance_scale", 15.0),
-        preset.get("scheduler_type", "euler"),
-        preset.get("omega_scale", 10.0),
-        preset.get("use_erg_diffusion", True),
-        preset.get("use_erg_tag", True)
-    )
 def create_enhanced_process_func(original_func):
     """기존 함수를 향상된 기능으로 래핑"""
@@ -552,12 +525,14 @@ def create_text2music_ui(
                             value="Custom",
                             label="장르 프리셋",
                             scale=1,
                         )
                         song_style = gr.Dropdown(
                             choices=list(SONG_STYLES.keys()),
                             value="듀엣 (남녀 혼성)",
                             label="곡 스타일",
                             scale=1,
                         )
                         enable_smart_enhancement = gr.Checkbox(
                             label="스마트 향상",
@@ -714,153 +689,9 @@ def create_text2music_ui(
             text2music_bnt = gr.Button("🎵 Generate Music", variant="primary", size="lg")
-            # AI 작사 버튼 이벤트
-            def generate_ai_lyrics(lyric_prompt, genre_preset, song_style):
-                if not lyric_prompt or lyric_prompt.strip() == "":
-                    return lyrics.value  # 현재 가사 유지
-                print(f"Generating lyrics with: prompt={lyric_prompt}, genre={genre_preset}, style={song_style}")
-                generated = generate_lyrics_with_ai(lyric_prompt, genre_preset, song_style)
-                return generated
-            generate_lyrics_btn.click(
-                fn=generate_ai_lyrics,
-                inputs=[lyric_prompt, genre_preset, song_style],
-                outputs=[lyrics]
-            )
-            # 랜덤 데이터 생성 함수
-            def generate_random_music_data(genre_preset, song_style):
-                # 랜덤 장르 선택
-                if genre_preset == "Custom":
-                    genre = random.choice(list(GENRE_PRESETS.keys()))
-                else:
-                    genre = genre_preset
-                # 랜덤 주제 리스트
-                themes = [
-                    "도시의 밤", "첫사랑의 추억", "여름날의 해변", "가을의 정취",
-                    "희망찬 내일", "자유로운 영혼", "별빛 아래 춤", "청춘의 열정",
-                    "비 오는 날의 감성", "꿈을 향한 도전", "이별 후의 성장", "새로운 시작"
-                ]
-                # 랜덤 설정
-                duration = random.choice([30, 60, 90, 120, 180])
-                theme = random.choice(themes)
-                # AI로 가사 생성
-                lyrics = generate_lyrics_with_ai(theme, genre, song_style)
-                # 태그 생성
-                tags = GENRE_PRESETS.get(genre, "")
-                if song_style in SONG_STYLES:
-                    tags = f"{tags}, {SONG_STYLES[song_style]}"
-                # 랜덤 파라미터 설정
-                return (
-                    duration,  # audio_duration
-                    tags,      # prompt
-                    lyrics,    # lyrics
-                    150,       # infer_step
-                    15.0,      # guidance_scale
-                    "euler",   # scheduler_type
-                    "apg",     # cfg_type
-                    10.0,      # omega_scale
-                    str(random.randint(1, 10000)),  # manual_seeds
-                    0.5,       # guidance_interval
-                    0.0,       # guidance_interval_decay
-                    3.0,       # min_guidance_scale
-                    True,      # use_erg_tag
-                    False,     # use_erg_lyric
-                    True,      # use_erg_diffusion
-                    None,      # oss_steps
-                    0.0,       # guidance_scale_text
-                    0.0,       # guidance_scale_lyric
-                    False,     # audio2audio_enable
-                    0.5,       # ref_audio_strength
-                    None,      # ref_audio_input
-                )
-            # 장르 프리셋 변경 시 태그 업데이트
-            def on_genre_change(genre_preset, current_tags, song_style):
-                return update_tags_from_preset(genre_preset, current_tags, song_style)
-            genre_preset.change(
-                fn=on_genre_change,
-                inputs=[genre_preset, prompt, song_style],
-                outputs=[prompt]
-            )
-            # 곡 스타일 변경 시 태그 업데이트
-            song_style.change(
-                fn=on_genre_change,
-                inputs=[genre_preset, prompt, song_style],
-                outputs=[prompt]
-            )
-            quality_preset.change(
-                fn=lambda x: QUALITY_PRESETS.get(x, {}).get("description", ""),
-                inputs=[quality_preset],
-                outputs=[preset_description]
-            )
-            quality_preset.change(
-                fn=update_quality_preset,
-                inputs=[quality_preset],
-                outputs=[infer_step, guidance_scale, scheduler_type, omega_scale, use_erg_diffusion, use_erg_tag]
-            )
         with gr.Column():
             outputs, input_params_json = create_output_ui()
-            # 실시간 프리뷰 기능
-            def generate_preview(prompt, lyrics, genre_preset, song_style):
-                """10초 프리뷰 생성"""
-                preview_params = {
-                    "audio_duration": 10,
-                    "infer_step": 50,
-                    "guidance_scale": 12.0,
-                    "scheduler_type": "euler",
-                    "cfg_type": "apg",
-                    "omega_scale": 5.0,
-                }
-                enhanced_prompt = enhance_prompt_with_genre(prompt, genre_preset, song_style)
-                try:
-                    # 실제 구현에서는 빠른 생성 모드 사용
-                    result = enhanced_process_func(
-                        preview_params["audio_duration"],
-                        enhanced_prompt,
-                        lyrics[:200],  # 가사 일부만 사용
-                        preview_params["infer_step"],
-                        preview_params["guidance_scale"],
-                        preview_params["scheduler_type"],
-                        preview_params["cfg_type"],
-                        preview_params["omega_scale"],
-                        None,  # manual_seeds
-                        0.5,   # guidance_interval
-                        0.0,   # guidance_interval_decay
-                        3.0,   # min_guidance_scale
-                        True,  # use_erg_tag
-                        False, # use_erg_lyric
-                        True,  # use_erg_diffusion
-                        None,  # oss_steps
-                        0.0,   # guidance_scale_text
-                        0.0,   # guidance_scale_lyric
-                        multi_seed_mode="Single",
-                        song_style=song_style
-                    )
-                    return result[0] if result else None
-                except Exception as e:
-                    return f"프리뷰 생성 실패: {str(e)}"
-            preview_bnt.click(
-                fn=generate_preview,
-                inputs=[prompt, lyrics, genre_preset, song_style],
-                outputs=[outputs[0]]
-            )
             with gr.Tab("retake"):
                 retake_variance = gr.Slider(
                     minimum=0.0, maximum=1.0, step=0.01, value=0.2, label="variance"
@@ -1376,36 +1207,208 @@ def create_text2music_ui(
                     outputs=extend_outputs + [extend_input_params_json],
                 )
-        # Random 버튼 이벤트
-        random_bnt.click(
-            fn=generate_random_music_data,
-            inputs=[genre_preset, song_style],
-            outputs=[
-                audio_duration,
-                prompt,
-                lyrics,
-                infer_step,
-                guidance_scale,
-                scheduler_type,
-                cfg_type,
-                omega_scale,
-                manual_seeds,
-                guidance_interval,
-                guidance_interval_decay,
-                min_guidance_scale,
-                use_erg_tag,
-                use_erg_lyric,
-                use_erg_diffusion,
-                oss_steps,
-                guidance_scale_text,
-                guidance_scale_lyric,
-                audio2audio_enable,
-                ref_audio_strength,
-                ref_audio_input,
-            ],
         )
-    # 메인 생성 버튼 이벤트 (향상된 함수 사용)
     text2music_bnt.click(
         fn=enhanced_process_func,
         inputs=[
@@ -1438,6 +1441,8 @@ def create_text2music_ui(
         ],
         outputs=outputs + [input_params_json],
     )
 def create_main_demo_ui(
@@ -1630,6 +1635,7 @@ def create_main_demo_ui(
 if __name__ == "__main__":
     demo = create_main_demo_ui()
     demo.launch(
         server_name="0.0.0.0",

 import numpy as np
 import json
 from typing import Dict, List, Tuple, Optional
 # OpenAI 클라이언트 초기화
 try:
     api_key = os.getenv("LLM_API") or os.getenv("OPENAI_API_KEY")
     if api_key:
+        from openai import OpenAI
         client = OpenAI(api_key=api_key)
+        print("✅ OpenAI API client initialized successfully")
     else:
         client = None
+        print("⚠️ Warning: No OpenAI API key found. AI lyrics generation will be disabled.")
 except Exception as e:
     client = None
+    print(f"❌ Warning: Failed to initialize OpenAI client: {e}")
 TAG_DEFAULT = "funk, pop, soul, rock, melodic, guitar, drums, bass, keyboard, percussion, 105 BPM, energetic, upbeat, groovy, vibrant, dynamic, duet, male and female vocals"
 LYRIC_DEFAULT = """[verse - male]
 def generate_lyrics_with_ai(prompt: str, genre: str, song_style: str) -> str:
     """AI를 사용하여 가사 생성"""
+    print(f"🎵 generate_lyrics_with_ai called with: prompt='{prompt}', genre='{genre}', style='{song_style}'")
     if not client:
+        print("❌ OpenAI client not available, returning default lyrics")
         return LYRIC_DEFAULT
     if not prompt or prompt.strip() == "":
+        print("⚠️ Empty prompt, returning default lyrics")
         return LYRIC_DEFAULT
     try:
 위 정보를 바탕으로 노래 가사를 작성해주세요. 입력된 언어와 동일한 언어로 작성하고, 구조 태그를 반드시 포함해주세요.
 """
+        print(f"📝 Sending request to OpenAI...")
         response = client.chat.completions.create(
+            model="gpt-4o-mini",
             messages=[
                 {"role": "system", "content": LYRIC_SYSTEM_PROMPT},
                 {"role": "user", "content": user_prompt}
         )
         generated_lyrics = response.choices[0].message.content
+        print(f"✅ Generated lyrics successfully")
         return generated_lyrics
     except Exception as e:
+        print(f"❌ AI 가사 생성 오류: {e}")
         return LYRIC_DEFAULT
 # 품질 프리셋 시스템 추가
     except:
         return 50.0  # 기본값
 def create_enhanced_process_func(original_func):
     """기존 함수를 향상된 기능으로 래핑"""
                             value="Custom",
                             label="장르 프리셋",
                             scale=1,
+                            interactive=True  # 명시적으로 interactive 추가
                         )
                         song_style = gr.Dropdown(
                             choices=list(SONG_STYLES.keys()),
                             value="듀엣 (남녀 혼성)",
                             label="곡 스타일",
                             scale=1,
+                            interactive=True  # 명시적으로 interactive 추가
                         )
                         enable_smart_enhancement = gr.Checkbox(
                             label="스마트 향상",
             text2music_bnt = gr.Button("🎵 Generate Music", variant="primary", size="lg")
         with gr.Column():
             outputs, input_params_json = create_output_ui()
             with gr.Tab("retake"):
                 retake_variance = gr.Slider(
                     minimum=0.0, maximum=1.0, step=0.01, value=0.2, label="variance"
                     outputs=extend_outputs + [extend_input_params_json],
                 )
+    # ===== 모든 UI 요소가 정의된 후 이벤트 핸들러 설정 =====
+    # 태그 업데이트 함수
+    def update_tags_from_preset(preset_name, current_tags, song_style):
+        """장르 프리셋 선택시 태그 업데이트"""
+        print(f"🎵 update_tags_from_preset called: preset={preset_name}, style={song_style}")
+        if preset_name == "Custom":
+            return current_tags
+        base_tags = GENRE_PRESETS.get(preset_name, "")
+        # 스타일 태그 추가
+        if song_style in SONG_STYLES:
+            style_tags = SONG_STYLES[song_style]
+            result = f"{base_tags}, {style_tags}"
+        else:
+            result = base_tags
+        print(f"✅ Updated tags: {result[:50]}...")
+        return result
+    # AI 작사 버튼 이벤트
+    def generate_ai_lyrics_handler(lyric_prompt, genre_preset, song_style):
+        print(f"🎤 AI 작사 버튼 클릭: prompt='{lyric_prompt}'")
+        if not lyric_prompt or lyric_prompt.strip() == "":
+            print("⚠️ 빈 프롬프트")
+            return lyrics.value  # 현재 가사 유지
+        generated = generate_lyrics_with_ai(lyric_prompt, genre_preset, song_style)
+        return generated
+    # 랜덤 데이터 생성 함수
+    def generate_random_music_data(genre_preset, song_style):
+        print("🎲 Random 버튼 클릭")
+        # 랜덤 장르 선택
+        if genre_preset == "Custom":
+            genre = random.choice(list(GENRE_PRESETS.keys()))
+        else:
+            genre = genre_preset
+        # 랜덤 주제 리스트
+        themes = [
+            "도시의 밤", "첫사랑의 추억", "여름날의 해변", "가을의 정취",
+            "희망찬 내일", "자유로운 영혼", "별빛 아래 춤", "청춘의 열정",
+            "비 오는 날의 감성", "꿈을 향한 도전", "이별 후의 성장", "새로운 시작"
+        ]
+        # 랜덤 설정
+        duration = random.choice([30, 60, 90, 120, 180])
+        theme = random.choice(themes)
+        # AI로 가사 생성
+        lyrics_text = generate_lyrics_with_ai(theme, genre, song_style)
+        # 태그 생성
+        tags = GENRE_PRESETS.get(genre, "")
+        if song_style in SONG_STYLES:
+            tags = f"{tags}, {SONG_STYLES[song_style]}"
+        # 랜덤 파라미터 설정
+        return (
+            duration,  # audio_duration
+            tags,      # prompt
+            lyrics_text,    # lyrics
+            150,       # infer_step
+            15.0,      # guidance_scale
+            "euler",   # scheduler_type
+            "apg",     # cfg_type
+            10.0,      # omega_scale
+            str(random.randint(1, 10000)),  # manual_seeds
+            0.5,       # guidance_interval
+            0.0,       # guidance_interval_decay
+            3.0,       # min_guidance_scale
+            True,      # use_erg_tag
+            False,     # use_erg_lyric
+            True,      # use_erg_diffusion
+            None,      # oss_steps
+            0.0,       # guidance_scale_text
+            0.0,       # guidance_scale_lyric
+            False,     # audio2audio_enable
+            0.5,       # ref_audio_strength
+            None,      # ref_audio_input
         )
+    # 실시간 프리뷰 기능
+    def generate_preview(prompt, lyrics, genre_preset, song_style):
+        """10초 프리뷰 생성"""
+        print("🎵 Preview 버튼 클릭")
+        preview_params = {
+            "audio_duration": 10,
+            "infer_step": 50,
+            "guidance_scale": 12.0,
+            "scheduler_type": "euler",
+            "cfg_type": "apg",
+            "omega_scale": 5.0,
+        }
+        enhanced_prompt = enhance_prompt_with_genre(prompt, genre_preset, song_style)
+        try:
+            # 실제 구현에서는 빠른 생성 모드 사용
+            result = enhanced_process_func(
+                preview_params["audio_duration"],
+                enhanced_prompt,
+                lyrics[:200],  # 가사 일부만 사용
+                preview_params["infer_step"],
+                preview_params["guidance_scale"],
+                preview_params["scheduler_type"],
+                preview_params["cfg_type"],
+                preview_params["omega_scale"],
+                None,  # manual_seeds
+                0.5,   # guidance_interval
+                0.0,   # guidance_interval_decay
+                3.0,   # min_guidance_scale
+                True,  # use_erg_tag
+                False, # use_erg_lyric
+                True,  # use_erg_diffusion
+                None,  # oss_steps
+                0.0,   # guidance_scale_text
+                0.0,   # guidance_scale_lyric
+                multi_seed_mode="Single",
+                song_style=song_style
+            )
+            return result[0] if result else None
+        except Exception as e:
+            return f"프리뷰 생성 실패: {str(e)}"
+    # 이벤트 핸들러 연결
+    print("🔗 이벤트 핸들러 연결 중...")
+    # 장르 프리셋 변경 이벤트
+    genre_preset.change(
+        fn=update_tags_from_preset,
+        inputs=[genre_preset, prompt, song_style],
+        outputs=[prompt]
+    )
+    # 곡 스타일 변경 이벤트
+    song_style.change(
+        fn=update_tags_from_preset,
+        inputs=[genre_preset, prompt, song_style],
+        outputs=[prompt]
+    )
+    # 품질 프리셋 변경 이벤트
+    quality_preset.change(
+        fn=lambda x: QUALITY_PRESETS.get(x, {}).get("description", ""),
+        inputs=[quality_preset],
+        outputs=[preset_description]
+    )
+    quality_preset.change(
+        fn=update_quality_preset,
+        inputs=[quality_preset],
+        outputs=[infer_step, guidance_scale, scheduler_type, omega_scale, use_erg_diffusion, use_erg_tag]
+    )
+    # AI 작사 버튼 이벤트
+    generate_lyrics_btn.click(
+        fn=generate_ai_lyrics_handler,
+        inputs=[lyric_prompt, genre_preset, song_style],
+        outputs=[lyrics]
+    )
+    # Random 버튼 이벤트
+    random_bnt.click(
+        fn=generate_random_music_data,
+        inputs=[genre_preset, song_style],
+        outputs=[
+            audio_duration,
+            prompt,
+            lyrics,
+            infer_step,
+            guidance_scale,
+            scheduler_type,
+            cfg_type,
+            omega_scale,
+            manual_seeds,
+            guidance_interval,
+            guidance_interval_decay,
+            min_guidance_scale,
+            use_erg_tag,
+            use_erg_lyric,
+            use_erg_diffusion,
+            oss_steps,
+            guidance_scale_text,
+            guidance_scale_lyric,
+            audio2audio_enable,
+            ref_audio_strength,
+            ref_audio_input,
+        ],
+    )
+    # Preview 버튼 이벤트
+    preview_bnt.click(
+        fn=generate_preview,
+        inputs=[prompt, lyrics, genre_preset, song_style],
+        outputs=[outputs[0]]
+    )
+    # 메인 생성 버튼 이벤트
     text2music_bnt.click(
         fn=enhanced_process_func,
         inputs=[
         ],
         outputs=outputs + [input_params_json],
     )
+    print("✅ 모든 이벤트 핸들러 연결 완료")
 def create_main_demo_ui(
 if __name__ == "__main__":
+    print("🚀 ACE-Step PRO 시작 중...")
     demo = create_main_demo_ui()
     demo.launch(
         server_name="0.0.0.0",