Spaces:

EconLabAI
/

Villalobos_machine

Sleeping

App Files Files Community

EconLab AI commited on Dec 21, 2024

Commit

c9d18d9

1 Parent(s): bc05d79

Updated layout and design for modern UI

Browse files

Files changed (1) hide show

app.py +63 -48

app.py CHANGED Viewed

@@ -2,7 +2,6 @@ import gradio as gr
 from transformers import pipeline
 import scipy.io.wavfile
 import os
-import numpy as np
 # Sicherstellen, dass der 'static'-Ordner existiert
 os.makedirs('static', exist_ok=True)
@@ -15,40 +14,51 @@ synthesizer = pipeline(
 )
 # Funktion zur Musikgenerierung
-def generate_music(prompt, duration, sampling_rate):
     try:
-        # Musik generieren
-        music = synthesizer(
-            prompt,
-            forward_params={"do_sample": True, "max_new_tokens": duration * sampling_rate}
-        )
-        # Ausgabe-Pfad definieren
         output_path = "static/generated_music.wav"
-        # Musikdatei speichern
         scipy.io.wavfile.write(
             output_path,
             rate=music["sampling_rate"],
             data=music["audio"]
         )
-        return output_path  # Pfad zur generierten Musikdatei zurückgeben
     except Exception as e:
-        return str(e)  # Fehlernachricht zurückgeben
 # Benutzerdefiniertes CSS
 custom_css = """
 body {
     background-color: #121212;
-    color: #e0e0e0;
     font-family: 'Arial', sans-serif;
     margin: 0;
     padding: 0;
 }
 button {
-    background-color: #1db954;
     color: white;
     font-weight: bold;
-    border-radius: 5px;
     padding: 10px 20px;
     border: none;
     cursor: pointer;
@@ -56,21 +66,20 @@ button {
 }
 button:hover {
-    background-color: #1ed760;
 }
-input[type="text"], textarea {
-    background-color: #2a2a3d;
     color: white;
     border: 1px solid #444;
     padding: 10px;
     border-radius: 5px;
     font-size: 14px;
-    width: 100%;
-}
-.slider {
-    accent-color: #1db954;
 }
 audio {
@@ -82,53 +91,59 @@ audio {
 # Gradio-Interface erstellen
 with gr.Blocks(css=custom_css) as demo:
-    gr.Markdown(
-        "<h1 style='text-align: center;'>🎶 Modern Audio Generator</h1>",
-        elem_id="title"
-    )
-    gr.Markdown(
-        "<p style='text-align: center;'>Generate studio-quality music from your prompts with advanced options.</p>"
-    )
     with gr.Row():
         with gr.Column(scale=2):
             prompt = gr.Textbox(
                 label="Prompt",
-                placeholder="Describe the music you want to generate"
             )
             duration = gr.Slider(
                 label="Duration in Seconds",
-                minimum=1,
                 maximum=60,
                 value=30
             )
-            sampling_rate = gr.Slider(
-                label="Sampling Rate (kHz)",
-                minimum=16,
-                maximum=48,
-                value=24
             )
-            generate_button = gr.Button("Generate")
-        with gr.Column(scale=3):
             output = gr.Audio(
                 label="Generated Music",
                 type="filepath",
-                autoplay=True,
-                show_download_button=True,
-                format="wav",
-                waveform_options={
-                    "waveform_color": "#1db954",
-                    "waveform_progress_color": "#e0e0e0"
-                }
             )
-    # Ereignisbindung
     generate_button.click(
         fn=generate_music,
-        inputs=[prompt, duration, sampling_rate],
         outputs=output
     )
 # Anwendung starten
 if __name__ == "__main__":
     demo.launch()

 from transformers import pipeline
 import scipy.io.wavfile
 import os
 # Sicherstellen, dass der 'static'-Ordner existiert
 os.makedirs('static', exist_ok=True)
 )
 # Funktion zur Musikgenerierung
+def generate_music(prompt, duration, diffusion_steps, cfg_scale):
     try:
+        # Placeholder für generierte Musik
+        # Da MusicGen keine Diffusion Steps und CFG Scale unterstützt, sind diese Parameter hier symbolisch.
+        music = synthesizer(prompt, forward_params={"do_sample": True})
+        # Datei speichern
         output_path = "static/generated_music.wav"
         scipy.io.wavfile.write(
             output_path,
             rate=music["sampling_rate"],
             data=music["audio"]
         )
+        return output_path
     except Exception as e:
+        return f"Error: {str(e)}"
 # Benutzerdefiniertes CSS
 custom_css = """
 body {
     background-color: #121212;
+    color: #ffffff;
     font-family: 'Arial', sans-serif;
     margin: 0;
     padding: 0;
 }
+#title {
+    text-align: center;
+    font-size: 24px;
+    font-weight: bold;
+    margin-bottom: 10px;
+}
+#description {
+    text-align: center;
+    font-size: 16px;
+    margin-bottom: 30px;
+}
 button {
+    background-color: #ff5722;
     color: white;
     font-weight: bold;
+    border-radius: 8px;
     padding: 10px 20px;
     border: none;
     cursor: pointer;
 }
 button:hover {
+    background-color: #ff784e;
+}
+.slider {
+    accent-color: #ff5722;
 }
+textarea, input[type="text"] {
+    background-color: #1e1e2f;
     color: white;
     border: 1px solid #444;
     padding: 10px;
     border-radius: 5px;
     font-size: 14px;
 }
 audio {
 # Gradio-Interface erstellen
 with gr.Blocks(css=custom_css) as demo:
+    gr.Markdown("<h1 id='title'>Stable Audio Generator</h1>")
+    gr.Markdown("<p id='description'>Generate variable-length stereo audio at 44.1kHz from text prompts using Stable Audio Open 1.0.</p>")
     with gr.Row():
         with gr.Column(scale=2):
             prompt = gr.Textbox(
                 label="Prompt",
+                placeholder="Describe your music (e.g., 'Relaxing piano music')."
             )
             duration = gr.Slider(
                 label="Duration in Seconds",
+                minimum=10,
                 maximum=60,
+                step=1,
                 value=30
             )
+            diffusion_steps = gr.Slider(
+                label="Number of Diffusion Steps",
+                minimum=50,
+                maximum=200,
+                step=10,
+                value=150
             )
+            cfg_scale = gr.Slider(
+                label="CFG Scale",
+                minimum=1,
+                maximum=20,
+                step=1,
+                value=10
+            )
+            generate_button = gr.Button("Submit")
+        with gr.Column(scale=1):
             output = gr.Audio(
                 label="Generated Music",
                 type="filepath",
+                autoplay=True
             )
+    with gr.Row():
+        clear_button = gr.Button("Clear")
     generate_button.click(
         fn=generate_music,
+        inputs=[prompt, duration, diffusion_steps, cfg_scale],
         outputs=output
     )
+    clear_button.click(
+        fn=lambda: None,
+        inputs=None,
+        outputs=[prompt, output]
+    )
 # Anwendung starten
 if __name__ == "__main__":
     demo.launch()