Spaces:

teticio
/

audio-diffusion

Runtime error

teticio commited on Nov 7, 2022

Commit

8c2e759

1 Parent(s): c1e3d89

update apps to incude latent diffusion

Files changed (2) hide show

app.py CHANGED Viewed

@@ -15,28 +15,30 @@ def generate_spectrogram_audio_and_loop(model_id):
     return image, (sample_rate, audio), (sample_rate, loop)
-demo = gr.Interface(fn=generate_spectrogram_audio_and_loop,
-                    title="Audio Diffusion",
-                    description="Generate audio using Huggingface diffusers.\
-        This takes about 20 minutes without a GPU, so why not make yourself a \
-            cup of tea in the meantime? (Or try the teticio/audio-diffusion-ddim-256 \
-                model which is faster.)",
-                    inputs=[
-                        gr.Dropdown(label="Model",
-                                    choices=[
-                                        "teticio/audio-diffusion-256",
-                                        "teticio/audio-diffusion-breaks-256",
-                                        "teticio/audio-diffusion-instrumental-hiphop-256",
-                                        "teticio/audio-diffusion-ddim-256"
-                                    ],
-                                    value="teticio/audio-diffusion-256")
                     ],
-                    outputs=[
-                        gr.Image(label="Mel spectrogram", image_mode="L"),
-                        gr.Audio(label="Audio"),
-                        gr.Audio(label="Loop"),
-                    ],
-                    allow_flagging="never")
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()

     return image, (sample_rate, audio), (sample_rate, loop)
+demo = gr.Interface(
+    fn=generate_spectrogram_audio_and_loop,
+    title="Audio Diffusion",
+    description="Generate audio using Huggingface diffusers.\
+        The models without 'latent' or 'ddim' give better results but take about \
+            20 minutes without a GPU.",
+    inputs=[
+        gr.Dropdown(label="Model",
+                    choices=[
+                        "teticio/audio-diffusion-256",
+                        "teticio/audio-diffusion-breaks-256",
+                        "teticio/audio-diffusion-instrumental-hiphop-256",
+                        "teticio/audio-diffusion-ddim-256",
+                        "teticio/latent-audio-diffusion-256",
+                        "teticio/latent-audio-diffusion-ddim-256"
                     ],
+                    value="teticio/latent-audio-diffusion-ddim-256")
+    ],
+    outputs=[
+        gr.Image(label="Mel spectrogram", image_mode="L"),
+        gr.Audio(label="Audio"),
+        gr.Audio(label="Loop"),
+    ],
+    allow_flagging="never")
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()

streamlit_app.py CHANGED Viewed

@@ -8,16 +8,19 @@ from audiodiffusion import AudioDiffusion
 if __name__ == "__main__":
     st.header("Audio Diffusion")
-    st.markdown("Generate audio using Huggingface diffusers.\
-        This takes about 20 minutes without a GPU, so why not make yourself a \
-            cup of tea in the meantime? (Or try the teticio/audio-diffusion-ddim-256 \
-                model which is faster.)")
     model_id = st.selectbox("Model", [
         "teticio/audio-diffusion-256", "teticio/audio-diffusion-breaks-256",
         "teticio/audio-diffusion-instrumental-hiphop-256",
-        "teticio/audio-diffusion-ddim-256"
-    ])
     audio_diffusion = AudioDiffusion(model_id=model_id)
     if st.button("Generate"):

 if __name__ == "__main__":
     st.header("Audio Diffusion")
+    st.markdown(
+        "Generate audio using Huggingface diffusers.\
+        The models without 'latent' or 'ddim' give better results but take about \
+            20 minutes without a GPU.", )
     model_id = st.selectbox("Model", [
         "teticio/audio-diffusion-256", "teticio/audio-diffusion-breaks-256",
         "teticio/audio-diffusion-instrumental-hiphop-256",
+        "teticio/audio-diffusion-ddim-256",
+        "teticio/latent-audio-diffusion-256",
+        "teticio/latent-audio-diffusion-ddim-256"
+    ],
+                            index=5)
     audio_diffusion = AudioDiffusion(model_id=model_id)
     if st.button("Generate"):