Spaces:

fffiloni
/

whisper-to-stable-diffusion

Paused

App Files Files Community

fffiloni commited on Sep 24, 2022

Commit

7a2d549

1 Parent(s): 4b4ce6b

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -10

app.py CHANGED Viewed

@@ -36,7 +36,11 @@ def diffuse(prompt, guidance_scale, nb_iterations, seed):
     generator = torch.Generator(device=device).manual_seed(int(seed))
-    print("Sending prompt to Stable Diffusion ... ")
     print("prompt: " + prompt)
     print("guidance scale: " + str(guidance_scale))
     print("inference steps: " + str(nb_iterations))
@@ -63,6 +67,11 @@ def diffuse(prompt, guidance_scale, nb_iterations, seed):
     return images
 def translate(audio):
     audio = whisper.load_audio(audio)
     audio = whisper.pad_or_trim(audio)
@@ -77,8 +86,8 @@ def translate(audio):
     translation = whisper.decode(whisper_model, mel, translate_options)
     print("language spoken: " + transcription.language)
-    print(transcription.text)
-    print(translation.text)
     return transcription.language, transcription.text, translation.text
@@ -144,8 +153,11 @@ css = """
             padding: 20px;
             height: 160px;
         }
-        #spoken_lang{
         }
         div#spoken_lang textarea {
             font-size: 4em;
@@ -197,7 +209,7 @@ with gr.Blocks(css=css) as demo:
         </p>
         <p style='text-align: center;'>
-            This demo is running on 🐢 CPU. Offered by Sylvain <a href='https://twitter.com/fffiloni' target='_blank'>@fffiloni</a> • <img id='visitor-badge' alt='visitor badge' src='https://visitor-badge.glitch.me/badge?page_id=gradio-blocks.whisper-to-stable-diffusion' style='display: inline-block' /><br />
             —
         </p>
@@ -222,14 +234,19 @@ with gr.Blocks(css=css) as demo:
                                     )
                     with gr.Row():
                         audio_r_translate = gr.Button("Check Whisper first ? 👍")
-                        audio_r_direct_sd = gr.Button("Magic Whisper —› SD right now ! 🤠")
             with gr.Tab(label="Upload audio input", elem_id="upload_tab"):
                 with gr.Column():
-                    upload_input = gr.Audio(source="upload", type="filepath", show_label=False)
                     with gr.Row():
-                        audio_u_translate = gr.Button("Check Whisper first ?")
-                        audio_u_direct_sd = gr.Button("Magic Whisper —› SD right now !")
             with gr.Accordion(label="Stable Diffusion Settings", elem_id="sd_settings"):
                 with gr.Row():

     generator = torch.Generator(device=device).manual_seed(int(seed))
+    print("""
+    —
+    Sending prompt to Stable Diffusion ...
+    —
+    """)
     print("prompt: " + prompt)
     print("guidance scale: " + str(guidance_scale))
     print("inference steps: " + str(nb_iterations))
     return images
 def translate(audio):
+    print("""
+    —
+    Sending audio to Whisper ...
+    —
+    """)
     audio = whisper.load_audio(audio)
     audio = whisper.pad_or_trim(audio)
     translation = whisper.decode(whisper_model, mel, translate_options)
     print("language spoken: " + transcription.language)
+    print("transcript: " + transcription.text)
+    print("translated: " + translation.text)
     return transcription.language, transcription.text, translation.text
             padding: 20px;
             height: 160px;
         }
+        div#upload_area {
+            height: 11.1rem;
+        }
+        div#upload_area > div.w-full > div {
+            min-height: 9rem;
         }
         div#spoken_lang textarea {
             font-size: 4em;
         </p>
         <p style='text-align: center;'>
+            This demo is running on 🐢 CPU • Offered by Sylvain <a href='https://twitter.com/fffiloni' target='_blank'>@fffiloni</a> • <img id='visitor-badge' alt='visitor badge' src='https://visitor-badge.glitch.me/badge?page_id=gradio-blocks.whisper-to-stable-diffusion' style='display: inline-block' /><br />
             —
         </p>
                                     )
                     with gr.Row():
                         audio_r_translate = gr.Button("Check Whisper first ? 👍")
+                        audio_r_direct_sd = gr.Button("Magic Whisper › SD right now! 🤠")
             with gr.Tab(label="Upload audio input", elem_id="upload_tab"):
                 with gr.Column():
+                    upload_input = gr.Audio(
+                                        source="upload",
+                                        type="filepath",
+                                        show_label=False,
+                                        elem_id="upload_area"
+                                    )
                     with gr.Row():
+                        audio_u_translate = gr.Button("Check Whisper first ? 👍")
+                        audio_u_direct_sd = gr.Button("Magic Whisper › SD right now! 🤠")
             with gr.Accordion(label="Stable Diffusion Settings", elem_id="sd_settings"):
                 with gr.Row():