Spaces:

SaoYear
/

CleanMel

Running

App Files Files Community

SaoYear commited on Jun 17, 2025

Commit

f1a805c

1 Parent(s): 9afa27d

change mamba install

Browse files

Files changed (3) hide show

app.py +36 -36
model/cleanmel.py +5 -1
requirements.txt +1 -2

app.py CHANGED Viewed

@@ -128,41 +128,41 @@ def reset_everything():
     """Reset all components to initial state"""
     return None, None, None
-if __name__ == "__main__":
-    demo = gr.Blocks()
-    with gr.Blocks(title="CleanMel Demo") as demo:
-        gr.Markdown("## CleanMel Demo")
-        gr.Markdown("This demo showcases the CleanMel model for speech enhancement.")
-        with gr.Row():
-            audio_input = gr.Audio(label="Input Audio", type="filepath", sources="upload")
-            with gr.Column():
-                enhance_button_map = gr.Button("Enhance Audio (offline CleanMel_L_map)")
-                enhance_button_mask = gr.Button("Enhance Audio (offline CleanMel_L_mask)")
-                clear_btn = gr.Button(
-                    "🗑️ Clear All",
-                    variant="secondary",
-                    size="lg"
-                )
-        output_audio = gr.Audio(label="Enhanced Audio", type="filepath")
-        output_mel = gr.Image(label="Output LogMel Spectrogram", type="filepath", visible=True)
-        output_np = gr.File(label="Enhanced LogMel Spec. (.npy)", type="filepath")
-        enhance_button_map.click(
-            enhance_cleanmel_L_map,
-            inputs=audio_input,
-            outputs=[output_audio, output_mel, output_np]
-        )
-        enhance_button_mask.click(
-            enhance_cleanmel_L_mask,
-            inputs=audio_input,
             outputs=[output_audio, output_mel, output_np]
-        )
-        clear_btn.click(
-                fn=reset_everything,
-                outputs=[output_audio, output_mel, output_np]
-        )
-    demo.launch(debug=False, share=True)

     """Reset all components to initial state"""
     return None, None, None
+demo = gr.Blocks()
+with gr.Blocks(title="CleanMel Demo") as demo:
+    gr.Markdown("## CleanMel Demo")
+    gr.Markdown("This demo showcases the CleanMel model for speech enhancement.")
+    with gr.Row():
+        audio_input = gr.Audio(label="Input Audio", type="filepath", sources="upload")
+        with gr.Column():
+            enhance_button_map = gr.Button("Enhance Audio (offline CleanMel_L_map)")
+            enhance_button_mask = gr.Button("Enhance Audio (offline CleanMel_L_mask)")
+            clear_btn = gr.Button(
+                "🗑️ Clear All",
+                variant="secondary",
+                size="lg"
+            )
+    output_audio = gr.Audio(label="Enhanced Audio", type="filepath")
+    output_mel = gr.Image(label="Output LogMel Spectrogram", type="filepath", visible=True)
+    output_np = gr.File(label="Enhanced LogMel Spec. (.npy)", type="filepath")
+    enhance_button_map.click(
+        enhance_cleanmel_L_map,
+        inputs=audio_input,
+        outputs=[output_audio, output_mel, output_np]
+    )
+    enhance_button_mask.click(
+        enhance_cleanmel_L_mask,
+        inputs=audio_input,
+        outputs=[output_audio, output_mel, output_np]
+    )
+    clear_btn.click(
+            fn=reset_everything,
             outputs=[output_audio, output_mel, output_np]
+    )
+demo.launch(debug=False, share=True)

model/cleanmel.py CHANGED Viewed

@@ -11,7 +11,11 @@ from torch import Tensor
 from torch.nn import Parameter, init
 from torch.nn.common_types import _size_1_t
-from mamba_ssm import Mamba
 from mamba_ssm.utils.generation import InferenceParams
 class LinearGroup(nn.Module):

 from torch.nn import Parameter, init
 from torch.nn.common_types import _size_1_t
+try:
+    from mamba_ssm import Mamba
+except:
+    import os
+    os.system("pip install mamba_ssm==1.2.0.post1")
 from mamba_ssm.utils.generation import InferenceParams
 class LinearGroup(nn.Module):

requirements.txt CHANGED Viewed

@@ -12,5 +12,4 @@ PyYAML==6.0.1
 scipy==1.15.3
 soundfile==0.12.1
 spaces==0.37.0
-transformers==4.40.1
-mamba_ssm==1.2.0.post1

 scipy==1.15.3
 soundfile==0.12.1
 spaces==0.37.0
+transformers==4.40.1