Spaces:

krishna-k
/

fast

Sleeping

krishna-k commited on Mar 1, 2025

Commit

81567e9

verified ·

1 Parent(s): 53ec323

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,11 +2,31 @@ from fastrtc import Stream, ReplyOnPause
 import numpy as np
 from pydub import AudioSegment
 from pydub.utils import which
 AudioSegment.ffmpeg = which("ffmpeg")
 def echo(audio: tuple[int, np.ndarray]) -> tuple[int, np.ndarray]:
     yield audio
 stream = Stream(ReplyOnPause(echo), modality="audio", mode="send-receive")
-stream.ui.launch(share=True)

 import numpy as np
 from pydub import AudioSegment
 from pydub.utils import which
+import gradio as gr
 AudioSegment.ffmpeg = which("ffmpeg")
 def echo(audio: tuple[int, np.ndarray]) -> tuple[int, np.ndarray]:
     yield audio
 stream = Stream(ReplyOnPause(echo), modality="audio", mode="send-receive")
+def process_audio(audio_input):
+    # audio_input is received as a Gradio Audio object, containing a tuple of (sample_rate, numpy array)
+    sample_rate, audio_data = audio_input
+    # Process audio through the stream
+    processed_sample_rate, processed_audio = echo((sample_rate, audio_data))
+    # Return processed audio to Gradio for output
+    return processed_sample_rate, processed_audio
+interface = gr.Interface(
+    fn=process_audio,  # The function to process audio
+    inputs=gr.Audio(source="microphone", type="numpy"),  # Microphone input (audio)
+    outputs=gr.Audio(type="numpy"),  # Audio output (processed)
+    live=True  # Make the processing live (if needed)
+)
+interface.launch()