Spaces:

sunnynazir
/

REAL_TIME_CHATBOT

Runtime error

sunnynazir commited on Dec 25, 2024

Commit

89f29a0

verified ·

1 Parent(s): a82f58f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,13 +4,12 @@ from gtts import gTTS
 import whisper
 from groq import Groq
 import tempfile
-import threading
 # Initialize Groq client
 GROQ_API_KEY = "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"
 client = Groq(api_key=GROQ_API_KEY)
-# Load Whisper model
 model = whisper.load_model("base")
 # Function for generating audio response
@@ -20,8 +19,9 @@ def generate_audio_response(response_text):
     tts.save(output_audio.name)
     return output_audio.name
 def process_audio_stream(audio_data):
-    # Step 1: Transcribe audio in real-time (simplified transcription)
     transcription = model.transcribe(audio_data)["text"]
     # Step 2: Process transcription with Groq's LLM for real-time response
@@ -42,7 +42,7 @@ def process_audio_stream(audio_data):
 # Gradio interface for real-time voice interaction
 interface = gr.Interface(
     fn=process_audio_stream,
-    inputs=gr.Audio(source="microphone", type="filepath", streaming=True),  # Stream from microphone
     outputs=[
         "text",  # Display transcription
         "text",  # Display LLM response
@@ -53,4 +53,4 @@ interface = gr.Interface(
 )
 # Launch interface
-interface.launch()

 import whisper
 from groq import Groq
 import tempfile
 # Initialize Groq client
 GROQ_API_KEY = "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"
 client = Groq(api_key=GROQ_API_KEY)
+# Load Whisper model (using base model for faster processing)
 model = whisper.load_model("base")
 # Function for generating audio response
     tts.save(output_audio.name)
     return output_audio.name
+# Real-time processing function
 def process_audio_stream(audio_data):
+    # Step 1: Transcribe audio in real-time
     transcription = model.transcribe(audio_data)["text"]
     # Step 2: Process transcription with Groq's LLM for real-time response
 # Gradio interface for real-time voice interaction
 interface = gr.Interface(
     fn=process_audio_stream,
+    inputs=gr.Audio(type="filepath", recording=True),  # Corrected usage for microphone input
     outputs=[
         "text",  # Display transcription
         "text",  # Display LLM response
 )
 # Launch interface
+interface.launch(share=True)  # Use share=True to generate a public link