Spaces:

dindizz
/

conversationalassistant

Sleeping

App Files Files Community

dindizz commited on Sep 13, 2024

Commit

dad9456

verified ·

1 Parent(s): ab9b26b

Create app.py

Browse files

Files changed (1) hide show

app.py +68 -0

app.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import openai
+import speech_recognition as sr
+import pyttsx3
+import os
+import gradio as gr
+from dotenv import load_dotenv
+# Load your OpenAI API key from environment variable
+load_dotenv()
+openai.api_key = os.getenv("OPENAI_API_KEY")
+# Initialize speech recognition and text-to-speech engines
+recognizer = sr.Recognizer()
+tts_engine = pyttsx3.init()
+# Function to convert speech to text
+def speech_to_text(audio):
+    try:
+        with sr.AudioFile(audio) as source:
+            recognizer.adjust_for_ambient_noise(source)
+            audio_data = recognizer.record(source)
+            text = recognizer.recognize_google(audio_data)
+            return text
+    except sr.UnknownValueError:
+        return "Sorry, I could not understand the audio."
+    except sr.RequestError as e:
+        return f"Could not request results; {e}"
+# Function to get GPT response
+def get_gpt_response(prompt):
+    try:
+        response = openai.Completion.create(
+            engine="text-davinci-003",
+            prompt=prompt,
+            max_tokens=150
+        )
+        return response.choices[0].text.strip()
+    except Exception as e:
+        return f"Error: {e}"
+# Function to convert text to speech
+def text_to_speech(response):
+    tts_engine.save_to_file(response, "response.mp3")
+    tts_engine.runAndWait()
+    return "response.mp3"
+# Gradio function that integrates all components
+def chatbot(audio):
+    user_input = speech_to_text(audio)
+    if "Sorry" in user_input:
+        return user_input, None
+    response = get_gpt_response(user_input)
+    if response:
+        audio_response = text_to_speech(response)
+        return response, audio_response
+    return "Error generating response.", None
+# Gradio interface
+iface = gr.Interface(
+    fn=chatbot,
+    inputs=gr.Audio(source="microphone", type="filepath"),
+    outputs=[gr.Textbox(label="Transcription"), gr.Audio(label="AI Response")],
+    live=True
+)
+# Launch the Gradio interface
+if __name__ == "__main__":
+    iface.launch()