Spaces:

AgroVision25
/

AgroVision

Sleeping

App Files Files Community

sehaj13 commited on May 11, 2025

Commit

31f289c

verified ·

1 Parent(s): 9757cd6

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -10

app.py CHANGED Viewed

@@ -42,18 +42,27 @@ def predict_crop(N, P, K, temperature, humidity, ph, rainfall):
 def transcribe_audio(audio_path):
     recognizer = sr.Recognizer()
-    with sr.AudioFile(audio_path) as source:
-        audio = recognizer.record(source)
     try:
-        text = sr.Recognizer().recognize_google(audio)
-        lang = detect(text)  # Detect the language of the transcribed text
         return text, lang
     except sr.UnknownValueError:
-        return "❌ Could not understand audio.", None
     except sr.RequestError:
-        return "❌ Could not connect to Google API.", None
 # ---------------------------
 # Gemini Response in Detected Language
@@ -70,23 +79,30 @@ def get_gemini_response(query, lang_code):
 # Text to Speech in Same Language
 # ---------------------------
 def text_to_speech(text, lang):
-    tts = gTTS(text=text, lang=lang)
-    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
-    tts.save(temp_file.name)
-    return temp_file.name
 # ---------------------------
 # Combined Function
 # ---------------------------
 def handle_voice_query(audio_file):
     query, lang = transcribe_audio(audio_file)
     if lang is None:
         return query, "⚠️ No response", None
     response = get_gemini_response(query, lang)
     audio_path = text_to_speech(response, lang)
     return query, response, audio_path
 # ---------------------------
 # Gradio Interface
 # ---------------------------

+# ---------------------------
+# Transcribe Audio & Detect Language
+# ---------------------------
 def transcribe_audio(audio_path):
     recognizer = sr.Recognizer()
+    # Handle both file paths and file-like objects
+    audio_input = audio_path.name if hasattr(audio_path, "name") else audio_path
     try:
+        with sr.AudioFile(audio_input) as source:
+            audio = recognizer.record(source)
+        text = recognizer.recognize_google(audio)  # auto language transcription
+        lang = detect(text)  # detect language from transcribed text
         return text, lang
     except sr.UnknownValueError:
+        return "❌ Could not understand the audio.", None
     except sr.RequestError:
+        return "❌ Could not connect to Google Speech API.", None
+    except Exception as e:
+        return f"❌ Error: {str(e)}", None
 # ---------------------------
 # Gemini Response in Detected Language
 # Text to Speech in Same Language
 # ---------------------------
 def text_to_speech(text, lang):
+    try:
+        tts = gTTS(text=text, lang=lang)
+        temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
+        tts.save(temp_file.name)
+        return temp_file.name
+    except Exception as e:
+        print(f"❌ TTS Error: {str(e)}")
+        return None
 # ---------------------------
 # Combined Function
 # ---------------------------
 def handle_voice_query(audio_file):
     query, lang = transcribe_audio(audio_file)
     if lang is None:
         return query, "⚠️ No response", None
     response = get_gemini_response(query, lang)
     audio_path = text_to_speech(response, lang)
     return query, response, audio_path
 # ---------------------------
 # Gradio Interface
 # ---------------------------