Spaces:

AgroVision25
/

AgroVision

Sleeping

App Files Files Community

sehaj13 commited on May 11, 2025

Commit

76dcfba

verified ·

1 Parent(s): d973189

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -14

app.py CHANGED Viewed

@@ -9,6 +9,8 @@ from gtts import gTTS
 import speech_recognition as sr
 import os
 import tempfile
 # ---------------------------
 # Gemini Configuration
@@ -38,31 +40,36 @@ def predict_crop(N, P, K, temperature, humidity, ph, rainfall):
     crop_name = le.inverse_transform([pred])[0]
     return f"🌾 ਸਿਫਾਰਸ਼ੀ ਫਸਲ: *{crop_name}*"
-# ---------------------------
-# Voice to Text Utility
-# ---------------------------
 def transcribe_audio(audio_path):
     recognizer = sr.Recognizer()
     with sr.AudioFile(audio_path) as source:
         audio = recognizer.record(source)
     try:
-        return recognizer.recognize_google(audio, language='pa-IN')
     except sr.UnknownValueError:
-        return "❌ ਆਵਾਜ਼ ਨੂੰ ਸਮਝਿਆ ਨਹੀਂ ਜਾ ਸਕਿਆ।"
     except sr.RequestError:
-        return "❌ ਗੂਗਲ ਸਪੀਚ ਐਪੀਆਈ ਨਾਲ ਕਨੇਕਟ ਨਹੀਂ ਹੋ ਸਕਿਆ।"
 # ---------------------------
-# Gemini Response & TTS
 # ---------------------------
-def get_gemini_response(query):
     try:
-        response = gemini_model.generate_content(f"ਪੰਜਾਬੀ ਵਿੱਚ ਜਵਾਬ ਦਿਓ: {query}")
         return response.text
     except Exception as e:
-        return f"❌ Gemini ਤਰਫੋਂ ਗਲਤੀ: {str(e)}"
-def text_to_speech(text, lang='pa'):
     tts = gTTS(text=text, lang=lang)
     temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
     tts.save(temp_file.name)
@@ -72,9 +79,12 @@ def text_to_speech(text, lang='pa'):
 # Combined Function
 # ---------------------------
 def handle_voice_query(audio_file):
-    query = transcribe_audio(audio_file)
-    response = get_gemini_response(query)
-    audio_path = text_to_speech(response)
     return query, response, audio_path
 # ---------------------------

 import speech_recognition as sr
 import os
 import tempfile
+from langdetect import detect
 # ---------------------------
 # Gemini Configuration
     crop_name = le.inverse_transform([pred])[0]
     return f"🌾 ਸਿਫਾਰਸ਼ੀ ਫਸਲ: *{crop_name}*"
 def transcribe_audio(audio_path):
     recognizer = sr.Recognizer()
     with sr.AudioFile(audio_path) as source:
         audio = recognizer.record(source)
     try:
+        text = sr.Recognizer().recognize_google(audio)
+        lang = detect(text)  # Detect the language of the transcribed text
+        return text, lang
     except sr.UnknownValueError:
+        return "❌ Could not understand audio.", None
     except sr.RequestError:
+        return "❌ Could not connect to Google API.", None
 # ---------------------------
+# Gemini Response in Detected Language
 # ---------------------------
+def get_gemini_response(query, lang_code):
     try:
+        system_prompt = f"Answer the following in language code '{lang_code}': {query}"
+        response = gemini_model.generate_content(system_prompt)
         return response.text
     except Exception as e:
+        return f"❌ Gemini error: {str(e)}"
+# ---------------------------
+# Text to Speech in Same Language
+# ---------------------------
+def text_to_speech(text, lang):
     tts = gTTS(text=text, lang=lang)
     temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
     tts.save(temp_file.name)
 # Combined Function
 # ---------------------------
 def handle_voice_query(audio_file):
+    query, lang = transcribe_audio(audio_file)
+    if lang is None:
+        return query, "⚠️ No response", None
+    response = get_gemini_response(query, lang)
+    audio_path = text_to_speech(response, lang)
     return query, response, audio_path
 # ---------------------------