Spaces:

NLPV
/

ReadabilityTest

Sleeping

App Files Files Community

NLPV commited on Apr 27, 2025

Commit

17a319c

verified ·

1 Parent(s): 18faa93

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -1

app.py CHANGED Viewed

@@ -14,7 +14,6 @@ def play_text(text):
     os.system(f"start {temp_file.name}")  # Windows
     return "✅ Text is being read out. Please listen and read it yourself."
-# Function to transcribe user's audio and compare with the original text
 def transcribe_audio(audio, original_text):
     recognizer = sr.Recognizer()
     with sr.AudioFile(audio) as source:
@@ -22,21 +21,34 @@ def transcribe_audio(audio, original_text):
     try:
         start_time = time.time()
         # Split the audio into chunks (1-minute chunks in this example)
         audio_length = len(audio_data.frame_data)
         chunk_size = 60000  # 1 minute (60,000 ms)
         # Splitting audio data into chunks
         chunks = [audio_data.frame_data[i:i+chunk_size] for i in range(0, audio_length, chunk_size)]
         transcription = ""
         for chunk in chunks:
             audio_chunk = sr.AudioData(chunk, audio_data.sample_rate, audio_data.sample_width)
             # Using Google Speech Recognition (supports Hindi)
             transcription += recognizer.recognize_google(audio_chunk, language="hi-IN") + " "
         end_time = time.time()
         # Calculate Accuracy
         original_words = original_text.strip().split()
         transcribed_words = transcription.strip().split()
@@ -63,6 +75,8 @@ def transcribe_audio(audio, original_text):
     except Exception as e:
         return {"error": str(e)}
 # Gradio App
 with gr.Blocks() as app:
     gr.Markdown("## 🗣️ Hindi Reading & Pronunciation Practice App")

     os.system(f"start {temp_file.name}")  # Windows
     return "✅ Text is being read out. Please listen and read it yourself."
 def transcribe_audio(audio, original_text):
     recognizer = sr.Recognizer()
     with sr.AudioFile(audio) as source:
     try:
         start_time = time.time()
+        # Debug: Check audio data length and properties
+        print(f"Audio Data Length: {len(audio_data.frame_data)}")
+        print(f"Sample Rate: {audio_data.sample_rate}")
         # Split the audio into chunks (1-minute chunks in this example)
         audio_length = len(audio_data.frame_data)
         chunk_size = 60000  # 1 minute (60,000 ms)
         # Splitting audio data into chunks
         chunks = [audio_data.frame_data[i:i+chunk_size] for i in range(0, audio_length, chunk_size)]
+        print(f"Number of chunks: {len(chunks)}")
         transcription = ""
         for chunk in chunks:
             audio_chunk = sr.AudioData(chunk, audio_data.sample_rate, audio_data.sample_width)
+            # Debug: Print chunk size
+            print(f"Transcribing Chunk: {len(chunk)}")
             # Using Google Speech Recognition (supports Hindi)
             transcription += recognizer.recognize_google(audio_chunk, language="hi-IN") + " "
         end_time = time.time()
+        # Debug: Output full transcription
+        print(f"Transcribed Text: {transcription}")
         # Calculate Accuracy
         original_words = original_text.strip().split()
         transcribed_words = transcription.strip().split()
     except Exception as e:
         return {"error": str(e)}
+        return {"error": str(e)}
 # Gradio App
 with gr.Blocks() as app:
     gr.Markdown("## 🗣️ Hindi Reading & Pronunciation Practice App")