BanglaScreenReader

Sleeping

kj03 commited on Jun 20, 2025

Commit

3c875dc

verified ·

1 Parent(s): 09db160

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -21,9 +21,9 @@ def bangla_reader(image):
     generated_ids = model.generate(pixel_values)
     ocr_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
-    # TTS
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as tmp:
-        tts.tts_to_file(text=ocr_text, file_path=tmp.name, language="bn", speaker="female")
         audio_path = tmp.name
     return f"OCR ফলাফল: {ocr_text}", audio_path

     generated_ids = model.generate(pixel_values)
     ocr_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    # TTS (without speaker argument)
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as tmp:
+        tts.tts_to_file(text=ocr_text, file_path=tmp.name, language="bn")  # Removed speaker
         audio_path = tmp.name
     return f"OCR ফলাফল: {ocr_text}", audio_path