BanglaScreenReader

Sleeping

BanglaScreenReader / app.py

Update app.py

c31f5a5 verified 8 months ago

1.62 kB

	import gradio as gr
	from PIL import Image
	from gtts import gTTS
	import pytesseract
	import tempfile

	# FIX: Set Tesseract path explicitly
	pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'

	def bangla_reader(image):
	if image is None:
	return "কোনো ছবি দেওয়া হয়নি।", None

	# OCR with Bengali support
	ocr_text = pytesseract.image_to_string(image, lang='ben')

	if not ocr_text.strip():
	return "কোনো লেখা সনাক্ত করা যায়নি।", None

	# Text-to-Speech
	try:
	tts = gTTS(text=ocr_text, lang='bn')
	with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp:
	tts.save(tmp.name)
	audio_path = tmp.name
	except Exception as e:
	return f"OCR সফল হয়েছে, কিন্তু TTS ব্যর্থ: {str(e)}", None

	return f"OCR ফলাফল:\n{ocr_text.strip()}", audio_path

	# Gradio UI
	demo = gr.Interface(
	fn=bangla_reader,
	inputs=gr.Image(type="pil", label="বাংলা লেখা সম্বলিত ছবি দিন"),
	outputs=[
	gr.Textbox(label="OCR ফলাফল"),
	gr.Audio(label="বাংলা কণ্ঠে শুনুন")
	],
	title="📖 বাংলা রিডার (Bangla Reader)",
	description="ছবির বাংলা লেখা পড়ে তা পাঠ্য ও কণ্ঠে রূপান্তর করে শোনায়।",
	allow_flagging="never"
	)

	if __name__ == "__main__":
	demo.launch()