draft-docker

Paused

harsh-manvar commited on Dec 31, 2024

Commit

c96f4ef

verified ·

1 Parent(s): ed4e27f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,12 +32,16 @@ def generate_response(prompt, max_tokens, temperature, top_p):
 def ocr_image(image_path):
     # Open the image from the file path
-    image = Image.open(image_path)
     pixel_values = ocr_processor(images=image, return_tensors="pt").pixel_values
-    # Perform OCR
     outputs = ocr_model.generate(pixel_values)
-    text = ocr_processor.decode(outputs[0], skip_special_tokens=True)
     return text
 # Gradio UI

 def ocr_image(image_path):
     # Open the image from the file path
+    image = Image.open(image_path).convert("RGB")
+    # Preprocess the image for the OCR model
     pixel_values = ocr_processor(images=image, return_tensors="pt").pixel_values
+    # Perform OCR inference
     outputs = ocr_model.generate(pixel_values)
+    # Decode the generated tokens into text
+    text = ocr_processor.batch_decode(outputs, skip_special_tokens=True)[0]
     return text
 # Gradio UI