metythorn
/

ViTOCR-base

+---
+language:
+- km
+license: apache-2.0
+tags:
+- ocr
+- transformer
+- vision
+pipeline_tag: image-to-text
+---
+# Khmer OCR Transformer
+This repository contains a pure Transformer-based checkpoint for Khmer OCR. Images are patch-embedded and encoded by a Transformer encoder, then decoded autoregressively without any CNN or spatial transformer components.
+## Installation
+```python
+pip install mer
+```
+## Usage
+```python
+from mer import Mer
+model = Mer(markdown=True, device='cuda')
+result = model.predict("sample_image.png")
+print("Predicted text:", result)
+```