trocr-base-arabic-handwritten

Modèle TrOCR fine-tuné pour la reconnaissance de texte manuscrit en arabe.

Détails du modèle

Base model: microsoft/trocr-large-handwritten
Tokenizer: CAMeL-Lab/bert-base-arabic-camelbert-ca
Entraînement: 15 époques
Batch size: 8
Learning rate: 5.611516415334504e-06
Weight decay: 0.006351221010640704
Dropout: 0.16239780813448107

Utilisation

from transformers import TrOCRProcessor, VisionEncoderDecoderModel

processor = TrOCRProcessor.from_pretrained("RayR1/trocr-base-arabic-handwritten")
model = VisionEncoderDecoderModel.from_pretrained("RayR1/trocr-base-arabic-handwritten")

Consultez training_log.txt pour les métriques détaillées (CER, WER).