RayR1's picture
Ajout du README
d957e9a verified

trocr-base-arabic-handwritten

Modèle TrOCR fine-tuné pour la reconnaissance de texte manuscrit en arabe.

Détails du modèle

  • Base model: microsoft/trocr-large-handwritten
  • Tokenizer: CAMeL-Lab/bert-base-arabic-camelbert-ca
  • Entraînement: 15 époques
  • Batch size: 8
  • Learning rate: 5.611516415334504e-06
  • Weight decay: 0.006351221010640704
  • Dropout: 0.16239780813448107

Utilisation

from transformers import TrOCRProcessor, VisionEncoderDecoderModel

processor = TrOCRProcessor.from_pretrained("RayR1/trocr-base-arabic-handwritten")
model = VisionEncoderDecoderModel.from_pretrained("RayR1/trocr-base-arabic-handwritten")

Consultez training_log.txt pour les métriques détaillées (CER, WER).