File size: 5,215 Bytes
c50d1ea 6c61ee9 c50d1ea fc44d3e ccd9a70 fee1744 ccd9a70 c50d1ea ccd9a70 fc44d3e ccd9a70 fc44d3e ccd9a70 fee1744 ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 a4f4769 ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 c50d1ea ccd9a70 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 | ---
license: cc0-1.0
base_model:
- Ultralytics/YOLO26
pipeline_tag: image-segmentation
tags:
- document-layout
- yolo
- document-layout-analysis
---
# **Fiche Technique : Modèles YOLOv26n,x (Ultralytics)**
*Version : 1.0 | Date : 22/05/2026*
---
## **Informations générales**
Modèles **YOLOv26** spécialisés pour la **segmentation de régions de texte (TextRegion) et de lignes de texte (TextLine)** dans des documents.
**Cas d'usage** : OCR, transcription automatique, analyse de documents patrimoniaux.
| **Champ** | **SegN** | **SegX**
|-------------------------|-----------------------------------|-----------------------------------
| **Nom du modèle** | `Yolo-Seg-TextRegion-TextLine-Typed-SegN.pt` | `Yolo-Seg-TextRegion-TextLine-Typed-SegX.pt`
| **Librairie** | Ultralytics YOLOv8.4.49 | Ultralytics YOLOv8.4.49
| **Type** | Segmentation d’instances | Segmentation d’instances
| **Architecture** | YOLOv26n (nano) | YOLOv26x (extra-large)
| **Taille des poids** | ~6.6 Mo | ~141 Mo
| **Résolution d’entrée** | 640x640 (par défaut) | 640x640 (par défaut)
| **Classes** | 2 (TextRegion, TextLine) | 2 (TextRegion, TextLine)
| **Framework** | PyTorch ≥ 2.0 | PyTorch ≥ 2.0
| **Licence** | CC-Zero | CC-Zero
---
## **Performances**
| **Métrique** | **Valeur SegN** | **Valeur SegX** |
| -------------- | ---------- | ---------- |
| mAP50-95 (val) | 73.62% | 76.97% |
| mAP50 (val) | 94.37% | 95.30% |
| Précision (P) | 0.930 | 0.95383 |
| Rappel (R) | 0.912 | 0.93317 |
| F1-Score | 0.921 | 0.943 |
---
## **Dataset**
### **Composition**
- **Taille totale** : **4 956 images** (4 460 train / 496 val).
- **Sources** : **16 datasets publics** (voir [liste complète](#-sources-des-datasets)).
- **Langues couvertes** : Français, Anglais, Espagnol, Italien, Allemand, Latin, Corse, etc.
- **Périodes** : XVIe–XXe siècles (majorité : XVIIIe–XIXe).
- **Format d’annotation** : YOLO (fichiers `.txt` avec masques de segmentation).
- **Répartition des classes** :
- TextRegion : 9% (23195)
- TextLine : 91% (234634)
---
### **Sources des Datasets**
[Ehri-dataset](https://github.com/FloChiff/ehri-dataset)
[CORDEL-CA-PRINT-19](https://github.com/FoNDUE-HTR/CORDEL-CA-PRINT-19/)
[CORDEL-ES-PRINT-19](https://github.com/FoNDUE-HTR/CORDEL-ES-PRINT-19)
[FONDUE-EN-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-EN-PRINT-20)
[FONDUE-ES-PRINT-19](https://github.com/FoNDUE-HTR/FONDUE-ES-PRINT-19)
[FONDUE-FR-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-FR-PRINT-20)
[FONDUE-IT-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-IT-PRINT-20)
[FONDUE-MLT-ART](https://github.com/FoNDUE-HTR/FONDUE-MLT-ART)
[FONDUE-MLT-CAT](https://github.com/FoNDUE-HTR/FONDUE-MLT-CAT/)
[Kat_57-SE-MSS-20](https://github.com/FoNDUE-HTR/Kat_57-SE-MSS-20)
[HTR-imprime-18e-siecle](https://github.com/Gallicorpora/HTR-imprime-18e-siecle)
[Cremma-16-17-print](https://github.com/HTR-United/cremma-16-17-print)
[Dahncorpus](https://github.com/HTR-United/dahncorpus)
[Tapuscorpus](https://github.com/HTR-United/tapuscorpus)
[NuBIS-OCR](https://github.com/ksefil/NuBIS-OCR)
[HN2021-OCR-Poesie-Corse](https://github.com/PSL-Chartes-HTR-Students/HN2021-OCR-Poesie-Corse)
[TNAH-2021-ArgusDesBrevets](https://github.com/PSL-Chartes-HTR-Students/TNAH-2021-ArgusDesBrevets)
---
## **Courbes et visualisations**
- **Courbe PR (Precision-Recall)** :
Courbe PR pour le modèle SegN

Courbe PR pour le modèle SegX

- **Matrice de confusion** :
Confusion Matrix pour le modèle SegN

Confusion Matrix pour le modèle SegX

- **Exemple de détection** :
Exemple sur la thèse **Relief, érosion différentielle et morphogenèse dans un bourrelet montagneux de haute latitude : Lofoten-vesteralen et Sogn-Jotun (Norvège)** de Jean-Pierre Peulvast disponible sur le site de la [Nubis](https://nubis.bis-sorbonne.fr/ark:/15733/nt07?view=full)

---
## **Utilisation****
### **Installation**
```bash
pip install ultralytics==8.4.49 torch torchvision
```
### **Inférence**
```python
from ultralytics import YOLO
# Charger le modèle
model = YOLO("Yolo-Seg-TextRegion-TextLine-Typed-SegX.pt")
# Prédiction sur une image
results = model.predict("document.jpg", conf=0.5, show=True)
# Accéder aux masques de segmentation
for result in results:
masks = result.masks.data # Tensor des masques
boxes = result.boxes.data # Boîtes englobantes |