| --- |
| license: cc0-1.0 |
| base_model: |
| - Ultralytics/YOLO26 |
| pipeline_tag: image-segmentation |
| tags: |
| - document-layout |
| - yolo |
| - document-layout-analysis |
| --- |
| # **Fiche Technique : Modèles YOLOv26n,x (Ultralytics)** |
|
|
| *Version : 1.0 | Date : 22/05/2026* |
|
|
| --- |
|
|
| ## **Informations générales** |
|
|
| Modèles **YOLOv26** spécialisés pour la **segmentation de régions de texte (TextRegion) et de lignes de texte (TextLine)** dans des documents. |
|
|
| **Cas d'usage** : OCR, transcription automatique, analyse de documents patrimoniaux. |
|
|
| | **Champ** | **SegN** | **SegX** |
| |-------------------------|-----------------------------------|----------------------------------- |
| | **Nom du modèle** | `Yolo-Seg-TextRegion-TextLine-Typed-SegN.pt` | `Yolo-Seg-TextRegion-TextLine-Typed-SegX.pt` |
| | **Librairie** | Ultralytics YOLOv8.4.49 | Ultralytics YOLOv8.4.49 |
| | **Type** | Segmentation d’instances | Segmentation d’instances |
| | **Architecture** | YOLOv26n (nano) | YOLOv26x (extra-large) |
| | **Taille des poids** | ~6.6 Mo | ~141 Mo |
| | **Résolution d’entrée** | 640x640 (par défaut) | 640x640 (par défaut) |
| | **Classes** | 2 (TextRegion, TextLine) | 2 (TextRegion, TextLine) |
| | **Framework** | PyTorch ≥ 2.0 | PyTorch ≥ 2.0 |
| | **Licence** | CC-Zero | CC-Zero |
|
|
| --- |
|
|
| ## **Performances** |
|
|
|
|
| | **Métrique** | **Valeur SegN** | **Valeur SegX** | |
| | -------------- | ---------- | ---------- | |
| | mAP50-95 (val) | 73.62% | 76.97% | |
| | mAP50 (val) | 94.37% | 95.30% | |
| | Précision (P) | 0.930 | 0.95383 | |
| | Rappel (R) | 0.912 | 0.93317 | |
| | F1-Score | 0.921 | 0.943 | |
| --- |
|
|
|
|
| ## **Dataset** |
|
|
| ### **Composition** |
|
|
| - **Taille totale** : **4 956 images** (4 460 train / 496 val). |
| - **Sources** : **16 datasets publics** (voir [liste complète](#-sources-des-datasets)). |
| - **Langues couvertes** : Français, Anglais, Espagnol, Italien, Allemand, Latin, Corse, etc. |
| - **Périodes** : XVIe–XXe siècles (majorité : XVIIIe–XIXe). |
| - **Format d’annotation** : YOLO (fichiers `.txt` avec masques de segmentation). |
| - **Répartition des classes** : |
| - TextRegion : 9% (23195) |
| - TextLine : 91% (234634) |
|
|
| --- |
|
|
| ### **Sources des Datasets** |
|
|
| [Ehri-dataset](https://github.com/FloChiff/ehri-dataset) |
|
|
| [CORDEL-CA-PRINT-19](https://github.com/FoNDUE-HTR/CORDEL-CA-PRINT-19/) |
|
|
| [CORDEL-ES-PRINT-19](https://github.com/FoNDUE-HTR/CORDEL-ES-PRINT-19) |
|
|
| [FONDUE-EN-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-EN-PRINT-20) |
|
|
| [FONDUE-ES-PRINT-19](https://github.com/FoNDUE-HTR/FONDUE-ES-PRINT-19) |
|
|
| [FONDUE-FR-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-FR-PRINT-20) |
|
|
| [FONDUE-IT-PRINT-20](https://github.com/FoNDUE-HTR/FONDUE-IT-PRINT-20) |
|
|
| [FONDUE-MLT-ART](https://github.com/FoNDUE-HTR/FONDUE-MLT-ART) |
|
|
| [FONDUE-MLT-CAT](https://github.com/FoNDUE-HTR/FONDUE-MLT-CAT/) |
|
|
| [Kat_57-SE-MSS-20](https://github.com/FoNDUE-HTR/Kat_57-SE-MSS-20) |
|
|
| [HTR-imprime-18e-siecle](https://github.com/Gallicorpora/HTR-imprime-18e-siecle) |
|
|
| [Cremma-16-17-print](https://github.com/HTR-United/cremma-16-17-print) |
|
|
| [Dahncorpus](https://github.com/HTR-United/dahncorpus) |
|
|
| [Tapuscorpus](https://github.com/HTR-United/tapuscorpus) |
|
|
| [NuBIS-OCR](https://github.com/ksefil/NuBIS-OCR) |
|
|
| [HN2021-OCR-Poesie-Corse](https://github.com/PSL-Chartes-HTR-Students/HN2021-OCR-Poesie-Corse) |
|
|
| [TNAH-2021-ArgusDesBrevets](https://github.com/PSL-Chartes-HTR-Students/TNAH-2021-ArgusDesBrevets) |
|
|
| --- |
|
|
| ## **Courbes et visualisations** |
|
|
| - **Courbe PR (Precision-Recall)** : |
|
|
| Courbe PR pour le modèle SegN |
|
|
|  |
|
|
| Courbe PR pour le modèle SegX |
|
|
|  |
|
|
| - **Matrice de confusion** : |
|
|
| Confusion Matrix pour le modèle SegN |
|
|
|  |
|
|
| Confusion Matrix pour le modèle SegX |
|
|
|  |
|
|
|
|
| - **Exemple de détection** : |
|
|
| Exemple sur la thèse **Relief, érosion différentielle et morphogenèse dans un bourrelet montagneux de haute latitude : Lofoten-vesteralen et Sogn-Jotun (Norvège)** de Jean-Pierre Peulvast disponible sur le site de la [Nubis](https://nubis.bis-sorbonne.fr/ark:/15733/nt07?view=full) |
|
|
|  |
|
|
| --- |
|
|
| ## **Utilisation**** |
|
|
| ### **Installation** |
|
|
| ```bash |
| pip install ultralytics==8.4.49 torch torchvision |
| ``` |
|
|
| ### **Inférence** |
|
|
| ```python |
| from ultralytics import YOLO |
| |
| # Charger le modèle |
| model = YOLO("Yolo-Seg-TextRegion-TextLine-Typed-SegX.pt") |
| |
| # Prédiction sur une image |
| results = model.predict("document.jpg", conf=0.5, show=True) |
| |
| # Accéder aux masques de segmentation |
| for result in results: |
| masks = result.masks.data # Tensor des masques |
| boxes = result.boxes.data # Boîtes englobantes |