LaMOP commited on
Commit
dfe88d3
·
verified ·
1 Parent(s): ea62f75

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +113 -0
README.md CHANGED
@@ -1,3 +1,116 @@
1
  ---
2
  license: cc0-1.0
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: cc0-1.0
3
+ base_model:
4
+ - Ultralytics/YOLO26
5
+ pipeline_tag: image-segmentation
6
+ tags:
7
+ - document-layout
8
+ - yolo
9
+ - document-layout-analysis
10
  ---
11
+ # **Fiche Technique : Modèles YOLOv26n,x (Ultralytics)**
12
+
13
+ *Version : 1.0 | Date : 22/05/2026*
14
+
15
+ ---
16
+
17
+ ## **Informations générales**
18
+
19
+ Modèles **YOLOv26** spécialisés pour la **segmentation de régions de texte (TextRegion) et de lignes de texte (TextLine)** dans des manuscrits médievaux.
20
+
21
+ **Cas d'usage** : HTR.
22
+
23
+ | **Champ** | **SegN** | **SegX**
24
+ |-------------------------|-----------------------------------|-----------------------------------
25
+ | **Nom du modèle** | `Yolo-Seg-TextRegion-TextLine-Manuscript-SegN.pt` | `Yolo-Seg-TextRegion-TextLine-Manuscript-SegX.pt`
26
+ | **Librairie** | Ultralytics YOLOv8.4.49 | Ultralytics YOLOv8.4.49
27
+ | **Type** | Segmentation d’instances | Segmentation d’instances
28
+ | **Architecture** | YOLOv26n (nano) | YOLOv26x (extra-large)
29
+ | **Taille des poids** | ~6.6 Mo | ~141 Mo
30
+ | **Résolution d’entrée** | 640x640 (par défaut) | 640x640 (par défaut)
31
+ | **Classes** | 2 (TextRegion, TextLine) | 2 (TextRegion, TextLine)
32
+ | **Framework** | PyTorch ≥ 2.0 | PyTorch ≥ 2.0
33
+ | **Licence** | CC-Zero | CC-Zero
34
+
35
+ ---
36
+
37
+ ## **Performances**
38
+
39
+
40
+ | **Métrique** | **Valeur SegN** | **Valeur SegX** |
41
+ | -------------- | ---------- | ---------- |
42
+ | mAP50-95 (val) | 63.98% | 68.73% |
43
+ | mAP50 (val) | 82.25% | 84.92% |
44
+ | Précision (P) | 0.88186 | 0.90743 |
45
+ | Rappel (R) | 0.76673 | 0.80739 |
46
+
47
+ ---
48
+
49
+
50
+ ## **Dataset**
51
+
52
+ ### **Composition**
53
+
54
+ - **Taille totale** : **6599 images** (5279 train / 1320 val).
55
+ - **Format d’annotation** : YOLO (fichiers `.txt` avec masques de segmentation).
56
+
57
+ ---
58
+
59
+
60
+
61
+ ---
62
+
63
+ ## **Courbes et visualisations**
64
+
65
+ - **Courbe PR (Precision-Recall)** :
66
+
67
+ Courbe PR pour le modèle SegN
68
+
69
+ ![Courbe PR SegN](Yolo-Seg-TextRegion-TextLine-Manuscript-SegN/BoxPR_curve.png)
70
+
71
+ Courbe PR pour le modèle SegX
72
+
73
+ ![Courbe PR SegX](Yolo-Seg-TextRegion-TextLine-Manuscript-SegX/BoxPR_curve.png)
74
+
75
+ - **Matrice de confusion** :
76
+
77
+ Confusion Matrix pour le modèle SegN
78
+
79
+ ![Confusion Matrix SegN](Yolo-Seg-TextRegion-TextLine-Manuscript-SegN/confusion_matrix_normalized.png)
80
+
81
+ Confusion Matrix pour le modèle SegX
82
+
83
+ ![Confusion Matrix SegN](Yolo-Seg-TextRegion-TextLine-Manuscript-SegX/confusion_matrix_normalized.png)
84
+
85
+
86
+ - **Exemple de détection** :
87
+
88
+ Exemple sur le manuscrit "FRAD052_8H033_0043, Arch. dép. Haute-Marne, 8 H 33, Vrécourt n°7", disponible sur l'entrepôt de données [Nakala](https://nakala.fr/10.34847/nkl.b6ca1k68)
89
+
90
+ ![Exemple](FRAD052_8H033_0043.jpg)
91
+
92
+ ---
93
+
94
+ ## **Utilisation****
95
+
96
+ ### **Installation**
97
+
98
+ ```bash
99
+ pip install ultralytics==8.4.49 torch torchvision
100
+ ```
101
+
102
+ ### **Inférence**
103
+
104
+ ```python
105
+ from ultralytics import YOLO
106
+
107
+ # Charger le modèle
108
+ model = YOLO("Yolo-Seg-TextRegion-TextLine-Manuscript-SegX.pt")
109
+
110
+ # Prédiction sur une image
111
+ results = model.predict("document.jpg", conf=0.5, show=True)
112
+
113
+ # Accéder aux masques de segmentation
114
+ for result in results:
115
+ masks = result.masks.data # Tensor des masques
116
+ boxes = result.boxes.data # Boîtes englobantes