Remidesbois commited on
Commit
65ca425
·
verified ·
1 Parent(s): 65c2a88

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +36 -36
README.md CHANGED
@@ -1,36 +1,36 @@
1
- ---
2
- language: fr
3
- license: mit
4
- tags:
5
- - onnx
6
- - manga
7
- - reading-order
8
- - computer-vision
9
- - resnet
10
- - coordconv
11
- metrics:
12
- - accuracy
13
- ---
14
-
15
- # MonsterNet V4 - Reading Order Model
16
-
17
- Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).
18
-
19
- ## Caractéristiques Techniques
20
-
21
- - **Architecture** : MonsterNet V4 (ResNet profond avec 1024 canaux au stade final).
22
- - **Entrées** : Tenseur (1, 7, 256, 256)
23
- - 3 canaux RGB
24
- - 2 masques de bulles (A et B)
25
- - 2 canaux CoordConv (X/Y normalisés)
26
- - **Sortie** : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
27
- - **Précision (Validation)** : **98.3%**
28
- - **Taille** : ~170 MB
29
-
30
- ## Performance
31
-
32
- Le modèle utilise une grille de pooling spatiale de 8x8 pour maintenir une précision topologique élevée, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).
33
-
34
- ## Utilisation
35
-
36
- Le modèle est au format ONNX, conçu pour être exécuté via [ONNX Runtime Web](https://onnxruntime.ai/) directement dans le navigateur.
 
1
+ ---
2
+ language: fr
3
+ license: mit
4
+ tags:
5
+ - onnx
6
+ - manga
7
+ - reading-order
8
+ - computer-vision
9
+ - resnet
10
+ - coordconv
11
+ metrics:
12
+ - accuracy
13
+ ---
14
+
15
+ # MonsterNet V4 - Reading Order Model
16
+
17
+ Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).
18
+
19
+ ## Caractéristiques Techniques
20
+
21
+ - **Architecture** : ResNet profond avec 1024 canaux.
22
+ - **Entrées** : Tenseur (1, 7, 256, 256)
23
+ - 3 canaux RGB
24
+ - 2 masques de bulles (A et B)
25
+ - 2 canaux CoordConv (X/Y normalisés)
26
+ - **Sortie** : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
27
+ - **Précision (Validation)** : **98.3%**
28
+ - **Taille** : ~170 MB
29
+
30
+ ## Performance
31
+
32
+ Le modèle utilise une grille de pooling spatiale de 8x8, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).
33
+
34
+ ## Utilisation
35
+
36
+ Le modèle est au format ONNX, conçu pour être exécuté via [ONNX Runtime Web](https://onnxruntime.ai/) directement dans le navigateur.