Remidesbois
/

bubble_reorder_ml

computer-vision

Model card Files Files and versions

Remidesbois commited on Mar 13

Commit

65ca425

·

verified ·

1 Parent(s): 65c2a88

Update README.md

Files changed (1) hide show

README.md +36 -36

README.md CHANGED Viewed

@@ -1,36 +1,36 @@
----
-language: fr
-license: mit
-tags:
-- onnx
-- manga
-- reading-order
-- computer-vision
-- resnet
-- coordconv
-metrics:
-- accuracy
----
-# MonsterNet V4 - Reading Order Model
-Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).
-## Caractéristiques Techniques
-- **Architecture** : MonsterNet V4 (ResNet profond avec 1024 canaux au stade final).
-- **Entrées** : Tenseur (1, 7, 256, 256)
-  - 3 canaux RGB
-  - 2 masques de bulles (A et B)
-  - 2 canaux CoordConv (X/Y normalisés)
-- **Sortie** : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
-- **Précision (Validation)** : **98.3%**
-- **Taille** : ~170 MB
-## Performance
-Le modèle utilise une grille de pooling spatiale de 8x8 pour maintenir une précision topologique élevée, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).
-## Utilisation
-Le modèle est au format ONNX, conçu pour être exécuté via [ONNX Runtime Web](https://onnxruntime.ai/) directement dans le navigateur.

+---
+language: fr
+license: mit
+tags:
+- onnx
+- manga
+- reading-order
+- computer-vision
+- resnet
+- coordconv
+metrics:
+- accuracy
+---
+# MonsterNet V4 - Reading Order Model
+Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).
+## Caractéristiques Techniques
+- **Architecture** : ResNet profond avec 1024 canaux.
+- **Entrées** : Tenseur (1, 7, 256, 256)
+  - 3 canaux RGB
+  - 2 masques de bulles (A et B)
+  - 2 canaux CoordConv (X/Y normalisés)
+- **Sortie** : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
+- **Précision (Validation)** : **98.3%**
+- **Taille** : ~170 MB
+## Performance
+Le modèle utilise une grille de pooling spatiale de 8x8, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).
+## Utilisation
+Le modèle est au format ONNX, conçu pour être exécuté via [ONNX Runtime Web](https://onnxruntime.ai/) directement dans le navigateur.