| --- |
| language: fr |
| license: mit |
| tags: |
| - onnx |
| - manga |
| - reading-order |
| - computer-vision |
| - resnet |
| - coordconv |
| metrics: |
| - accuracy |
| --- |
| |
| # ReaderNet V4 - Reading Order Model |
|
|
| Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece). |
|
|
| ## Caractéristiques Techniques |
|
|
| - **Architecture** : ResNet profond avec 1024 canaux. |
| - **Entrées** : Tenseur (1, 7, 256, 256) |
| - 3 canaux RGB |
| - 2 masques de bulles (A et B) |
| - 2 canaux CoordConv (X/Y normalisés) |
| - **Sortie** : Probabilité (0-1) que la bulle A soit lue avant la bulle B. |
| - **Précision (Validation)** : **98.3%** |
| - **Taille** : ~170 MB |
|
|
| ## Performance |
|
|
| Le modèle utilise une grille de pooling spatiale de 8x8, permettant de gérer les mises en page complexes (double-pages, diagonales, etc). |
|
|
| ## Utilisation |
|
|
| Le modèle est au format ONNX, conçu pour être exécuté via [ONNX Runtime Web](https://onnxruntime.ai/) directement dans le navigateur. |
|
|