ReaderNet V4 - Reading Order Model
Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).
Caractéristiques Techniques
- Architecture : ResNet profond avec 1024 canaux.
- Entrées : Tenseur (1, 7, 256, 256)
- 3 canaux RGB
- 2 masques de bulles (A et B)
- 2 canaux CoordConv (X/Y normalisés)
- Sortie : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
- Précision (Validation) : 98.3%
- Taille : ~170 MB
Performance
Le modèle utilise une grille de pooling spatiale de 8x8, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).
Utilisation
Le modèle est au format ONNX, conçu pour être exécuté via ONNX Runtime Web directement dans le navigateur.
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support