ReaderNet V4 - Reading Order Model

Ce modèle est spécialisé dans la détermination de l'ordre de lecture des bulles de texte dans les planches de manga (plus particulièrement optimisé pour l'esthétique de One Piece).

Caractéristiques Techniques

  • Architecture : ResNet profond avec 1024 canaux.
  • Entrées : Tenseur (1, 7, 256, 256)
    • 3 canaux RGB
    • 2 masques de bulles (A et B)
    • 2 canaux CoordConv (X/Y normalisés)
  • Sortie : Probabilité (0-1) que la bulle A soit lue avant la bulle B.
  • Précision (Validation) : 98.3%
  • Taille : ~170 MB

Performance

Le modèle utilise une grille de pooling spatiale de 8x8, permettant de gérer les mises en page complexes (double-pages, diagonales, etc).

Utilisation

Le modèle est au format ONNX, conçu pour être exécuté via ONNX Runtime Web directement dans le navigateur.

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support