Spaces:

gyrojeff
/

YuzuMarker.FontDetection

Running

gyrojeff commited on Apr 5, 2023

Commit

afbe904

1 Parent(s): ac3ee6a

feat: add classification only option

Files changed (2) hide show

detector/model.py CHANGED Viewed

@@ -83,16 +83,21 @@ class ResNet101Regressor(nn.Module):
 class FontDetectorLoss(nn.Module):
-    def __init__(self, lambda_font, lambda_direction, lambda_regression):
         super().__init__()
         self.category_loss = nn.CrossEntropyLoss()
         self.regression_loss = nn.MSELoss()
         self.lambda_font = lambda_font
         self.lambda_direction = lambda_direction
         self.lambda_regression = lambda_regression
     def forward(self, y_hat, y):
         font_cat = self.category_loss(y_hat[..., : config.FONT_COUNT], y[..., 0].long())
         direction_cat = self.category_loss(
             y_hat[..., config.FONT_COUNT : config.FONT_COUNT + 2], y[..., 1].long()
         )
@@ -130,6 +135,7 @@ class FontDetector(ptl.LightningModule):
         lambda_font: float,
         lambda_direction: float,
         lambda_regression: float,
         lr: float,
         betas: Tuple[float, float],
         num_warmup_iters: int,
@@ -138,7 +144,9 @@ class FontDetector(ptl.LightningModule):
     ):
         super().__init__()
         self.model = model
-        self.loss = FontDetectorLoss(lambda_font, lambda_direction, lambda_regression)
         self.font_accur_train = torchmetrics.Accuracy(
             task="multiclass", num_classes=config.FONT_COUNT
         )

 class FontDetectorLoss(nn.Module):
+    def __init__(
+        self, lambda_font, lambda_direction, lambda_regression, font_classification_only
+    ):
         super().__init__()
         self.category_loss = nn.CrossEntropyLoss()
         self.regression_loss = nn.MSELoss()
         self.lambda_font = lambda_font
         self.lambda_direction = lambda_direction
         self.lambda_regression = lambda_regression
+        self.font_classfiication_only = font_classification_only
     def forward(self, y_hat, y):
         font_cat = self.category_loss(y_hat[..., : config.FONT_COUNT], y[..., 0].long())
+        if self.font_classfiication_only:
+            return self.lambda_font * font_cat
         direction_cat = self.category_loss(
             y_hat[..., config.FONT_COUNT : config.FONT_COUNT + 2], y[..., 1].long()
         )
         lambda_font: float,
         lambda_direction: float,
         lambda_regression: float,
+        font_classification_only: bool,
         lr: float,
         betas: Tuple[float, float],
         num_warmup_iters: int,
     ):
         super().__init__()
         self.model = model
+        self.loss = FontDetectorLoss(
+            lambda_font, lambda_direction, lambda_regression, font_classification_only
+        )
         self.font_accur_train = torchmetrics.Accuracy(
             task="multiclass", num_classes=config.FONT_COUNT
         )

train.py CHANGED Viewed

@@ -84,6 +84,12 @@ parser.add_argument(
     default=get_current_tag(),
     help="Model name (default: current tag)",
 )
 args = parser.parse_args()
@@ -177,6 +183,7 @@ detector = FontDetector(
     lambda_font=lambda_font,
     lambda_direction=lambda_direction,
     lambda_regression=lambda_regression,
     lr=lr,
     betas=(b1, b2),
     num_warmup_iters=num_warmup_iter,

     default=get_current_tag(),
     help="Model name (default: current tag)",
 )
+parser.add_argument(
+    "-f",
+    "--font-classification-only",
+    action="store_true",
+    help="Font classification only (default: False)",
+)
 args = parser.parse_args()
     lambda_font=lambda_font,
     lambda_direction=lambda_direction,
     lambda_regression=lambda_regression,
+    font_classification_only=args.font_classification_only,
     lr=lr,
     betas=(b1, b2),
     num_warmup_iters=num_warmup_iter,