DBD-research-group
/

AudioProtoPNet-10-BirdSet-XCL

@@ -854,7 +854,7 @@ class AudioProtoNetPreTrainedModel(PreTrainedModel):
             nn.init.trunc_normal_(module.weight, std=0.02)
             if module.bias is not None:
                 nn.init.zeros_(module.bias)
-        if isinstance(module, LinearLayerWithoutNegativeConnections) and self.incorrect_class_connection is None: # TODO missing initilization
             # Initialize all weights to the correct_class_connection value
             self.last_layer.weight.data.fill_(self.correct_class_connection)
@@ -870,14 +870,12 @@ class AudioProtoNetModel(AudioProtoNetPreTrainedModel):
     def forward(
             self,
             input_values: torch.Tensor,
-            output_hidden_states: bool = None,
-            return_dict: bool = None
-    ) -> tuple | BaseModelOutputWithPoolingAndNoAttention:
         """
         Args:
             input_values:
             output_hidden_states:
-            return_dict:
         Returns:
             last_hidden_state: torch.FloatTensor = None
@@ -885,7 +883,7 @@ class AudioProtoNetModel(AudioProtoNetPreTrainedModel):
             hidden_states: Optional[Tuple[torch.FloatTensor, ...]] = None
         """
-        return self.backbone(input_values, output_hidden_states, return_dict)
 class AudioProtoNetForSequenceClassification(AudioProtoNetPreTrainedModel):
@@ -897,13 +895,6 @@ class AudioProtoNetForSequenceClassification(AudioProtoNetPreTrainedModel):
         self.model = AudioProtoNetModel(config)
         self.head = AudioProtoNetClassificationHead(config)
-    def freeze_backbone(self):
-        pass
-    def int2str(self): # TODO
-        pass
     def forward(
             self,
             input_values: torch.Tensor,
@@ -911,10 +902,9 @@ class AudioProtoNetForSequenceClassification(AudioProtoNetPreTrainedModel):
             prototypes_of_wrong_class: torch.Tensor = None,
             output_hidden_states: bool = None,
             output_prototypical_activations: bool = None,
-            return_dict: bool = None,
-    ) -> tuple | SequenceClassifierOutputWithProtoTypeActivations:
-        backbone_outputs = self.model(input_values, output_hidden_states, return_dict)
         last_hidden_state = backbone_outputs[0]
@@ -936,14 +926,6 @@ class AudioProtoNetForSequenceClassification(AudioProtoNetPreTrainedModel):
         if output_prototypical_activations is not None:
             prototype_activations = info[4]
-        if return_dict:
-            output = (logits,)
-            output += (loss, ) if loss is not None else ()
-            output += (last_hidden_state, )
-            output += (hidden_states, ) if hidden_states is not None else ()
-            output += (prototype_activations,) if prototype_activations is not None else ()
-            return output
         return SequenceClassifierOutputWithProtoTypeActivations(
             logits=logits,
             loss=loss,

             nn.init.trunc_normal_(module.weight, std=0.02)
             if module.bias is not None:
                 nn.init.zeros_(module.bias)
+        if isinstance(module, LinearLayerWithoutNegativeConnections) and self.incorrect_class_connection is None:
             # Initialize all weights to the correct_class_connection value
             self.last_layer.weight.data.fill_(self.correct_class_connection)
     def forward(
             self,
             input_values: torch.Tensor,
+            output_hidden_states: bool = None
+    ) -> BaseModelOutputWithPoolingAndNoAttention:
         """
         Args:
             input_values:
             output_hidden_states:
         Returns:
             last_hidden_state: torch.FloatTensor = None
             hidden_states: Optional[Tuple[torch.FloatTensor, ...]] = None
         """
+        return self.backbone(input_values, output_hidden_states)
 class AudioProtoNetForSequenceClassification(AudioProtoNetPreTrainedModel):
         self.model = AudioProtoNetModel(config)
         self.head = AudioProtoNetClassificationHead(config)
     def forward(
             self,
             input_values: torch.Tensor,
             prototypes_of_wrong_class: torch.Tensor = None,
             output_hidden_states: bool = None,
             output_prototypical_activations: bool = None,
+    ) -> SequenceClassifierOutputWithProtoTypeActivations:
+        backbone_outputs = self.model(input_values, output_hidden_states)
         last_hidden_state = backbone_outputs[0]
         if output_prototypical_activations is not None:
             prototype_activations = info[4]
         return SequenceClassifierOutputWithProtoTypeActivations(
             logits=logits,
             loss=loss,