AndreasXi
/

FineLAP

@@ -121,11 +121,12 @@ class FineLAPModel(PreTrainedModel):
         global_text = self.get_global_text_embeds(text_labels, device)
         logits = torch.matmul(global_text, global_audio.transpose(-1, -2))
-        if hasattr(self, "temp_global"):
-            logits = logits / self.temp_global
-        if hasattr(self, "b_global"):
-            logits = logits + self.b_global
-        return torch.sigmoid(logits).squeeze(-1)
     @torch.no_grad()
     def plot_frame_level_score(self, audio_path, text_labels, output_path="similarity_plot.png", device=None):

         global_text = self.get_global_text_embeds(text_labels, device)
         logits = torch.matmul(global_text, global_audio.transpose(-1, -2))
+        return logits
+        # if hasattr(self, "temp_global"):
+        #     logits = logits / self.temp_global
+        # if hasattr(self, "b_global"):
+        #     logits = logits + self.b_global
+        # return torch.sigmoid(logits).squeeze(-1)
     @torch.no_grad()
     def plot_frame_level_score(self, audio_path, text_labels, output_path="similarity_plot.png", device=None):