kisejin
/

TopicModelingRepo

kisejin commited on Apr 5, 2024

Commit

0e76626

verified ·

1 Parent(s): e4ff17f

Update BERTopic/bertopic/_bertopic.py

Files changed (1) hide show

BERTopic/bertopic/_bertopic.py CHANGED Viewed

@@ -535,7 +535,10 @@ class BERTopic:
             logger.info("Clustering - Approximating new points with `hdbscan_model`")
             if is_supported_hdbscan(self.hdbscan_model):
                 predictions, probabilities = hdbscan_delegator(self.hdbscan_model, "approximate_predict", umap_embeddings)
                 # Calculate probabilities
                 if self.calculate_probabilities:
                     logger.info("Probabilities - Start calculation of probabilities with HDBSCAN")
@@ -548,9 +551,16 @@ class BERTopic:
             # Map probabilities and predictions
             probabilities = self._map_probabilities(probabilities, original_topics=True)
             predictions = self._map_predictions(predictions)
         return predictions, probabilities
     def partial_fit(self,
                     documents: List[str],
                     embeddings: np.ndarray = None,

             logger.info("Clustering - Approximating new points with `hdbscan_model`")
             if is_supported_hdbscan(self.hdbscan_model):
                 predictions, probabilities = hdbscan_delegator(self.hdbscan_model, "approximate_predict", umap_embeddings)
+                # Show all proba of topic in one sentence
+                self.probabilities_transform = hdbscan_delegator(self.hdbscan_model, "membership_vector", umap_embeddings)
                 # Calculate probabilities
                 if self.calculate_probabilities:
                     logger.info("Probabilities - Start calculation of probabilities with HDBSCAN")
             # Map probabilities and predictions
             probabilities = self._map_probabilities(probabilities, original_topics=True)
+            self.probabilities_transform = self._map_probabilities(self.probabilities_transform, original_topics=True)
             predictions = self._map_predictions(predictions)
+        self.predictions_transform = predictions
         return predictions, probabilities
+    def get_result_transform(self):
+        return self.predictions_transform, self.probabilities_transform
     def partial_fit(self,
                     documents: List[str],
                     embeddings: np.ndarray = None,