aekupor
/

talk-move-router

Model card Files Files and versions

xet

Community

Ashlee Kupor commited on Apr 20, 2023

Commit

a6cedd3

1 Parent(s): c5c8993

Add revoicing

Browse files

Files changed (1) hide show

handler.py +26 -4

handler.py CHANGED Viewed

@@ -66,6 +66,22 @@ class EndpointHandler():
         else:
             return [prior_text, utterance.text], 'single'
     def adding_on_utterance_to_str(self, utterance: Utterance) -> str:
         #adding_on uses prior text
@@ -230,7 +246,9 @@ class EndpointHandler():
                 utterance_str, is_list = self.probing_utterance_to_str(utterance)
             elif model_id == 'adding_on':
                 utterance_str, is_list = self.adding_on_utterance_to_str(utterance)
             if is_list == 'list':
                 utterances_list.extend(utterance_str)
                 for j in range(len(utterance_str)):
@@ -257,11 +275,14 @@ class EndpointHandler():
             self.model = ClassificationModel(
                 "roberta", "aekupor/probing", use_cuda=cuda_available
             )
-        elif model_id == 'adding_on':
-            # TODO: combine adding on and others
             self.model = ClassificationModel(
                 "roberta", "aekupor/adding_on", use_cuda=cuda_available
             )
         predictions, _ = self.model.predict(utterances_list)
         return utterances_list, utterances_indexes, predictions
@@ -296,7 +317,8 @@ class EndpointHandler():
             utterance_talk_moves = self.add_preds_to_list(utterance_talk_moves, predictions, utterances_indexes, full_transcript)
             utterances_list, utterances_indexes, predictions = self.do_prediction(full_transcript, 'adding_on')
             utterance_talk_moves = self.add_preds_to_list(utterance_talk_moves, predictions, utterances_indexes, full_transcript)
-            #TODO: add in revoicing
         else:
             raise ValueError("no valid talk move provided")

         else:
             return [prior_text, utterance.text], 'single'
+    def revoicing_utterance_to_str(self, utterance: Utterance) -> str:
+        # revoicing uses prior text and truncates end of the prior text
+        doc = nlp(utterance.text)
+        prior_text = self.truncate_end(self.get_prior_text(utterance))
+        if len(doc) > token_limit:
+            utterance_text_list = self.handle_long_utterances(doc)
+            utterance_with_prior_text = []
+            for text in utterance_text_list:
+                utterance_with_prior_text.append([prior_text, text])
+            return utterance_with_prior_text, 'list'
+        else:
+            return [prior_text, utterance.text], 'single'
     def adding_on_utterance_to_str(self, utterance: Utterance) -> str:
         #adding_on uses prior text
                 utterance_str, is_list = self.probing_utterance_to_str(utterance)
             elif model_id == 'adding_on':
                 utterance_str, is_list = self.adding_on_utterance_to_str(utterance)
+            elif model_id == 'revoicing':
+                utterance_str, is_list = self.revoicing_utterance_to_str(utterance)
             if is_list == 'list':
                 utterances_list.extend(utterance_str)
                 for j in range(len(utterance_str)):
             self.model = ClassificationModel(
                 "roberta", "aekupor/probing", use_cuda=cuda_available
             )
+        elif model_id == 'adding_on':
             self.model = ClassificationModel(
                 "roberta", "aekupor/adding_on", use_cuda=cuda_available
             )
+        elif model_id == 'revoicing':
+            self.model = ClassificationModel(
+                "roberta", "aekupor/revoicing", use_cuda=cuda_available
+            )
         predictions, _ = self.model.predict(utterances_list)
         return utterances_list, utterances_indexes, predictions
             utterance_talk_moves = self.add_preds_to_list(utterance_talk_moves, predictions, utterances_indexes, full_transcript)
             utterances_list, utterances_indexes, predictions = self.do_prediction(full_transcript, 'adding_on')
             utterance_talk_moves = self.add_preds_to_list(utterance_talk_moves, predictions, utterances_indexes, full_transcript)
+            utterances_list, utterances_indexes, predictions = self.do_prediction(full_transcript, 'revoicing')
+            utterance_talk_moves = self.add_preds_to_list(utterance_talk_moves, predictions, utterances_indexes, full_transcript)
         else:
             raise ValueError("no valid talk move provided")