aekupor
/

talk-move-router

Model card Files Files and versions

xet

Community

Ashlee Kupor commited on Apr 20, 2023

Commit

a3559d1

1 Parent(s): f9c7670

Decomp to get utterances list

Browse files

Files changed (1) hide show

handler.py +18 -15

handler.py CHANGED Viewed

@@ -215,22 +215,10 @@ class EndpointHandler():
                               {'speaker': utterance.speaker, 'data': utterance.text, 'time': utterance.starttime}]}])
         return formatted
-    def __call__(self, data: str) -> List[Dict[str, Any]]:
-        ''' data_file is a str pointing to filename of type .vtt '''
-        # deserialize incoming request
-        data_file = data.pop("data_file", None)
-        model_id = data.pop("model_id", None)
-        if data_file is None:
-            raise ValueError("no data file provided")
-        full_transcript = self.process_vtt_transcript(data_file)
-        utterances_list = []
-        utterances_indexes = [] # entry corresponds to utterance in full_transcript
         for i in range(len(full_transcript)):
             utterance = full_transcript[i]
-            #TODO: filter out to only have SL utterances
             if model_id == 'eliciting':
                 utterance_str, is_list = self.eliciting_utterance_to_str(utterance)
             elif model_id == 'connecting':
@@ -241,7 +229,7 @@ class EndpointHandler():
                 utterance_str, is_list = self.adding_on_utterance_to_str(utterance)
             else:
                 raise ValueError("model id not found")
             if is_list == 'list':
                 utterances_list.extend(utterance_str)
                 for j in range(len(utterance_str)):
@@ -249,7 +237,22 @@ class EndpointHandler():
             else:
                 utterances_list.append(utterance_str)
                 utterances_indexes.append(i)
         talk_move = ""
         cuda_available = torch.cuda.is_available()
         if model_id == 'eliciting':

                               {'speaker': utterance.speaker, 'data': utterance.text, 'time': utterance.starttime}]}])
         return formatted
+    def get_utterances_list(self, full_transcript, utterances_list, utterances_indexes, model_id):
         for i in range(len(full_transcript)):
             utterance = full_transcript[i]
+            #TODO: filter out to only have SL utterances
             if model_id == 'eliciting':
                 utterance_str, is_list = self.eliciting_utterance_to_str(utterance)
             elif model_id == 'connecting':
                 utterance_str, is_list = self.adding_on_utterance_to_str(utterance)
             else:
                 raise ValueError("model id not found")
             if is_list == 'list':
                 utterances_list.extend(utterance_str)
                 for j in range(len(utterance_str)):
             else:
                 utterances_list.append(utterance_str)
                 utterances_indexes.append(i)
+        return utterances_list, utterances_indexes
+    def __call__(self, data: str) -> List[Dict[str, Any]]:
+        ''' data_file is a str pointing to filename of type .vtt '''
+        # deserialize incoming request
+        data_file = data.pop("data_file", None)
+        model_id = data.pop("model_id", None)
+        if data_file is None:
+            raise ValueError("no data file provided")
+        full_transcript = self.process_vtt_transcript(data_file)
+        # utterances_indexes entry corresponds to utterance in full_transcript
+        utterances_list, utterances_indexes = self.get_utterances_list(full_transcript, [], [], model_id)
         talk_move = ""
         cuda_available = torch.cuda.is_available()
         if model_id == 'eliciting':