impresso-project
/

ner-stacked-bert-multilingual-light

@@ -266,7 +266,10 @@ def realign(
 ):
     preds_list, words_list, confidence_list = [], [], []
     # word_ids = tokenizer(tokens, is_split_into_words=True).word_ids()
     for idx, word in enumerate(tokens):
         beginning_index = word_ids.index(idx)
         try:

 ):
     preds_list, words_list, confidence_list = [], [], []
     # word_ids = tokenizer(tokens, is_split_into_words=True).word_ids()
+    print('--'*20)
+    print("word_ids", word_ids)
+    print("tokens", tokens)
+    print('--'*20)
     for idx, word in enumerate(tokens):
         beginning_index = word_ids.index(idx)
         try: