Remove spaces from decoded sequences in restore method

Files changed (1) hide show

adapter.py CHANGED Viewed

@@ -588,8 +588,10 @@ class HFAbRestore(AbRestore):
                 restored_input_ids = input_ids[0].clone()
                 restored_input_ids[masked_positions] = predicted_tokens
-                # Decode back to sequence using the original tokenizer
                 restored_seq = self.tokenizer.tokenizer.decode(restored_input_ids, skip_special_tokens=True)
                 restored_seqs.append(restored_seq)
         return np.array(restored_seqs) if len(restored_seqs) > 1 else restored_seqs[0]

                 restored_input_ids = input_ids[0].clone()
                 restored_input_ids[masked_positions] = predicted_tokens
+                # Decode back to sequence using the original tokenizer and remove spaces
                 restored_seq = self.tokenizer.tokenizer.decode(restored_input_ids, skip_special_tokens=True)
+                # Remove spaces that might be added during decoding
+                restored_seq = restored_seq.replace(' ', '')
                 restored_seqs.append(restored_seq)
         return np.array(restored_seqs) if len(restored_seqs) > 1 else restored_seqs[0]