NeTSlab
/

gpt2-10M-parfind-eng

Model card Files Files and versions

achille-fusco commited on Aug 16, 2025

Commit

dac8022

·

verified ·

1 Parent(s): bf3d960

Update tokenizer.py

Files changed (1) hide show

tokenizer.py +7 -8

tokenizer.py CHANGED Viewed

@@ -223,14 +223,7 @@ def remap_offsets_to_raw(offsets: List[Tuple[int,int]], pre2raw: List[Optional[i
         mapped.append((rs if rs is not None else 0, re_ if re_ is not None else 0))
     return mapped
-# ----------------------------
-# Public wrapper
-# ----------------------------
-class ParadigmTokenizerWrapper(PreTrainedTokenizerFast):
-    slow_tokenizer_class = None
-    # add near the top of ParadigmTokenizerWrapper
-    def _coerce_to_str(x):
         # common cases first
         if isinstance(x, str):
             return x
@@ -259,6 +252,12 @@ class ParadigmTokenizerWrapper(PreTrainedTokenizerFast):
             return str(x)
         # final fallback
         return str(x)
     def __init__(self, *args, **kwargs):
         # ensure fast tokenizer is loaded directly (no slow->fast conversion)

         mapped.append((rs if rs is not None else 0, re_ if re_ is not None else 0))
     return mapped
+def _coerce_to_str(x):
         # common cases first
         if isinstance(x, str):
             return x
             return str(x)
         # final fallback
         return str(x)
+# ----------------------------
+# Public wrapper
+# ----------------------------
+class ParadigmTokenizerWrapper(PreTrainedTokenizerFast):
+    slow_tokenizer_class = None
     def __init__(self, *args, **kwargs):
         # ensure fast tokenizer is loaded directly (no slow->fast conversion)