Remove faulty tokenizers

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.DS_Store +0 -0
fw57M_Entropy_threshold_128000/special_tokens_map.json +0 -6
fw57M_Entropy_threshold_128000/stats.csv +0 -3
fw57M_Entropy_threshold_128000/tokenizer.json +0 -0
fw57M_Entropy_threshold_128000/tokenizer_config.json +0 -37
fw57M_Entropy_threshold_128000/vocab.json +0 -0
fw57M_Entropy_threshold_16000/special_tokens_map.json +0 -6
fw57M_Entropy_threshold_16000/stats.csv +0 -0
fw57M_Entropy_threshold_16000/tokenizer.json +0 -0
fw57M_Entropy_threshold_16000/tokenizer_config.json +0 -37
fw57M_Entropy_threshold_16000/vocab.json +0 -0
fw57M_Entropy_threshold_32000/special_tokens_map.json +0 -6
fw57M_Entropy_threshold_32000/stats.csv +0 -0
fw57M_Entropy_threshold_32000/tokenizer.json +0 -0
fw57M_Entropy_threshold_32000/tokenizer_config.json +0 -37
fw57M_Entropy_threshold_32000/vocab.json +0 -0
fw57M_Entropy_threshold_64000/special_tokens_map.json +0 -6
fw57M_Entropy_threshold_64000/stats.csv +0 -0
fw57M_Entropy_threshold_64000/tokenizer.json +0 -0
fw57M_Entropy_threshold_64000/tokenizer_config.json +0 -37
fw57M_Entropy_threshold_64000/vocab.json +0 -0
fw57M_Entropy_threshold_8064/special_tokens_map.json +0 -6
fw57M_Entropy_threshold_8064/stats.csv +0 -0
fw57M_Entropy_threshold_8064/tokenizer.json +0 -0
fw57M_Entropy_threshold_8064/tokenizer_config.json +0 -37
fw57M_Entropy_threshold_8064/vocab.json +0 -0
fw57M_Surprisal_thresholdB_64000/special_tokens_map.json +0 -6
fw57M_Surprisal_thresholdB_64000/stats.csv +0 -0
fw57M_Surprisal_thresholdB_64000/tokenizer.json +0 -0
fw57M_Surprisal_thresholdB_64000/tokenizer_config.json +0 -37
fw57M_Surprisal_thresholdB_64000/vocab.json +0 -0
fw57M_Surprisal_threshold_16000/special_tokens_map.json +0 -6
fw57M_Surprisal_threshold_16000/stats.csv +0 -0
fw57M_Surprisal_threshold_16000/tokenizer.json +0 -0
fw57M_Surprisal_threshold_16000/tokenizer_config.json +0 -37
fw57M_Surprisal_threshold_16000/vocab.json +0 -0
fw57M_Surprisal_threshold_32000/special_tokens_map.json +0 -6
fw57M_Surprisal_threshold_32000/stats.csv +0 -0
fw57M_Surprisal_threshold_32000/tokenizer.json +0 -0
fw57M_Surprisal_threshold_32000/tokenizer_config.json +0 -37
fw57M_Surprisal_threshold_32000/vocab.json +0 -0
fw57M_Surprisal_threshold_64000/special_tokens_map.json +0 -6
fw57M_Surprisal_threshold_64000/stats.csv +0 -0
fw57M_Surprisal_threshold_64000/tokenizer.json +0 -0
fw57M_Surprisal_threshold_64000/tokenizer_config.json +0 -37
fw57M_Surprisal_threshold_64000/vocab.json +0 -0
fw57M_Surprisal_threshold_8064/special_tokens_map.json +0 -6
fw57M_Surprisal_threshold_8064/stats.csv +0 -0
fw57M_Surprisal_threshold_8064/tokenizer.json +0 -0
fw57M_Surprisal_threshold_8064/tokenizer_config.json +0 -37

.DS_Store ADDED Viewed

Binary file (12.3 kB). View file

fw57M_Entropy_threshold_128000/special_tokens_map.json DELETED Viewed

@@ -1,6 +0,0 @@
-{
-  "bos_token": "<|endoftext|>",
-  "eos_token": "<|endoftext|>",
-  "pad_token": "<|padding|>",
-  "unk_token": "<|unk|>"
-}

fw57M_Entropy_threshold_128000/stats.csv DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:909a8b46dab49cf0b1f25c10ace1ee321b566b41a9f8f5c03deac33e06433309
-size 11253040

fw57M_Entropy_threshold_128000/tokenizer.json DELETED Viewed