sanjeevnv
/

multimodal-pretraining

Model card Files Files and versions

multimodal-pretraining

17.9 MB

Ctrl+K

Ctrl+K

1 contributor

History: 8 commits

sanjeevnv's picture

Document pretraining tokenizer behavior

7a5473c verified about 1 month ago

.gitattributes

1.57 kB
Add Nemotron-Nano tokenizer with generation markers for SFT loss masking 4 months ago
README.md

2.49 kB
Document pretraining tokenizer behavior about 1 month ago
chat_template.jinja

482 Bytes
Append </s> in pretraining chat template file about 1 month ago
config.json

1.83 kB
Remove BOS from tokenizer about 1 month ago
configuration_nemotron_h.py

12.9 kB
Add Nemotron-Nano tokenizer with generation markers for SFT loss masking 4 months ago
generation_config.json

135 Bytes
Use </s> as pretraining EOD token about 1 month ago
model.safetensors.index.json

588 kB
Add Nemotron-Nano tokenizer with generation markers for SFT loss masking 4 months ago
modeling_nemotron_h.py

83.2 kB
Add Nemotron-Nano tokenizer with generation markers for SFT loss masking 4 months ago
special_tokens_map.json

278 Bytes
Use </s> as pretraining EOD token about 1 month ago
tokenizer.json

17.1 MB
xet

Remove BOS from tokenizer about 1 month ago
tokenizer_config.json

178 kB
Use </s> as pretraining EOD token about 1 month ago