damfle
/

multistral-tokenizer

Token Classification

Model card Files Files and versions

damfle commited on 26 days ago

Commit

b54dd21

·

verified ·

1 Parent(s): f65e646

doc: update README

Files changed (1) hide show

README.md +14 -1

README.md CHANGED Viewed

@@ -1,3 +1,16 @@
 # Multistral Tokenizer
 Training completed successfully!
@@ -29,4 +42,4 @@ from multistral.multistraltokenizer import MultistralTokenizer
 tokenizer = MultistralTokenizer.from_pretrained("models/aizia_tokenizer")
 tokens = tokenizer.encode("Your text here")
 text = tokenizer.decode(tokens)
-```

+---
+license: isc
+datasets:
+- HuggingFaceFW/fineweb
+- HuggingFaceFW/fineweb-2
+language:
+- fr
+- en
+- zh
+pipeline_tag: token-classification
+tags:
+- code
+---
 # Multistral Tokenizer
 Training completed successfully!
 tokenizer = MultistralTokenizer.from_pretrained("models/aizia_tokenizer")
 tokens = tokenizer.encode("Your text here")
 text = tokenizer.decode(tokens)
+```