lbourdois/fineweb-2-trimming
Preview • Updated • 1.97M • 1.52k • 1
Version de google/mt5-base avec vocabulaire réduit pour Kannada.
| Original | Trimmed | |
|---|---|---|
| Vocabulaire | 250,100 | 32,768 |
| Paramètres | 582,401,280 | 248,560,896 |
from transformers import T5Tokenizer, AutoModelForSeq2SeqLM
tokenizer = T5Tokenizer.from_pretrained("lbourdois/mt5-base-kan-32768")
model = AutoModelForSeq2SeqLM.from_pretrained("lbourdois/mt5-base-kan-32768")
Base model
google/mt5-base