HuggingFaceFW/fineweb
Viewer • Updated • 52.5B • 1.02M • 2.82k
MicroLM2-1M é um modelo de linguagem ultrapequeno (~1M parâmetros) treinado do zero com foco em inglês e português.
Treinado em aproximadamente 4.5 bilhões de tokens usando:
por_Latn)O resultado do MicroLM2-1M no BLiMP foi: 0.5422
from transformers import AutoTokenizer, LlamaForCausalLM
tokenizer = AutoTokenizer.from_pretrained(
"CromIA/MicroLM2-1M"
)
model = LlamaForCausalLM.from_pretrained(
"CromIA/MicroLM2-1M"
)
Projeto experimental voltado para: