tinygpt-ptbr-v1 / README.md
Madras1's picture
Update README.md
0dee0cb verified
metadata
language:
  - pt
library_name: transformers
pipeline_tag: text-generation
tags:
  - pt-br
  - portuguese
  - tinygpt
  - custom-code
datasets:
  - Madras1/corpus-ptbr-v1

TinyGPT PT-BR v1

Modelo causal pequeno treinado em JAX/Flax/Orbax e exportado para o Hugging Face com safetensors.

Arquitetura

  • hidden_size: 768
  • num_hidden_layers: 12
  • num_attention_heads: 8
  • intermediate_size: 2048
  • max_position_embeddings: 1024
  • vocab_size: 32000

Origem

Checkpoint convertido do treino JAX TPU do projeto local. Este repositório usa trust_remote_code=True.

Uso

from transformers import AutoTokenizer, AutoModelForCausalLM

repo_id = "Madras1/tinygpt-ptbr-v1"
tokenizer = AutoTokenizer.from_pretrained(repo_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(repo_id, trust_remote_code=True)