|
|
--- |
|
|
language: |
|
|
- pt |
|
|
license: mit |
|
|
library_name: transformers |
|
|
pipeline_tag: fill-mask |
|
|
tags: |
|
|
- cestari-studio |
|
|
- helium |
|
|
- test-model |
|
|
- bert |
|
|
--- |
|
|
|
|
|
# Cestari Studio — Helium Tiny (Teste) |
|
|
|
|
|
Este repositório contém um **modelo mínimo e leve** (BERT *tiny*) com **pesos aleatórios** apenas para validar o fluxo de publicação e consumo de modelos no Hugging Face Hub. |
|
|
|
|
|
## O que isso é (e o que não é) |
|
|
- **É:** um artefato válido no formato `transformers` (config + tokenizer + pesos) para você testar upload, versionamento e carregamento. |
|
|
- **Não é:** um modelo treinado para produção. |
|
|
|
|
|
## Como usar (exemplo) |
|
|
```python |
|
|
from transformers import AutoTokenizer, AutoModelForMaskedLM, pipeline |
|
|
|
|
|
repo_id = "cestaristudio/he" # ajuste se necessário |
|
|
tok = AutoTokenizer.from_pretrained(repo_id) |
|
|
model = AutoModelForMaskedLM.from_pretrained(repo_id) |
|
|
|
|
|
pipe = pipeline("fill-mask", model=model, tokenizer=tok) |
|
|
print(pipe("Cestari Studio é [MASK].")) |
|
|
``` |
|
|
|
|
|
## Estrutura de arquivos |
|
|
- `config.json` — hiperparâmetros do modelo |
|
|
- `pytorch_model.bin` — pesos (aleatórios) em PyTorch |
|
|
- `vocab.txt` + `tokenizer_config.json` + `special_tokens_map.json` — tokenizer (WordPiece simples) |
|
|
|
|
|
## Próximos passos recomendados |
|
|
1. Substituir `pytorch_model.bin` por pesos reais (treinados ou fine-tuned). |
|
|
2. Atualizar o Model Card com: |
|
|
- objetivo do modelo, |
|
|
- dados (fontes e licenças), |
|
|
- métricas, |
|
|
- limitações e uso responsável. |
|
|
|