Spaces:

beAnalytic
/

Training

Paused

App Files Files Community

Training / README.md

amarorn

fix: restaurar arquivos essenciais do Space (README, Dockerfile, app.py, requirements.txt)

a6fbb35 28 days ago

preview code

raw

history blame contribute delete

2.53 kB

metadata

title: EDA Model Training
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: docker
sdk_version: latest
app_file: app.py
pinned: false

Treinamento do Modelo EDA

Este Space contém o script de treinamento para o modelo de Análise Exploratória de Dados (EDA).

Configuração

Variáveis de Ambiente Obrigatórias

⚠️ IMPORTANTE: Configure a variável de ambiente HF_TOKEN no Settings do Space para habilitar o push automático dos checkpoints para o Hub.

Variáveis de Ambiente

Configure as seguintes variáveis de ambiente no Settings do Space:

HF_TOKEN (OBRIGATÓRIO): Seu token do HuggingFace com permissões de escrita
- Gere em: https://huggingface.co/settings/tokens
- Permissões necessárias: write
- Sem este token, o treinamento funcionará mas os checkpoints não serão enviados ao Hub
MODEL_NAME: Modelo base (padrão: microsoft/Phi-3-mini-4k-instruct)
DATASET_REPO: ID do dataset (padrão: beAnalytic/eda-training-dataset)
OUTPUT_REPO: ID do modelo de saída (padrão: beAnalytic/eda-llm-model)

Como Configurar HF_TOKEN no Space

Acesse: https://huggingface.co/spaces/beAnalytic/Training/settings
Vá para a seção "Repository secrets"
Clique em "New secret"
Nome: HF_TOKEN
Valor: Cole seu token do HuggingFace
Clique em "Add secret"

Nota: O token será usado automaticamente pelo script durante o treinamento.

Execução

O script train.py será executado automaticamente quando o Space for iniciado.

Estrutura

train.py: Script principal de treinamento
training_config.json: Configurações de treinamento
requirements.txt: Dependências Python

Monitoramento

Acompanhe o progresso do treinamento através dos logs do Space na aba "Logs".

TensorBoard

O TensorBoard está configurado e rodando na porta 6006 dentro do container. No HuggingFace Space com Docker SDK, apenas a porta 7860 é exposta publicamente, então o TensorBoard não é acessível diretamente via URL.

Para visualizar métricas:

Durante o treinamento: Acompanhe os logs na aba "Logs"
Após o treinamento: Baixe os logs de ./results/ e execute tensorboard --logdir=./results localmente
Acesse: http://localhost:6006 (após baixar os logs)

Para mais detalhes, consulte ACESSAR_TENSORBOARD.md.

Resultados

O modelo treinado será salvo automaticamente no HuggingFace Hub no repositório especificado em OUTPUT_REPO.