Training / README.md
amarorn's picture
fix: restaurar arquivos essenciais do Space (README, Dockerfile, app.py, requirements.txt)
a6fbb35
metadata
title: EDA Model Training
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: docker
sdk_version: latest
app_file: app.py
pinned: false

Treinamento do Modelo EDA

Este Space contém o script de treinamento para o modelo de Análise Exploratória de Dados (EDA).

Configuração

Variáveis de Ambiente Obrigatórias

⚠️ IMPORTANTE: Configure a variável de ambiente HF_TOKEN no Settings do Space para habilitar o push automático dos checkpoints para o Hub.

Variáveis de Ambiente

Configure as seguintes variáveis de ambiente no Settings do Space:

  • HF_TOKEN (OBRIGATÓRIO): Seu token do HuggingFace com permissões de escrita

  • MODEL_NAME: Modelo base (padrão: microsoft/Phi-3-mini-4k-instruct)

  • DATASET_REPO: ID do dataset (padrão: beAnalytic/eda-training-dataset)

  • OUTPUT_REPO: ID do modelo de saída (padrão: beAnalytic/eda-llm-model)

Como Configurar HF_TOKEN no Space

  1. Acesse: https://huggingface.co/spaces/beAnalytic/Training/settings
  2. Vá para a seção "Repository secrets"
  3. Clique em "New secret"
  4. Nome: HF_TOKEN
  5. Valor: Cole seu token do HuggingFace
  6. Clique em "Add secret"

Nota: O token será usado automaticamente pelo script durante o treinamento.

Execução

O script train.py será executado automaticamente quando o Space for iniciado.

Estrutura

  • train.py: Script principal de treinamento
  • training_config.json: Configurações de treinamento
  • requirements.txt: Dependências Python

Monitoramento

Acompanhe o progresso do treinamento através dos logs do Space na aba "Logs".

TensorBoard

O TensorBoard está configurado e rodando na porta 6006 dentro do container. No HuggingFace Space com Docker SDK, apenas a porta 7860 é exposta publicamente, então o TensorBoard não é acessível diretamente via URL.

Para visualizar métricas:

  • Durante o treinamento: Acompanhe os logs na aba "Logs"
  • Após o treinamento: Baixe os logs de ./results/ e execute tensorboard --logdir=./results localmente
  • Acesse: http://localhost:6006 (após baixar os logs)

Para mais detalhes, consulte ACESSAR_TENSORBOARD.md.

Resultados

O modelo treinado será salvo automaticamente no HuggingFace Hub no repositório especificado em OUTPUT_REPO.