Spaces:
Paused
title: EDA Model Training
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: docker
sdk_version: latest
app_file: app.py
pinned: false
Treinamento do Modelo EDA
Este Space contém o script de treinamento para o modelo de Análise Exploratória de Dados (EDA).
Configuração
Variáveis de Ambiente Obrigatórias
⚠️ IMPORTANTE: Configure a variável de ambiente HF_TOKEN no Settings do Space para habilitar o push automático dos checkpoints para o Hub.
Variáveis de Ambiente
Configure as seguintes variáveis de ambiente no Settings do Space:
HF_TOKEN(OBRIGATÓRIO): Seu token do HuggingFace com permissões de escrita- Gere em: https://huggingface.co/settings/tokens
- Permissões necessárias:
write - Sem este token, o treinamento funcionará mas os checkpoints não serão enviados ao Hub
MODEL_NAME: Modelo base (padrão:microsoft/Phi-3-mini-4k-instruct)DATASET_REPO: ID do dataset (padrão:beAnalytic/eda-training-dataset)OUTPUT_REPO: ID do modelo de saída (padrão:beAnalytic/eda-llm-model)
Como Configurar HF_TOKEN no Space
- Acesse: https://huggingface.co/spaces/beAnalytic/Training/settings
- Vá para a seção "Repository secrets"
- Clique em "New secret"
- Nome:
HF_TOKEN - Valor: Cole seu token do HuggingFace
- Clique em "Add secret"
Nota: O token será usado automaticamente pelo script durante o treinamento.
Execução
O script train.py será executado automaticamente quando o Space for iniciado.
Estrutura
train.py: Script principal de treinamentotraining_config.json: Configurações de treinamentorequirements.txt: Dependências Python
Monitoramento
Acompanhe o progresso do treinamento através dos logs do Space na aba "Logs".
TensorBoard
O TensorBoard está configurado e rodando na porta 6006 dentro do container. No HuggingFace Space com Docker SDK, apenas a porta 7860 é exposta publicamente, então o TensorBoard não é acessível diretamente via URL.
Para visualizar métricas:
- Durante o treinamento: Acompanhe os logs na aba "Logs"
- Após o treinamento: Baixe os logs de
./results/e executetensorboard --logdir=./resultslocalmente - Acesse: http://localhost:6006 (após baixar os logs)
Para mais detalhes, consulte ACESSAR_TENSORBOARD.md.
Resultados
O modelo treinado será salvo automaticamente no HuggingFace Hub no repositório especificado em OUTPUT_REPO.