Spaces:
Runtime error
Runtime error
| title: EDA Model Training | |
| emoji: 🤖 | |
| colorFrom: blue | |
| colorTo: purple | |
| sdk: docker | |
| sdk_version: "latest" | |
| app_file: app.py | |
| pinned: false | |
| # Treinamento do Modelo EDA | |
| Este Space contém o script de treinamento para o modelo de Análise Exploratória de Dados (EDA). | |
| ## Configuração | |
| ### Variáveis de Ambiente Obrigatórias | |
| **⚠️ IMPORTANTE**: Configure a variável de ambiente `HF_TOKEN` no Settings do Space para habilitar o push automático dos checkpoints para o Hub. | |
| ### Variáveis de Ambiente | |
| Configure as seguintes variáveis de ambiente no Settings do Space: | |
| - **`HF_TOKEN`** (OBRIGATÓRIO): Seu token do HuggingFace com permissões de escrita | |
| - Gere em: https://huggingface.co/settings/tokens | |
| - Permissões necessárias: `write` | |
| - Sem este token, o treinamento funcionará mas os checkpoints não serão enviados ao Hub | |
| - `MODEL_NAME`: Modelo base (padrão: `microsoft/Phi-3-mini-4k-instruct`) | |
| - `DATASET_REPO`: ID do dataset (padrão: `beAnalytic/eda-training-dataset`) | |
| - `OUTPUT_REPO`: ID do modelo de saída (padrão: `beAnalytic/eda-llm-model`) | |
| ### Como Configurar HF_TOKEN no Space | |
| 1. Acesse: https://huggingface.co/spaces/beAnalytic/Training/settings | |
| 2. Vá para a seção **"Repository secrets"** | |
| 3. Clique em **"New secret"** | |
| 4. Nome: `HF_TOKEN` | |
| 5. Valor: Cole seu token do HuggingFace | |
| 6. Clique em **"Add secret"** | |
| **Nota**: O token será usado automaticamente pelo script durante o treinamento. | |
| ### Execução | |
| O script `train.py` será executado automaticamente quando o Space for iniciado. | |
| ## Estrutura | |
| - `train.py`: Script principal de treinamento | |
| - `training_config.json`: Configurações de treinamento | |
| - `requirements.txt`: Dependências Python | |
| ## Monitoramento | |
| Acompanhe o progresso do treinamento através dos logs do Space na aba "Logs". | |
| ### TensorBoard | |
| O TensorBoard está configurado e rodando na porta 6006 dentro do container. No HuggingFace Space com Docker SDK, apenas a porta 7860 é exposta publicamente, então o TensorBoard não é acessível diretamente via URL. | |
| **Para visualizar métricas**: | |
| - Durante o treinamento: Acompanhe os logs na aba "Logs" | |
| - Após o treinamento: Baixe os logs de `./results/` e execute `tensorboard --logdir=./results` localmente | |
| - Acesse: http://localhost:6006 (após baixar os logs) | |
| Para mais detalhes, consulte [ACESSAR_TENSORBOARD.md](../huggingface_training_config/docs/ACESSAR_TENSORBOARD.md). | |
| ## Resultados | |
| O modelo treinado será salvo automaticamente no HuggingFace Hub no repositório especificado em `OUTPUT_REPO`. | |