File size: 1,965 Bytes
d4a00b2 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 | ---
title: Be Analytic EDA Training
colorFrom: gray
colorTo: blue
sdk: docker
pinned: false
app_file: app.py
app_port: 7860
short_description: LoRA SFT Qwen2.5 para EDA; dataset e adapter no Hub.
suggested_hardware: t4-medium
startup_duration_timeout: 2h
models:
- Qwen/Qwen2.5-1.5B-Instruct
datasets:
- beAnalytic/eda-training-dataset
tags:
- llm
- lora
- training
- eda
---
# Treino LoRA (EDA)
Space Docker para treino supervisionado (SFT) com adaptadores LoRA sobre `Qwen/Qwen2.5-1.5B-Instruct`, com dataset e modelo de saída no Hugging Face Hub.
## Secrets (Settings do Space)
Defina no painel do Space: `HF_TOKEN`, `DATASET_REPO`, `OUTPUT_REPO`, `MODEL_NAME` (opcional; o Dockerfile define padrões).
### Weights & Biases (opcional)
No mesmo sitio (Settings > Repository secrets), adiciona:
- `WANDB_API_KEY` — token em [wandb.ai/authorize](https://wandb.ai/authorize). Com isto, o `train.py` envia metricas para o wandb alem do TensorBoard.
- Opcional: `WANDB_PROJECT` (predefinido no codigo: `bequick`), `WANDB_ENTITY` (predefinido: `amaro-neto-amaro`).
- Para desativar mesmo com chave definida: `WANDB_DISABLED=1`.
- Sem API key e sem `WANDB_MODE=offline`, o treino continua so com TensorBoard.
Em **Training Jobs** (ou qualquer job que corra o mesmo `train.py`), define as mesmas variaveis de ambiente no painel do job ou no YAML de configuracao.
## Código no monorepo
Referência: `ml/configs/huggingface_training_config/`.
## Deploy no Hub
O `README.md` desta pasta (no monorepo) já inclui o mesmo YAML e o texto do Space; ao fazer push do subtree para o repositório do Space, o Hub deixa de mostrar *empty or missing yaml metadata*. Para alinhar só o cartão, podes copiar este ficheiro sobre `README.md` no clone do Space. Referência: [Spaces configuration](https://huggingface.co/docs/hub/spaces-config-reference).
Não uses o modelo com placeholders `{{title}}`, `{{sdk}}`, etc.: o YAML tem de ter valores literais.
|