| --- |
| title: Be Analytic EDA Training |
| colorFrom: gray |
| colorTo: blue |
| sdk: docker |
| pinned: false |
| app_file: app.py |
| app_port: 7860 |
| short_description: LoRA SFT Qwen2.5 para EDA; dataset e adapter no Hub. |
| suggested_hardware: t4-medium |
| startup_duration_timeout: 2h |
| models: |
| - Qwen/Qwen2.5-1.5B-Instruct |
| datasets: |
| - beAnalytic/eda-training-dataset |
| tags: |
| - llm |
| - lora |
| - training |
| - eda |
| --- |
| |
| # Treino LoRA (EDA) |
|
|
| Space Docker para treino supervisionado (SFT) com adaptadores LoRA sobre `Qwen/Qwen2.5-1.5B-Instruct`, com dataset e modelo de saída no Hugging Face Hub. |
|
|
| ## Secrets (Settings do Space) |
|
|
| Defina no painel do Space: `HF_TOKEN`, `DATASET_REPO`, `OUTPUT_REPO`, `MODEL_NAME` (opcional; o Dockerfile define padrões). |
|
|
| ### Weights & Biases (opcional) |
|
|
| No mesmo sitio (Settings > Repository secrets), adiciona: |
|
|
| - `WANDB_API_KEY` — token em [wandb.ai/authorize](https://wandb.ai/authorize). Com isto, o `train.py` envia metricas para o wandb alem do TensorBoard. |
| - Opcional: `WANDB_PROJECT` (predefinido no codigo: `bequick`), `WANDB_ENTITY` (predefinido: `amaro-neto-amaro`). |
| - Para desativar mesmo com chave definida: `WANDB_DISABLED=1`. |
| - Sem API key e sem `WANDB_MODE=offline`, o treino continua so com TensorBoard. |
|
|
| Em **Training Jobs** (ou qualquer job que corra o mesmo `train.py`), define as mesmas variaveis de ambiente no painel do job ou no YAML de configuracao. |
|
|
| ## Código no monorepo |
|
|
| Referência: `ml/configs/huggingface_training_config/`. |
|
|
| ## Deploy no Hub |
|
|
| O `README.md` desta pasta (no monorepo) já inclui o mesmo YAML e o texto do Space; ao fazer push do subtree para o repositório do Space, o Hub deixa de mostrar *empty or missing yaml metadata*. Para alinhar só o cartão, podes copiar este ficheiro sobre `README.md` no clone do Space. Referência: [Spaces configuration](https://huggingface.co/docs/hub/spaces-config-reference). |
|
|
| Não uses o modelo com placeholders `{{title}}`, `{{sdk}}`, etc.: o YAML tem de ter valores literais. |
|
|