Allex21 commited on
Commit
67ee927
·
verified ·
1 Parent(s): 422f544

Delete 🎨_LoRA_Image_Trainer.md

Browse files
Files changed (1) hide show
  1. 🎨_LoRA_Image_Trainer.md +0 -296
🎨_LoRA_Image_Trainer.md DELETED
@@ -1,296 +0,0 @@
1
- ---
2
- title: LoRA Image Trainer
3
- emoji: 🎨
4
- colorFrom: '#667eea'
5
- colorTo: '#764ba2'
6
- sdk: gradio
7
- sdk_version: "4.x"
8
- app_file: app.py
9
- pinned: false
10
- ---
11
-
12
- # 🎨 LoRA Image Trainer
13
-
14
- Uma ferramenta completa para criação e treinamento de LoRA (Low-Rank Adaptation) para modelos de geração de imagens, otimizada para baixo uso de GPU e compatível com dispositivos móveis.
15
-
16
- ## ✨ Características Principais
17
-
18
- - **🔋 Otimizado para Baixa GPU**: Utiliza técnicas avançadas de otimização de memória
19
- - **📱 Interface Responsiva**: Funciona perfeitamente em smartphones e tablets
20
- - **⚡ Treinamento Eficiente**: Baseado nas bibliotecas Diffusers e PEFT do Hugging Face
21
- - **🎛️ Altamente Configurável**: Controle total sobre parâmetros de treinamento
22
- - **☁️ Deploy Fácil**: Pronto para implantação no Hugging Face Spaces
23
- - **🎨 Focado em Imagens**: Especificamente projetado para modelos de difusão
24
-
25
- ## 🚀 Como Usar
26
-
27
- ### 1. Preparação das Imagens
28
- - Colete 3-50 imagens de alta qualidade
29
- - Mantenha consistência no estilo/conceito
30
- - Resolução recomendada: 512x512 ou superior
31
- - Formatos suportados: JPG, PNG
32
-
33
- ### 2. Configuração do Treinamento
34
- - Escolha um modelo base (recomendado: Stable Diffusion 1.5)
35
- - Defina uma trigger word única
36
- - Configure parâmetros LoRA (valores padrão funcionam bem)
37
- - Ajuste parâmetros de treinamento conforme necessário
38
-
39
- ### 3. Monitoramento
40
- - Acompanhe o progresso em tempo real
41
- - Visualize logs detalhados do treinamento
42
- - Receba notificações de conclusão
43
-
44
- ### 4. Download e Uso
45
- - Baixe o arquivo .safetensors do LoRA treinado
46
- - Use em ComfyUI, Automatic1111, SeaArt ou outras ferramentas
47
- - Aplique a trigger word nas suas gerações
48
-
49
- ## 🛠️ Tecnologias Utilizadas
50
-
51
- - **Hugging Face Diffusers**: Pipeline de modelos de difusão
52
- - **PEFT**: Treinamento eficiente de parâmetros
53
- - **PyTorch**: Framework de deep learning
54
- - **Gradio**: Interface web interativa
55
- - **Accelerate**: Otimizações de treinamento
56
-
57
- ## ⚙️ Parâmetros de Configuração
58
-
59
- ### Parâmetros LoRA
60
- - **r (Rank)**: 4-128 (padrão: 16) - Controla a capacidade do modelo
61
- - **LoRA Alpha**: 1-128 (padrão: 32) - Fator de escala
62
- - **LoRA Dropout**: 0.0-0.5 (padrão: 0.1) - Regularização
63
-
64
- ### Parâmetros de Treinamento
65
- - **Épocas**: 5-50 (padrão: 10) - Número de ciclos de treinamento
66
- - **Taxa de Aprendizado**: 1e-5 a 1e-3 (padrão: 1e-4)
67
- - **Batch Size**: 1-8 (padrão: 1) - Para GPUs com pouca VRAM
68
- - **Resolução**: 512/768/1024 (padrão: 512)
69
-
70
- ## 🎯 Otimizações para Baixa GPU
71
-
72
- ### Técnicas Implementadas
73
- - **Mixed Precision (FP16)**: Reduz uso de VRAM pela metade
74
- - **Gradient Checkpointing**: Troca tempo por memória
75
- - **Attention Slicing**: Processa attention em fatias menores
76
- - **Memory Efficient Attention**: Usa xformers quando disponível
77
- - **Gradient Accumulation**: Simula batches maiores
78
-
79
- ### Requisitos Mínimos
80
- - **GPU**: 4GB VRAM (recomendado: 6GB+)
81
- - **RAM**: 8GB (recomendado: 16GB+)
82
- - **Armazenamento**: 10GB livres
83
-
84
- ## 📱 Compatibilidade Móvel
85
-
86
- ### Interface Responsiva
87
- - Layout adaptativo para telas pequenas
88
- - Botões otimizados para toque
89
- - Navegação simplificada em tablets/smartphones
90
- - Upload de imagens via câmera ou galeria
91
-
92
- ### Processamento no Servidor
93
- - Todo treinamento ocorre no backend
94
- - Dispositivo móvel atua como cliente leve
95
- - Comunicação otimizada via APIs
96
-
97
- ## 🔧 Instalação e Deploy
98
-
99
- ### Deploy no Hugging Face Spaces
100
-
101
- 1. **Criar um novo Space**:
102
- ```
103
- - Acesse: https://huggingface.co/spaces
104
- - Clique em "Create new Space"
105
- - Escolha um nome único
106
- - Selecione SDK: Gradio
107
- - Escolha hardware (CPU Basic ou GPU)
108
- ```
109
-
110
- 2. **Upload dos arquivos**:
111
- ```
112
- - app.py (arquivo principal)
113
- - requirements.txt (dependências)
114
- - README.md (documentação)
115
- ```
116
-
117
- 3. **Configuração automática**:
118
- - O Hugging Face detecta automaticamente o Gradio
119
- - Instala dependências do requirements.txt
120
- - Inicia a aplicação
121
-
122
- ### Deploy Local
123
-
124
- 1. **Instalar dependências**:
125
- ```bash
126
- pip install -r requirements.txt
127
- ```
128
-
129
- 2. **Executar aplicação**:
130
- ```bash
131
- python app.py
132
- ```
133
-
134
- 3. **Acessar interface**:
135
- ```
136
- http://localhost:7860
137
- ```
138
-
139
- ### Deploy via Git (Método Avançado)
140
-
141
- 1. **Clonar repositório do Space**:
142
- ```bash
143
- git clone https://huggingface.co/spaces/SEU_USERNAME/SEU_SPACE_NAME
144
- cd SEU_SPACE_NAME
145
- ```
146
-
147
- 2. **Copiar arquivos**:
148
- ```bash
149
- cp app.py .
150
- cp requirements.txt .
151
- cp README.md .
152
- ```
153
-
154
- 3. **Commit e push**:
155
- ```bash
156
- git add .
157
- git commit -m "Add LoRA Image Trainer"
158
- git push
159
- ```
160
-
161
- ## 💡 Dicas para Melhores Resultados
162
-
163
- ### Preparação de Dados
164
- - **Qualidade > Quantidade**: 10-20 imagens boas > 50 ruins
165
- - **Consistência**: Mantenha estilo/conceito uniforme
166
- - **Diversidade**: Varie poses, ângulos e iluminação
167
- - **Resolução**: Use imagens de alta qualidade
168
-
169
- ### Configuração de Parâmetros
170
- - **Iniciantes**: Use valores padrão
171
- - **Rank baixo (4-8)**: Para estilos simples
172
- - **Rank alto (32-64)**: Para conceitos complexos
173
- - **Mais épocas**: Para datasets pequenos
174
- - **Menos épocas**: Para datasets grandes
175
-
176
- ### Trigger Words
177
- - Use palavras únicas e memoráveis
178
- - Evite palavras comuns do inglês
179
- - Combine com o nome do conceito
180
- - Exemplos: "myStyle", "characterX", "artStyleY"
181
-
182
- ### Legendas (Captions)
183
- - Descreva o que vê na imagem
184
- - Inclua a trigger word
185
- - Seja específico mas conciso
186
- - Exemplo: "myStyle, portrait of a woman smiling"
187
-
188
- ## 🎮 Compatibilidade com Ferramentas
189
-
190
- ### ComfyUI
191
- 1. Baixe o arquivo .safetensors
192
- 2. Coloque em `ComfyUI/models/loras/`
193
- 3. Use o nó "Load LoRA" no workflow
194
- 4. Aplique a trigger word no prompt
195
-
196
- ### Automatic1111
197
- 1. Baixe o arquivo .safetensors
198
- 2. Coloque em `stable-diffusion-webui/models/Lora/`
199
- 3. Use `<lora:nome_do_arquivo:peso>` no prompt
200
- 4. Inclua a trigger word
201
-
202
- ### SeaArt
203
- 1. Faça upload do modelo LoRA
204
- 2. Selecione o LoRA na interface
205
- 3. Use a trigger word no prompt
206
- 4. Ajuste o peso conforme necessário
207
-
208
- ## 🐛 Solução de Problemas
209
-
210
- ### Erro de Memória GPU
211
- - Reduza batch_size para 1
212
- - Use resolução 512x512
213
- - Ative gradient checkpointing
214
- - Feche outras aplicações que usam GPU
215
-
216
- ### Treinamento Lento
217
- - Use GPU em vez de CPU
218
- - Reduza número de épocas
219
- - Use imagens menores
220
- - Ative mixed precision
221
-
222
- ### Resultados Ruins
223
- - Aumente número de épocas
224
- - Melhore qualidade das imagens
225
- - Ajuste trigger word
226
- - Revise legendas
227
-
228
- ### Erro de Upload
229
- - Verifique formato das imagens (JPG/PNG)
230
- - Reduza tamanho dos arquivos
231
- - Verifique conexão de internet
232
- - Tente fazer upload em lotes menores
233
-
234
- ## 📊 Monitoramento e Logs
235
-
236
- ### Status do Treinamento
237
- - **Queued**: Na fila para processamento
238
- - **Loading Model**: Carregando modelo base
239
- - **Preparing LoRA**: Configurando adaptadores
240
- - **Preparing Data**: Processando imagens
241
- - **Training**: Treinamento em progresso
242
- - **Saving**: Salvando modelo final
243
- - **Completed**: Treinamento concluído
244
- - **Error**: Erro durante o processo
245
-
246
- ### Métricas Importantes
247
- - **Loss**: Deve diminuir ao longo do tempo
248
- - **Progress**: Porcentagem de conclusão
249
- - **Step/Epoch**: Progresso atual
250
- - **Time Remaining**: Estimativa de conclusão
251
-
252
- ## 🔒 Segurança e Privacidade
253
-
254
- ### Dados do Usuário
255
- - Imagens são processadas temporariamente
256
- - Modelos são salvos localmente no Space
257
- - Nenhum dado é compartilhado externamente
258
- - Usuário controla download e exclusão
259
-
260
- ### Boas Práticas
261
- - Use imagens próprias ou com licença adequada
262
- - Não treine com conteúdo protegido por direitos autorais
263
- - Respeite termos de uso dos modelos base
264
- - Mantenha backups dos seus LoRAs
265
-
266
- ## 🤝 Contribuição
267
-
268
- ### Como Contribuir
269
- 1. Fork do repositório
270
- 2. Crie uma branch para sua feature
271
- 3. Implemente melhorias
272
- 4. Teste thoroughly
273
- 5. Submeta pull request
274
-
275
- ### Áreas de Melhoria
276
- - Suporte a mais modelos base
277
- - Otimizações adicionais de memória
278
- - Interface de usuário aprimorada
279
- - Funcionalidades de inferência
280
- - Integração com mais ferramentas
281
-
282
- ## 📄 Licença
283
-
284
- Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE para detalhes.
285
-
286
- ## 🙏 Agradecimentos
287
-
288
- - Hugging Face pela infraestrutura e bibliotecas
289
- - Comunidade Stable Diffusion pelas técnicas
290
- - Desenvolvedores do PEFT e Diffusers
291
- - Comunidade open source de IA
292
-
293
- ---
294
-
295
- **Desenvolvido com ❤️ para democratizar o acesso ao treinamento de LoRA para geração de imagens**
296
-