Spaces:

Allex21
/

Treinar-L

Sleeping

App Files Files Community

Allex21 commited on Sep 17, 2025

Commit

3e57297

verified ·

1 Parent(s): a82fdb3

Update app.py

Browse files

Files changed (1) hide show

app.py +555 -128

app.py CHANGED Viewed

@@ -35,31 +35,33 @@ class LoRAImageTrainer:
         self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         self.training_jobs = {}
         self.models_cache = {}
-        # Criar diretórios
-        os.makedirs("./lora_models", exist_ok=True)
-        logger.info("Diretório ./lora_models criado.")
     def get_available_models(self) -> List[str]:
         return [
             "runwayml/stable-diffusion-v1-5",
             "stabilityai/stable-diffusion-2-1",
             "CompVis/stable-diffusion-v1-4"
         ]
     def load_base_model(self, model_name: str):
         try:
             if model_name in self.models_cache:
                 return self.models_cache[model_name]
             logger.info(f"Carregando modelo base: {model_name}")
             model_kwargs = {
                 "torch_dtype": torch.float16 if torch.cuda.is_available() else torch.float32,
                 "use_safetensors": True,
                 "variant": "fp16" if torch.cuda.is_available() else None,
-                "safety_checker": None,
             }
             pipeline = StableDiffusionPipeline.from_pretrained(
                 model_name,
                 **model_kwargs
@@ -67,14 +69,17 @@ class LoRAImageTrainer:
             if torch.cuda.is_available():
                 pipeline = pipeline.to(self.device)
                 pipeline.enable_attention_slicing()
                 try:
                     pipeline.enable_xformers_memory_efficient_attention()
-                except:
-                    logger.warning("xformers não disponível")
-                pipeline.unet.enable_gradient_checkpointing()
             self.models_cache[model_name] = pipeline
             return pipeline
         except Exception as e:
@@ -82,11 +87,15 @@ class LoRAImageTrainer:
             raise e
     def prepare_image_dataset(self, image_files: List[str], captions: List[str], resolution: int = 512) -> List[Dict]:
         dataset = []
         for img_path, caption in zip(image_files, captions):
             try:
                 image = Image.open(img_path).convert("RGB")
                 image = self.resize_image(image, resolution)
                 dataset.append({
@@ -102,8 +111,10 @@ class LoRAImageTrainer:
         return dataset
     def resize_image(self, image: Image.Image, target_size: int) -> Image.Image:
         width, height = image.size
         if width > height:
             new_width = target_size
             new_height = int((height * target_size) / width)
@@ -111,13 +122,16 @@ class LoRAImageTrainer:
             new_height = target_size
             new_width = int((width * target_size) / height)
         image = image.resize((new_width, new_height), Image.Resampling.LANCZOS)
         if new_width != target_size or new_height != target_size:
             left = (new_width - target_size) // 2
             top = (new_height - target_size) // 2
             right = left + target_size
             bottom = top + target_size
             image = image.crop((left, top, right, bottom))
         return image
@@ -126,35 +140,22 @@ class LoRAImageTrainer:
                          job_id: str,
                          model_name: str,
                          dataset: List[Dict],
-                         r: int = 8,
-                         lora_alpha: int = 16,
-                         lora_dropout: float = 0.0,
-                         num_epochs: int = 5,
                          learning_rate: float = 1e-4,
                          batch_size: int = 1,
                          resolution: int = 512) -> None:
         try:
-            # Inicializar job
-            if job_id not in self.training_jobs:
-                self.training_jobs[job_id] = {
-                    "id": job_id,
-                    "status": "queued",
-                    "progress": 0,
-                    "created_at": datetime.now().isoformat(),
-                    "model_name": model_name,
-                    "num_images": len(dataset),
-                    "logs": [],
-                    "error": None,
-                    "model_path": None,
-                    "completed_at": None
-                }
             self.training_jobs[job_id]["status"] = "loading_model"
             self.training_jobs[job_id]["progress"] = 5
-            log_msg = f"{datetime.now().strftime('%H:%M:%S')} - Carregando modelo base: {model_name}"
-            self.training_jobs[job_id]["logs"].append(log_msg)
-            logger.info(log_msg)
             pipeline = self.load_base_model(model_name)
             unet = pipeline.unet
             text_encoder = pipeline.text_encoder
@@ -162,14 +163,12 @@ class LoRAImageTrainer:
             tokenizer = pipeline.tokenizer
             scheduler = pipeline.scheduler
             unet.requires_grad_(False)
             text_encoder.requires_grad_(False)
             vae.requires_grad_(False)
-            # Remover adaptador se existir
-            if hasattr(unet, "peft_config") and "default" in unet.peft_config:
-                unet.delete_adapter("default")
             lora_config = LoraConfig(
                 r=r,
                 lora_alpha=lora_alpha,
@@ -178,96 +177,105 @@ class LoRAImageTrainer:
                 bias="none"
             )
             unet.add_adapter(lora_config, adapter_name="default")
-            unet.set_adapter("default")
-            # Ativar apenas parâmetros do LoRA
-            unet.requires_grad_(False)
-            for name, param in unet.named_parameters():
-                if "lora_" in name:
-                    param.requires_grad = True
             unet.train()
             unet.to(self.device)
-            optimizer = torch.optim.AdamW([p for p in unet.parameters() if p.requires_grad], lr=learning_rate)
             self.training_jobs[job_id]["status"] = "preparing_data"
             self.training_jobs[job_id]["progress"] = 20
             def preprocess_image(image):
                 image = np.array(image).astype(np.float32) / 255.0
                 image = image.transpose(2, 0, 1)
                 image = torch.from_numpy(image).unsqueeze(0)
                 return image
             total_steps = num_epochs * len(dataset)
             current_step = 0
             self.training_jobs[job_id]["status"] = "training"
-            log_msg = f"{datetime.now().strftime('%H:%M:%S')} - Iniciando treinamento real..."
-            self.training_jobs[job_id]["logs"].append(log_msg)
-            logger.info(log_msg)
             for epoch in range(num_epochs):
                 for item in dataset:
                     current_step += 1
                     image = item["image"]
                     caption = item["caption"]
                     image_tensor = preprocess_image(image).to(self.device)
                     if torch.cuda.is_available():
                         image_tensor = image_tensor.half()
                     with torch.no_grad():
                         latents = vae.encode(image_tensor * 2 - 1).latent_dist.sample() * 0.18215
                     inputs = tokenizer(caption, padding="max_length", max_length=tokenizer.model_max_length, truncation=True, return_tensors="pt")
                     input_ids = inputs.input_ids.to(self.device)
                     timesteps = torch.randint(0, scheduler.config.num_train_timesteps, (1,), device=self.device).long()
                     noise = torch.randn_like(latents)
                     noisy_latents = scheduler.add_noise(latents, noise, timesteps)
                     encoder_hidden_states = text_encoder(input_ids)[0]
                     noise_pred = unet(noisy_latents, timesteps, encoder_hidden_states=encoder_hidden_states).sample
                     loss = torch.nn.functional.mse_loss(noise_pred, noise)
                     optimizer.zero_grad()
                     loss.backward()
                     optimizer.step()
-                    if torch.cuda.is_available():
-                        torch.cuda.empty_cache()
                     progress = 30 + int((current_step / total_steps) * 60)
                     self.training_jobs[job_id]["progress"] = min(progress, 90)
                     if current_step % max(1, len(dataset)//2) == 0:
                         log_msg = f"Época {epoch+1}, Step {current_step} - Loss: {loss.item():.4f}"
-                        self.training_jobs[job_id]["logs"].append(log_msg)
-                        logger.info(log_msg)
             self.training_jobs[job_id]["status"] = "saving"
             self.training_jobs[job_id]["progress"] = 95
             output_dir = f"./lora_models/{job_id}"
             os.makedirs(output_dir, exist_ok=True)
-            # ✅ CORREÇÃO PRINCIPAL: SALVAR APENAS O ADAPTADOR LORA
             unet.save_pretrained(
                 output_dir,
                 safe_serialization=True,
                 selected_adapters=["default"]
             )
             lora_config_dict = {
                 "r": r,
                 "lora_alpha": lora_alpha,
                 "target_modules": ["to_k", "to_q", "to_v", "to_out.0"],
                 "lora_dropout": lora_dropout,
                 "bias": "none",
-                "task_type": "CAUSAL_LM",
                 "base_model_name": model_name,
                 "training_info": {
                     "num_epochs": num_epochs,
@@ -280,37 +288,56 @@ class LoRAImageTrainer:
             with open(f"{output_dir}/adapter_config.json", "w") as f:
                 json.dump(lora_config_dict, f, indent=2)
             readme_content = f"""# LoRA Model - {job_id}
-Treinado com sucesso!
 Modelo Base: {model_name}
-Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
 """
             with open(f"{output_dir}/README.md", "w") as f:
                 f.write(readme_content)
             self.training_jobs[job_id]["status"] = "completed"
             self.training_jobs[job_id]["progress"] = 100
             self.training_jobs[job_id]["model_path"] = output_dir
             self.training_jobs[job_id]["completed_at"] = datetime.now().isoformat()
-            log_msg = f"{datetime.now().strftime('%H:%M:%S')} - ✅ Treinamento concluído! LoRA salvo em {output_dir}"
-            self.training_jobs[job_id]["logs"].append(log_msg)
-            logger.info(log_msg)
         except Exception as e:
-            error_msg = f"Erro no treinamento: {str(e)}"
             logger.error(error_msg)
-            if job_id in self.training_jobs:
-                self.training_jobs[job_id]["status"] = "error"
-                self.training_jobs[job_id]["error"] = error_msg
-                self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - ❌ {error_msg}")
     def start_training(self,
                       model_name: str,
                       image_files: List[str],
                       captions: List[str],
                       **kwargs) -> str:
         job_id = str(uuid.uuid4())
         dataset = self.prepare_image_dataset(image_files, captions, kwargs.get('resolution', 512))
         self.training_jobs[job_id] = {
@@ -326,6 +353,7 @@ Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
             "completed_at": None
         }
         thread = threading.Thread(
             target=self.real_lora_training,
             args=(job_id, model_name, dataset),
@@ -337,9 +365,11 @@ Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
         return job_id
     def get_training_status(self, job_id: str) -> Dict[str, Any]:
         return self.training_jobs.get(job_id, {"error": "Job não encontrado"})
     def list_trained_models(self) -> List[Dict[str, str]]:
         models = []
         lora_models_dir = Path("./lora_models")
@@ -351,6 +381,7 @@ Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
                         try:
                             with open(config_file, 'r') as f:
                                 config = json.load(f)
                             models.append({
                                 "id": model_dir.name,
                                 "path": str(model_dir),
@@ -358,7 +389,7 @@ Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
                                 "r": config.get("r", "Unknown"),
                                 "created": datetime.fromtimestamp(model_dir.stat().st_mtime).isoformat()
                             })
-                        except:
                             models.append({
                                 "id": model_dir.name,
                                 "path": str(model_dir),
@@ -366,135 +397,531 @@ Data: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
                                 "r": "Unknown",
                                 "created": datetime.fromtimestamp(model_dir.stat().st_mtime).isoformat()
                             })
         return models
     def create_download_zip(self, model_path: str) -> str:
         zip_path = f"{model_path}.zip"
         with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
             model_dir = Path(model_path)
             for file_path in model_dir.rglob('*'):
                 if file_path.is_file():
                     arcname = file_path.relative_to(model_dir)
                     zipf.write(file_path, arcname)
         return zip_path
 trainer = LoRAImageTrainer()
 def create_gradio_interface():
     custom_css = """
     @media (max-width: 768px) {
-        .gradio-container { padding: 8px !important; }
-        .btn { width: 100% !important; padding: 12px !important; }
     }
     .lora-header {
         background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);
-        color: white; padding: 20px; border-radius: 12px; margin-bottom: 20px;
     }
-    .status-indicator { padding: 4px 8px; border-radius: 6px; font-size: 12px; font-weight: 600; }
     .status-completed { background-color: #34d399; color: #065f46; }
     .status-error { background-color: #f87171; color: #991b1b; }
     """
-    def start_training_wrapper(model_name, files, captions_text, trigger_word, r, lora_alpha, num_epochs, learning_rate):
-        if not files: return "❌ Erro: Nenhuma imagem enviada!"
-        if len(files) < 3: return "❌ Forneça pelo menos 3 imagens!"
         try:
             image_files = [f.name for f in files]
-            captions = [line.strip() for line in captions_text.split('\n') if line.strip()] if captions_text.strip() else []
             while len(captions) < len(files):
-                captions.append(f"{trigger_word.strip() or 'training image'}, high quality photo" if trigger_word.strip() else f"training image {len(captions) + 1}, high quality photo")
             captions = captions[:len(files)]
             job_id = trainer.start_training(
-                model_name=model_name,
-                image_files=image_files,
                 captions=captions,
-                r=int(r),
-                lora_alpha=int(lora_alpha),
-                lora_dropout=0.0,   # Fixado
-                num_epochs=int(num_epochs),
                 learning_rate=float(learning_rate),
-                batch_size=1,       # Fixado
-                resolution=512      # Fixado
             )
-            return f"✅ Treinamento iniciado! ID: {job_id}\n📊 Imagens: {len(files)}\nUse este ID para acompanhar o progresso."
         except Exception as e:
-            return f"❌ Erro: {str(e)}"
     def check_status_wrapper(job_id):
-        if not job_id.strip(): return "❌ Forneça um ID válido!"
         status = trainer.get_training_status(job_id.strip())
-        if "error" in status: return "❌ Job não encontrado!"
-        status_emoji = {'completed': '✅', 'error': '❌', 'training': '🏋️', 'queued': '⏳'}.get(status['status'], '📊')
-        progress = status['progress']
-        progress_bar = f'<div style="width:100%;background:#e5e7eb;border-radius:4px;overflow:hidden;margin:8px 0;"><div style="width:{progress}%;height:8px;background:linear-gradient(90deg,#3b82f6,#8b5cf6);border-radius:4px;"></div></div>'
-        status_text = f"🆔 Job ID: {status['id']}\n{status_emoji} Status: {status['status'].upper()}\n⏳ Progresso: {progress}%\n{progress_bar}\n🤖 Modelo: {status['model_name']}\n🖼️ Imagens: {status.get('num_images','N/A')}\n📅 Criado: {status['created_at']}\n"
-        if status['logs']: status_text += "\n📝 Logs:\n" + "\n".join([f"• {log}" for log in status['logs'][-5:]])
-        if status['status'] == 'completed': status_text += f"\n✅ Concluído! Modelo salvo em: {status['model_path']}"
-        elif status['status'] == 'error': status_text += f"\n❌ Erro: {status['error']}"
         return status_text
     def list_models_wrapper():
         models = trainer.list_trained_models()
-        if not models: return "📭 Nenhum modelo encontrado."
-        return "\n\n".join([f"🆔 {m['id']}\n🤖 {m['base_model']}\n📅 {m['created']}" for m in models])
     def download_model_wrapper(job_id):
-        if not job_id.strip(): return None, "❌ ID inválido!"
         status = trainer.get_training_status(job_id.strip())
-        if status.get("status") != "completed": return None, "❌ Treinamento não concluído!"
         try:
-            zip_path = trainer.create_download_zip(status['model_path'])
-            return zip_path, "✅ ZIP criado! Clique acima para baixar."
         except Exception as e:
-            return None, f"❌ Erro: {str(e)}"
-    with gr.Blocks(title="🎨 LoRA Image Trainer", theme=gr.themes.Soft(), css=custom_css) as interface:
-        gr.HTML('<div class="lora-header"><h1>🎨 LoRA Image Trainer</h1><p>Treine seu LoRA para imagens</p></div>')
         with gr.Tabs():
-            with gr.TabItem("🎯 Treinar"):
                 with gr.Row():
-                    with gr.Column():
-                        model_dropdown = gr.Dropdown(trainer.get_available_models(), value="runwayml/stable-diffusion-v1-5", label="🤖 Modelo Base")
-                        image_files = gr.File(file_count="multiple", file_types=["image"], label="🖼️ Imagens")
-                        trigger_word = gr.Textbox(label="🏷️ Trigger Word", placeholder="ex: meuEstilo")
-                        captions_text = gr.Textbox(lines=4, placeholder="Legenda por linha...", label="📝 Legendas (Opcional)")
-                    with gr.Column():
-                        r = gr.Slider(4, 32, 8, step=4, label="r (Rank)")
-                        lora_alpha = gr.Slider(1, 32, 16, step=1, label="LoRA Alpha")
-                        num_epochs = gr.Slider(1, 10, 5, step=1, label="Épocas")
-                        learning_rate = gr.Slider(1e-5, 1e-3, 1e-4, step=1e-5, label="Taxa de Aprendizado")
-                train_button = gr.Button("🚀 Iniciar Treinamento", variant="primary")
-                train_output = gr.Textbox(label="📊 Resultado")
-                train_button.click(start_training_wrapper, [model_dropdown, image_files, captions_text, trigger_word, r, lora_alpha, num_epochs, learning_rate], train_output)
-            with gr.TabItem("📊 Status"):
-                job_id_input = gr.Textbox(label="🆔 ID do Job")
-                status_button = gr.Button("🔍 Verificar Status")
-                status_output = gr.Textbox(label="📈 Status", lines=10)
-                status_button.click(check_status_wrapper, job_id_input, status_output)
-            with gr.TabItem("📚 Download"):
-                download_job_id = gr.Textbox(label="🆔 ID do Job")
-                download_button = gr.Button("📦 Baixar Modelo")
-                download_file = gr.File(label="📁 Arquivo ZIP")
-                download_status = gr.Textbox(label="📊 Status")
-                download_button.click(download_model_wrapper, download_job_id, [download_file, download_status])
-        gr.Markdown("---\n<center>🎨 LoRA Image Trainer v1.0 | Treinamento Real de LoRA</center>")
     return interface
 if __name__ == "__main__":
     interface = create_gradio_interface()
     interface.launch(
         server_name="0.0.0.0",
         server_port=7860,
         show_error=True,
         quiet=False
     )

         self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         self.training_jobs = {}
         self.models_cache = {}
     def get_available_models(self) -> List[str]:
+        """Retorna lista de modelos base disponíveis para treinamento LoRA."""
         return [
             "runwayml/stable-diffusion-v1-5",
             "stabilityai/stable-diffusion-2-1",
             "CompVis/stable-diffusion-v1-4"
+            # XL removido por ser pesado demais para Spaces gratuitos
         ]
     def load_base_model(self, model_name: str):
+        """Carrega modelo base de difusão com otimizações para baixo uso de GPU."""
         try:
             if model_name in self.models_cache:
                 return self.models_cache[model_name]
             logger.info(f"Carregando modelo base: {model_name}")
+            # Configurações para otimização de memória
             model_kwargs = {
                 "torch_dtype": torch.float16 if torch.cuda.is_available() else torch.float32,
                 "use_safetensors": True,
                 "variant": "fp16" if torch.cuda.is_available() else None,
+                "safety_checker": None,  # Desativa verificador de segurança para economizar memória
             }
+            # Carregar pipeline completo
             pipeline = StableDiffusionPipeline.from_pretrained(
                 model_name,
                 **model_kwargs
             if torch.cuda.is_available():
                 pipeline = pipeline.to(self.device)
+                # Habilitar attention slicing para economia de memória
                 pipeline.enable_attention_slicing()
+                # Habilitar memory efficient attention se disponível
                 try:
                     pipeline.enable_xformers_memory_efficient_attention()
+                except Exception as e:
+                    logger.warning("xformers não disponível, usando attention padrão")
+            # Cache do modelo
             self.models_cache[model_name] = pipeline
             return pipeline
         except Exception as e:
             raise e
     def prepare_image_dataset(self, image_files: List[str], captions: List[str], resolution: int = 512) -> List[Dict]:
+        """Prepara dataset de imagens para treinamento."""
         dataset = []
         for img_path, caption in zip(image_files, captions):
             try:
+                # Carregar e redimensionar imagem
                 image = Image.open(img_path).convert("RGB")
+                # Redimensionar mantendo aspect ratio
                 image = self.resize_image(image, resolution)
                 dataset.append({
         return dataset
     def resize_image(self, image: Image.Image, target_size: int) -> Image.Image:
+        """Redimensiona imagem mantendo aspect ratio e fazendo crop central se necessário."""
         width, height = image.size
+        # Calcular novo tamanho mantendo aspect ratio
         if width > height:
             new_width = target_size
             new_height = int((height * target_size) / width)
             new_height = target_size
             new_width = int((width * target_size) / height)
+        # Redimensionar
         image = image.resize((new_width, new_height), Image.Resampling.LANCZOS)
+        # Crop central para obter tamanho exato
         if new_width != target_size or new_height != target_size:
             left = (new_width - target_size) // 2
             top = (new_height - target_size) // 2
             right = left + target_size
             bottom = top + target_size
             image = image.crop((left, top, right, bottom))
         return image
                          job_id: str,
                          model_name: str,
                          dataset: List[Dict],
+                         r: int = 16,
+                         lora_alpha: int = 32,
+                         lora_dropout: float = 0.1,
+                         num_epochs: int = 10,
                          learning_rate: float = 1e-4,
                          batch_size: int = 1,
                          resolution: int = 512) -> None:
+        """TREINAMENTO REAL DE LoRA PARA IMAGENS - CORRIGIDO PARA DIFFUSERS + PEFT."""
         try:
+            # Atualizar status
             self.training_jobs[job_id]["status"] = "loading_model"
             self.training_jobs[job_id]["progress"] = 5
+            self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - Carregando modelo base: {model_name}")
+            # Carregar modelo base
             pipeline = self.load_base_model(model_name)
             unet = pipeline.unet
             text_encoder = pipeline.text_encoder
             tokenizer = pipeline.tokenizer
             scheduler = pipeline.scheduler
+            # Congelar parâmetros
             unet.requires_grad_(False)
             text_encoder.requires_grad_(False)
             vae.requires_grad_(False)
+            # Criar configuração LoRA
             lora_config = LoraConfig(
                 r=r,
                 lora_alpha=lora_alpha,
                 bias="none"
             )
+            # Aplicar LoRA ao UNet manualmente, sem usar get_peft_model diretamente
             unet.add_adapter(lora_config, adapter_name="default")
+            # Ativar o adaptador
+            unet.set_adapter("default")
             unet.train()
             unet.to(self.device)
+            # Otimizador
+            optimizer = torch.optim.AdamW(unet.parameters(), lr=learning_rate)
+            # Preparar scheduler para treinamento
             self.training_jobs[job_id]["status"] = "preparing_data"
             self.training_jobs[job_id]["progress"] = 20
+            # Normalização de imagem
             def preprocess_image(image):
                 image = np.array(image).astype(np.float32) / 255.0
                 image = image.transpose(2, 0, 1)
                 image = torch.from_numpy(image).unsqueeze(0)
                 return image
+            # Loop de treinamento real
             total_steps = num_epochs * len(dataset)
             current_step = 0
             self.training_jobs[job_id]["status"] = "training"
+            self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - Iniciando treinamento real...")
             for epoch in range(num_epochs):
                 for item in dataset:
                     current_step += 1
+                    # Obter imagem e legenda
                     image = item["image"]
                     caption = item["caption"]
+                    # Pré-processar imagem
                     image_tensor = preprocess_image(image).to(self.device)
                     if torch.cuda.is_available():
                         image_tensor = image_tensor.half()
+                    # Codificar imagem para latentes
                     with torch.no_grad():
                         latents = vae.encode(image_tensor * 2 - 1).latent_dist.sample() * 0.18215
+                    # Tokenizar texto
                     inputs = tokenizer(caption, padding="max_length", max_length=tokenizer.model_max_length, truncation=True, return_tensors="pt")
                     input_ids = inputs.input_ids.to(self.device)
+                    # Gerar timesteps aleatórios
                     timesteps = torch.randint(0, scheduler.config.num_train_timesteps, (1,), device=self.device).long()
+                    # Adicionar ruído aos latentes
                     noise = torch.randn_like(latents)
                     noisy_latents = scheduler.add_noise(latents, noise, timesteps)
+                    # Forward pass
                     encoder_hidden_states = text_encoder(input_ids)[0]
                     noise_pred = unet(noisy_latents, timesteps, encoder_hidden_states=encoder_hidden_states).sample
+                    # Calcular perda
                     loss = torch.nn.functional.mse_loss(noise_pred, noise)
+                    # Backward pass
                     optimizer.zero_grad()
                     loss.backward()
                     optimizer.step()
+                    # Atualizar progresso
                     progress = 30 + int((current_step / total_steps) * 60)
                     self.training_jobs[job_id]["progress"] = min(progress, 90)
                     if current_step % max(1, len(dataset)//2) == 0:
                         log_msg = f"Época {epoch+1}, Step {current_step} - Loss: {loss.item():.4f}"
+                        self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - {log_msg}")
+            # Salvar LoRA
             self.training_jobs[job_id]["status"] = "saving"
             self.training_jobs[job_id]["progress"] = 95
             output_dir = f"./lora_models/{job_id}"
             os.makedirs(output_dir, exist_ok=True)
+            # ✅ ÚNICA ALTERAÇÃO: SALVAR APENAS OS ADAPTADORES LORA
             unet.save_pretrained(
                 output_dir,
                 safe_serialization=True,
                 selected_adapters=["default"]
             )
+            # Criar adapter_config.json
             lora_config_dict = {
                 "r": r,
                 "lora_alpha": lora_alpha,
                 "target_modules": ["to_k", "to_q", "to_v", "to_out.0"],
                 "lora_dropout": lora_dropout,
                 "bias": "none",
+                "task_type": "CAUSAL_LM",  # Mantido por compatibilidade, mas não é usado
                 "base_model_name": model_name,
                 "training_info": {
                     "num_epochs": num_epochs,
             with open(f"{output_dir}/adapter_config.json", "w") as f:
                 json.dump(lora_config_dict, f, indent=2)
+            # README
             readme_content = f"""# LoRA Model - {job_id}
+Informações do Treinamento
 Modelo Base: {model_name}
+Rank (r): {r}
+LoRA Alpha: {lora_alpha}
+Dropout: {lora_dropout}
+Épocas: {num_epochs}
+Taxa de Aprendizado: {learning_rate}
+Resolução: {resolution}x{resolution}
+Número de Imagens: {len(dataset)}
+Data de Treinamento: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
+Como Usar
+1. Baixe os arquivos adapter_config.json e adapter_model.safetensors
+2. Carregue em sua ferramenta de geração de imagens favorita (ComfyUI, Automatic1111, etc.)
+3. Use o trigger word ou estilo aprendido durante o treinamento
 """
             with open(f"{output_dir}/README.md", "w") as f:
                 f.write(readme_content)
+            # Finalizar
             self.training_jobs[job_id]["status"] = "completed"
             self.training_jobs[job_id]["progress"] = 100
             self.training_jobs[job_id]["model_path"] = output_dir
             self.training_jobs[job_id]["completed_at"] = datetime.now().isoformat()
+            self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - ✅ Treinamento REAL concluído! LoRA salvo em {output_dir}")
+            logger.info(f"Treinamento LoRA REAL concluído para job {job_id}")
         except Exception as e:
+            error_msg = f"Erro REAL no treinamento: {str(e)}"
             logger.error(error_msg)
+            self.training_jobs[job_id]["status"] = "error"
+            self.training_jobs[job_id]["error"] = error_msg
+            self.training_jobs[job_id]["logs"].append(f"{datetime.now().strftime('%H:%M:%S')} - ❌ {error_msg}")
     def start_training(self,
                       model_name: str,
                       image_files: List[str],
                       captions: List[str],
                       **kwargs) -> str:
+        """Inicia treinamento LoRA assíncrono."""
         job_id = str(uuid.uuid4())
+        # Preparar dataset
         dataset = self.prepare_image_dataset(image_files, captions, kwargs.get('resolution', 512))
         self.training_jobs[job_id] = {
             "completed_at": None
         }
+        # Iniciar treinamento em thread separada
         thread = threading.Thread(
             target=self.real_lora_training,
             args=(job_id, model_name, dataset),
         return job_id
     def get_training_status(self, job_id: str) -> Dict[str, Any]:
+        """Retorna status do treinamento."""
         return self.training_jobs.get(job_id, {"error": "Job não encontrado"})
     def list_trained_models(self) -> List[Dict[str, str]]:
+        """Lista modelos LoRA treinados."""
         models = []
         lora_models_dir = Path("./lora_models")
                         try:
                             with open(config_file, 'r') as f:
                                 config = json.load(f)
                             models.append({
                                 "id": model_dir.name,
                                 "path": str(model_dir),
                                 "r": config.get("r", "Unknown"),
                                 "created": datetime.fromtimestamp(model_dir.stat().st_mtime).isoformat()
                             })
+                        except Exception as e:
                             models.append({
                                 "id": model_dir.name,
                                 "path": str(model_dir),
                                 "r": "Unknown",
                                 "created": datetime.fromtimestamp(model_dir.stat().st_mtime).isoformat()
                             })
         return models
     def create_download_zip(self, model_path: str) -> str:
+        """Cria um arquivo ZIP com os arquivos do modelo LoRA para download."""
         zip_path = f"{model_path}.zip"
         with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
             model_dir = Path(model_path)
             for file_path in model_dir.rglob('*'):
                 if file_path.is_file():
                     arcname = file_path.relative_to(model_dir)
                     zipf.write(file_path, arcname)
         return zip_path
+# Instância global do trainer
 trainer = LoRAImageTrainer()
 def create_gradio_interface():
+    """Cria interface Gradio para a ferramenta LoRA de geração de imagens."""
+    # CSS personalizado para responsividade móvel
     custom_css = """
+    /* Mobile-first responsive design */
     @media (max-width: 768px) {
+        .gradio-container {
+            padding: 8px !important;
+            margin: 0 !important;
+        }
+        .tab-nav {
+            flex-wrap: wrap !important;
+            gap: 4px !important;
+        }
+        .tab-nav button {
+            font-size: 14px !important;
+            padding: 8px 12px !important;
+            min-width: auto !important;
+            flex: 1 1 auto !important;
+        }
+        .form-container {
+            padding: 12px !important;
+        }
+        .btn {
+            width: 100% !important;
+            padding: 12px !important;
+            font-size: 16px !important;
+            margin-bottom: 8px !important;
+            min-height: 44px !important;
+        }
+        .textbox textarea {
+            font-size: 16px !important;
+            min-height: 120px !important;
+        }
+        .dropdown select {
+            font-size: 16px !important;
+            padding: 12px !important;
+        }
+        .output-text {
+            font-size: 14px !important;
+            line-height: 1.5 !important;
+        }
+        .column {
+            margin-bottom: 16px !important;
+        }
+        .file-upload {
+            min-height: 100px !important;
+        }
     }
+    /* Enhanced visual styles */
     .lora-header {
         background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);
+        color: white;
+        padding: 20px;
+        border-radius: 12px;
+        margin-bottom: 20px;
+        text-align: center;
+        box-shadow: 0 4px 6px -1px rgba(0, 0, 0, 0.1);
+    }
+    .status-indicator {
+        display: inline-block;
+        padding: 4px 8px;
+        border-radius: 6px;
+        font-size: 12px;
+        font-weight: 600;
+        text-transform: uppercase;
+        letter-spacing: 0.5px;
+        margin-right: 8px;
     }
+    .status-queued { background-color: #fbbf24; color: #92400e; }
+    .status-loading_model { background-color: #60a5fa; color: #1e40af; }
+    .status-preparing_lora { background-color: #8b5cf6; color: #5b21b6; }
+    .status-preparing_data { background-color: #06b6d4; color: #0e7490; }
+    .status-training { background-color: #a78bfa; color: #5b21b6; }
+    .status-saving { background-color: #f59e0b; color: #92400e; }
     .status-completed { background-color: #34d399; color: #065f46; }
     .status-error { background-color: #f87171; color: #991b1b; }
+    /* Touch device optimizations */
+    @media (hover: none) and (pointer: coarse) {
+        .btn {
+            min-height: 44px !important;
+            min-width: 44px !important;
+        }
+        .tab-nav button {
+            min-height: 44px !important;
+            min-width: 44px !important;
+        }
+    }
     """
+    def process_images_and_captions(files, captions_text):
+        """Processa imagens e legendas enviadas pelo usuário."""
+        if not files:
+            return "❌ Erro: Nenhuma imagem foi enviada!"
+        # Processar legendas
+        captions = []
+        if captions_text.strip():
+            captions = [line.strip() for line in captions_text.split('\n') if line.strip()]
+        # Se não há legendas suficientes, usar legendas padrão
+        while len(captions) < len(files):
+            captions.append(f"training image {len(captions) + 1}")
+        # Truncar legendas se houver mais que imagens
+        captions = captions[:len(files)]
+        return files, captions
+    def start_training_wrapper(model_name, files, captions_text, trigger_word, r, lora_alpha, lora_dropout,
+                             num_epochs, learning_rate, batch_size, resolution):
+        """Wrapper para iniciar treinamento via Gradio."""
+        if not files:
+            return "❌ Erro: Nenhuma imagem foi enviada para treinamento!"
+        if len(files) < 3:
+            return "❌ Erro: Forneça pelo menos 3 imagens para treinamento!"
         try:
+            # Processar imagens e legendas
             image_files = [f.name for f in files]
+            # Processar legendas
+            captions = []
+            if captions_text.strip():
+                captions = [line.strip() for line in captions_text.split('\n') if line.strip()]
+            # Se não há legendas suficientes, usar trigger word + descrição padrão
             while len(captions) < len(files):
+                if trigger_word.strip():
+                    captions.append(f"{trigger_word.strip()}, high quality photo")
+                else:
+                    captions.append(f"training image {len(captions) + 1}, high quality photo")
+            # Truncar legendas se houver mais que imagens
             captions = captions[:len(files)]
             job_id = trainer.start_training(
+                model_name=model_name,
+                image_files=image_files,
                 captions=captions,
+                r=int(r),
+                lora_alpha=int(lora_alpha),
+                lora_dropout=float(lora_dropout),
+                num_epochs=int(num_epochs),
                 learning_rate=float(learning_rate),
+                batch_size=int(batch_size),
+                resolution=int(resolution)
             )
+            return f"✅ Treinamento REAL iniciado! ID do Job: {job_id}\n\n📊 Imagens: {len(files)}\n🏷️ Trigger Word: {trigger_word or 'Nenhuma'}\n\nUse o ID acima para verificar o progresso na aba 'Status do Treinamento'."
         except Exception as e:
+            return f"❌ Erro ao iniciar treinamento: {str(e)}"
     def check_status_wrapper(job_id):
+        """Wrapper para verificar status via Gradio."""
+        if not job_id.strip():
+            return "❌ Erro: Forneça um ID de job válido!"
         status = trainer.get_training_status(job_id.strip())
+        if "error" in status and status["error"] == "Job não encontrado":
+            return "❌ Job não encontrado! Verifique o ID."
+        # Criar indicador visual de status
+        status_class = f"status-{status['status']}"
+        status_emoji = {
+            'queued': '⏳',
+            'loading_model': '📥',
+            'preparing_lora': '⚙️',
+            'preparing_data': '📊',
+            'training': '🏋️',
+            'saving': '💾',
+            'completed': '✅',
+            'error': '❌'
+        }.get(status['status'], '📊')
+        # Barra de progresso visual
+        progress = status['progress']
+        progress_bar = f"""
+        <div style="width: 100%; background-color: #e5e7eb; border-radius: 4px; overflow: hidden; margin: 8px 0;">
+            <div style="width: {progress}%; height: 8px; background: linear-gradient(90deg, #3b82f6, #8b5cf6); transition: width 0.3s ease; border-radius: 4px;"></div>
+        </div>
+        """
+        status_text = f"""
+📊 Status do Treinamento LoRA
+🆔 Job ID: {status['id']}
+{status_emoji} Status: <span class="{status_class}">{status['status'].upper().replace('_', ' ')}</span>
+⏳ Progresso: {status['progress']}%
+{progress_bar}
+🤖 Modelo Base: {status['model_name']}
+🖼️ Imagens: {status.get('num_images', 'N/A')}
+📅 Criado em: {status['created_at']}
+"""
+        if status['logs']:
+            status_text += "📝 **Logs Recentes:**\n"
+            for log in status['logs'][-5:]:  # Últimos 5 logs
+                status_text += f"• {log}\n"
+        if status['status'] == 'completed':
+            status_text += f"\n✅ **Treinamento Concluído!**\n📁 **Modelo salvo em:** {status['model_path']}"
+            status_text += f"\n⏰ **Concluído em:** {status['completed_at']}"
+            status_text += f"\n\n💡 **Próximos passos:** Vá para a aba 'Modelos Treinados' para baixar seu LoRA!"
+        elif status['status'] == 'error':
+            status_text += f"\n❌ **Erro:** {status['error']}"
         return status_text
     def list_models_wrapper():
+        """Wrapper para listar modelos via Gradio."""
         models = trainer.list_trained_models()
+        if not models:
+            return "📭 Nenhum modelo LoRA treinado encontrado."
+        models_text = "📚 **Modelos LoRA Treinados:**\n\n"
+        for model in models:
+            models_text += f"🆔 **ID:** {model['id']}\n"
+            models_text += f"🤖 **Modelo Base:** {model['base_model']}\n"
+            models_text += f"📊 **Rank (r):** {model['r']}\n"
+            models_text += f"📁 **Caminho:** {model['path']}\n"
+            models_text += f"📅 **Criado:** {model['created']}\n\n"
+            models_text += "---\n\n"
+        return models_text
     def download_model_wrapper(job_id):
+        """Wrapper para preparar download do modelo."""
+        if not job_id.strip():
+            return None, "❌ Erro: Forneça um ID de job válido!"
         status = trainer.get_training_status(job_id.strip())
+        if "error" in status and status["error"] == "Job não encontrado":
+            return None, "❌ Job não encontrado! Verifique o ID."
+        if status['status'] != 'completed':
+            return None, f"❌ Treinamento ainda não foi concluído. Status atual: {status['status']}"
         try:
+            model_path = status['model_path']
+            zip_path = trainer.create_download_zip(model_path)
+            return zip_path, f"✅ Arquivo ZIP criado com sucesso! Clique no link acima para baixar."
         except Exception as e:
+            return None, f"❌ Erro ao criar arquivo de download: {str(e)}"
+    # Interface Gradio
+    with gr.Blocks(
+        title="🎨 LoRA Image Trainer - Criador e Treinador de LoRA para Imagens",
+        theme=gr.themes.Soft(),
+        css=custom_css
+    ) as interface:
+        gr.HTML("""
+        <div class="lora-header">
+            <h1>🎨 LoRA Image Trainer</h1>
+            <p>Criador e Treinador de LoRA para Geração de Imagens</p>
+            <p style="font-size: 0.9em; opacity: 0.9; margin-top: 8px;">
+                Ferramenta otimizada para baixo uso de GPU, compatível com dispositivos móveis
+            </p>
+        </div>
+        """)
         with gr.Tabs():
+            # Aba de Treinamento
+            with gr.TabItem("🎯 Treinar LoRA"):
+                gr.Markdown("### Configurar e Iniciar Treinamento LoRA para Imagens")
                 with gr.Row():
+                    with gr.Column(scale=2):
+                        model_dropdown = gr.Dropdown(
+                            choices=trainer.get_available_models(),
+                            value="runwayml/stable-diffusion-v1-5",
+                            label="🤖 Modelo Base",
+                        )
+                        image_files = gr.File(
+                            file_count="multiple",
+                            file_types=["image"],
+                            label="🖼️ Imagens de Treinamento",
+                        )
+                        trigger_word = gr.Textbox(
+                            label="🏷️ Trigger Word (Opcional)",
+                            placeholder="ex: meuEstilo, minhaPersonagem, etc.",
+                        )
+                        captions_text = gr.Textbox(
+                            lines=8,
+                            placeholder="Digite uma legenda por linha (opcional)...\n\nExemplo:\nmeuEstilo, retrato de uma mulher\nmeuEstilo, homem sorrindo\nmeuEstilo, paisagem urbana\n\nSe deixar vazio, usará a trigger word + 'high quality photo'",
+                            label="📝 Legendas das Imagens (Opcional)",
+                        )
+                    with gr.Column(scale=1):
+                        gr.Markdown("### ⚙️ Parâmetros LoRA")
+                        r = gr.Slider(
+                            minimum=4, maximum=64, value=8, step=4,  # reduzido max para 64
+                            label="r (Rank)",
+                        )
+                        lora_alpha = gr.Slider(
+                            minimum=1, maximum=64, value=16, step=1,  # reduzido max para 64
+                            label="LoRA Alpha",
+                        )
+                        lora_dropout = gr.Slider(
+                            minimum=0.0, maximum=0.5, value=0.0, step=0.05,  # dropout 0 para mais estabilidade
+                            label="LoRA Dropout",
+                        )
+                        gr.Markdown("### 🏋️ Parâmetros de Treinamento")
+                        num_epochs = gr.Slider(
+                            minimum=5, maximum=20, value=10, step=5,  # reduzido max para 20
+                            label="Épocas",
+                        )
+                        learning_rate = gr.Slider(
+                            minimum=1e-5, maximum=5e-4, value=1e-4, step=1e-5,  # reduzido max
+                            label="Taxa de Aprendizado",
+                        )
+                        batch_size = gr.Slider(
+                            minimum=1, maximum=1, value=1, step=1,  # fixado em 1 para Spaces
+                            label="Batch Size",
+                        )
+                        resolution = gr.Dropdown(
+                            choices=[512],  # fixado em 512 para garantir funcionamento em GPU limitada
+                            value=512,
+                            label="Resolução",
+                        )
+                train_button = gr.Button("🚀 Iniciar Treinamento LoRA", variant="primary", size="lg")
+                train_output = gr.Textbox(label="📊 Resultado", lines=5)
+                train_button.click(
+                    start_training_wrapper,
+                    inputs=[model_dropdown, image_files, captions_text, trigger_word, r, lora_alpha, lora_dropout,
+                           num_epochs, learning_rate, batch_size, resolution],
+                    outputs=train_output
+                )
+            # Aba de Status
+            with gr.TabItem("📊 Status do Treinamento"):
+                gr.Markdown("### Verificar Progresso do Treinamento")
+                job_id_input = gr.Textbox(
+                    label="🆔 ID do Job",
+                    placeholder="Cole aqui o ID do job de treinamento...",
+                )
+                status_button = gr.Button("🔍 Verificar Status", variant="secondary")
+                status_output = gr.Textbox(label="📈 Status", lines=12)
+                status_button.click(
+                    check_status_wrapper,
+                    inputs=job_id_input,
+                    outputs=status_output
+                )
+                gr.Markdown("💡 **Dica:** Atualize o status regularmente para acompanhar o progresso do treinamento.")
+            # Aba de Modelos e Download
+            with gr.TabItem("📚 Modelos e Download"):
+                gr.Markdown("### Visualizar e Baixar Modelos LoRA Treinados")
+                with gr.Row():
+                    with gr.Column(scale=1):
+                        list_button = gr.Button("📋 Listar Modelos", variant="secondary")
+                        models_output = gr.Textbox(label="📚 Modelos Disponíveis", lines=10)
+                        list_button.click(
+                            list_models_wrapper,
+                            outputs=models_output
+                        )
+                    with gr.Column(scale=1):
+                        gr.Markdown("#### 💾 Download de Modelo")
+                        download_job_id = gr.Textbox(
+                            label="🆔 ID do Job para Download",
+                            placeholder="Cole o ID do job concluído...",
+                        )
+                        download_button = gr.Button("📦 Preparar Download", variant="primary")
+                        download_file = gr.File(label="📁 Arquivo para Download")
+                        download_status = gr.Textbox(label="📊 Status do Download", lines=3)
+                        download_button.click(
+                            download_model_wrapper,
+                            inputs=download_job_id,
+                            outputs=[download_file, download_status]
+                        )
+            # Aba de Informações
+            with gr.TabItem("ℹ️ Sobre"):
+                gr.Markdown("""
+                ### 🎯 Sobre o LoRA Image Trainer
+                Esta ferramenta foi desenvolvida para democratizar o acesso ao treinamento de modelos LoRA para geração de imagens,
+                permitindo que qualquer pessoa possa criar adaptações personalizadas de modelos de difusão (como Stable Diffusion)
+                sem a necessidade de hardware especializado.
+                #### ✨ Características Principais:
+                - **🔋 Otimizado para Baixa GPU**: Utiliza técnicas como mixed precision, gradient checkpointing e configurações otimizadas
+                - **📱 Compatível com Móveis**: Interface responsiva que funciona em smartphones e tablets
+                - **⚡ Rápido e Eficiente**: Treinamento otimizado com bibliotecas Diffusers e PEFT do Hugging Face
+                - **🎛️ Configurável**: Controle total sobre parâmetros LoRA e de treinamento
+                - **☁️ Pronto para Deploy**: Facilmente implantável no Hugging Face Spaces
+                - **🎨 Focado em Imagens**: Especificamente projetado para modelos de difusão e geração de imagens
+                #### 🛠️ Tecnologias Utilizadas:
+                - **Hugging Face Diffusers**: Para modelos de difusão e pipeline de treinamento
+                - **PEFT (Parameter-Efficient Fine-Tuning)**: Para treinamento eficiente de LoRA
+                - **PyTorch**: Framework de deep learning
+                - **Gradio**: Interface web interativa e responsiva
+                - **LoRA (Low-Rank Adaptation)**: Técnica de fine-tuning eficiente para modelos de difusão
+                #### 📖 Como Usar:
+                1. **Prepare suas imagens**: Colete 3-50 imagens de alta qualidade do estilo/conceito que deseja treinar
+                2. **Escolha um modelo base** na aba "Treinar LoRA" (recomendado: Stable Diffusion 1.5)
+                3. **Faça upload das imagens** e defina uma trigger word (palavra-chave)
+                4. **Configure os parâmetros** conforme necessário (valores padrão funcionam bem)
+                5. **Inicie o treinamento** e anote o ID do job
+                6. **Acompanhe o progresso** na aba "Status do Treinamento"
+                7. **Baixe seu LoRA** na aba "Modelos e Download" quando concluído
+                8. **Use em suas ferramentas favoritas** (ComfyUI, Automatic1111, etc.)
+                #### 💡 Dicas para Melhores Resultados:
+                - **Qualidade > Quantidade**: 10-20 imagens de alta qualidade são melhores que 50 imagens ruins
+                - **Consistência**: Use imagens com estilo/conceito consistente
+                - **Resolução**: Para GPUs com pouca VRAM, use resolução 512x512
+                - **Trigger Word**: Escolha uma palavra única e fácil de lembrar
+                - **Legendas**: Descreva o que há nas imagens para melhor controle
+                - **Parâmetros**: Para iniciantes, use os valores padrão
+                #### 🎮 Compatibilidade:
+                Os LoRAs gerados são compatíveis com:
+                - **ComfyUI**: Carregue os arquivos .safetensors
+                - **Automatic1111**: Coloque na pasta models/Lora
+                - **SeaArt**: Faça upload do modelo
+                - **Outras ferramentas**: Qualquer ferramenta que suporte LoRA para Stable Diffusion
+                ---
+                **Desenvolvido com ❤️ para a comunidade de IA e arte digital**
+                """)
+        # Footer
+        gr.Markdown("""
+        ---
+        <div style="text-align: center; color: #666; font-size: 0.9em;">
+            🎨 LoRA Image Trainer v1.0 | Otimizado para Baixa GPU | Compatível com Dispositivos Móveis
+        </div>
+        """)
     return interface
+# Criar e configurar interface
 if __name__ == "__main__":
+    # Criar diretórios necessários
+    os.makedirs("./lora_models", exist_ok=True)
+    # Configurar interface
     interface = create_gradio_interface()
+    # Lançar aplicação
     interface.launch(
         server_name="0.0.0.0",
         server_port=7860,
+        share=False,
         show_error=True,
         quiet=False
     )