Spaces:

Andro0s
/

AmorCoderAI-Train

Runtime error

App Files Files Community

Andro0s commited on Oct 21

Commit

290bb59

verified ·

1 Parent(s): f061838

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -205

app.py CHANGED Viewed

@@ -1,205 +1,24 @@
-import os
-import gradio as gr
-from huggingface_hub import login
-from datasets import load_dataset, Dataset
-from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments, DataCollatorForLanguageModeling, pipeline
-from peft import get_peft_model, LoraConfig, TaskType, PeftModel
-# ============================================================
-# ⚙️ CONFIGURACIÓN GLOBAL
-# ============================================================
-# Modelo base para generación de código
-BASE_MODEL = "bigcode/santacoder"
-LORA_PATH = "./lora_output"        # Directorio para guardar los adaptadores LoRA
-DATASET_PATH = "tu_dataset.json"   # ¡Cambia esto por el nombre de tu archivo JSON!
-MAX_TOKEN_LENGTH = 256             # Longitud de secuencia uniforme (corrige errores de tamaño)
-# Variables globales para acceso a recursos
-tokenizer = None
-lora_model = None
-tokenized_dataset = None
-lora_generator = None
-# ============================================================
-# 🔐 AUTENTICACIÓN Y PRE-CARGA DE RECURSOS (SINGLETON)
-# ============================================================
-def setup_resources():
-    """Carga y configura todos los recursos (modelo, tokenizer, dataset) una sola vez."""
-    global tokenizer, lora_model, tokenized_dataset
-    # 1. Autenticación con Hugging Face
-    hf_token = os.environ.get("HF_TOKEN")
-    if hf_token:
-        login(token=hf_token)
-    else:
-        print("⚠️ Token no encontrado. La app intentará correr sin autenticación de escritura.")
-    # 2. Carga del Tokenizer y Modelo Base
-    print("\n🔄 Cargando modelo y tokenizer una sola vez...")
-    tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
-    base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
-    if tokenizer.pad_token is None:
-        tokenizer.pad_token = tokenizer.eos_token
-    # 3. Configuración y Aplicación LoRA (PEFT)
-    peft_config = LoraConfig(
-        task_type=TaskType.CAUSAL_LM,
-        r=8,
-        lora_alpha=32,
-        lora_dropout=0.1,
-        target_modules=["c_proj", "c_attn"], # Adaptado para modelos causales tipo GPT/Santacoder
-    )
-    # Envuelve el modelo base con la configuración LoRA
-    lora_model = get_peft_model(base_model, peft_config)
-    print(f"✅ Modelo LoRA preparado. Parámetros entrenables: {lora_model.print_trainable_parameters()}")
-    # 4. Carga y Tokenización del Dataset (para eficiencia)
-    print("📚 Cargando y tokenizando dataset (esto solo se hace una vez)...")
-    try:
-        raw_dataset = load_dataset("json", data_files=DATASET_PATH)
-        # Tokenización rápida con batched=True
-        tokenized_dataset = raw_dataset.map(
-            lambda e: tokenizer(
-                e["prompt"] + e["completion"],
-                truncation=True,
-                padding="max_length",
-                max_length=MAX_TOKEN_LENGTH
-            ),
-            batched=True,
-            remove_columns=raw_dataset["train"].column_names
-        )
-        print("✅ Dataset tokenizado correctamente.")
-    except Exception as e:
-        tokenized_dataset = None
-        print(f"❌ Error al cargar o tokenizar el dataset. Asegúrate que '{DATASET_PATH}' exista. {e}")
-# ============================================================
-# 🧩 FUNCIÓN DE ENTRENAMIENTO
-# ============================================================
-def train_lora(epochs, batch_size, learning_rate):
-    """Ejecuta el entrenamiento del modelo LoRA."""
-    global lora_model, tokenized_dataset, lora_generator
-    # Verifica si el dataset está disponible
-    if tokenized_dataset is None or "train" not in tokenized_dataset:
-        return "❌ Error: El dataset no pudo cargarse o está vacío. No se puede entrenar."
-    try:
-        # Reinicia el generador para que cargue el modelo entrenado en el siguiente test
-        lora_generator = None
-        data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
-        training_args = TrainingArguments(
-            output_dir=LORA_PATH,
-            per_device_train_batch_size=int(batch_size),
-            num_train_epochs=float(epochs),
-            learning_rate=float(learning_rate),
-            save_total_limit=1,
-            logging_steps=10,
-            push_to_hub=False,
-        )
-        trainer = Trainer(
-            model=lora_model, # Usa el modelo LoRA global
-            args=training_args,
-            train_dataset=tokenized_dataset["train"],
-            data_collator=data_collator,
-        )
-        trainer.train()
-        # Guarda SOLAMENTE los adaptadores LoRA (archivos pequeños)
-        lora_model.save_pretrained(LORA_PATH)
-        tokenizer.save_pretrained(LORA_PATH)
-        return f"✅ Entrenamiento completado. Adaptadores LoRA guardados en **{LORA_PATH}**"
-    except Exception as e:
-        return f"❌ Error durante el entrenamiento: {e}"
-# ============================================================
-# 🤖 FUNCIÓN DE GENERACIÓN (INFERENCIA)
-# ============================================================
-def generate_text(prompt_text):
-    """Genera texto usando el modelo base + adaptadores LoRA."""
-    global lora_generator
-    try:
-        # Carga el generador SOLAMENTE si no ha sido cargado aún
-        if lora_generator is None:
-            # 1. Cargar el modelo base
-            base_model_gen = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
-            # 2. Aplicar adaptadores LoRA si existen
-            if os.path.exists(LORA_PATH):
-                model_with_lora = PeftModel.from_pretrained(base_model_gen, LORA_PATH)
-            else:
-                # Si no hay LoRA, usa el modelo base (solo si está cargado globalmente)
-                model_with_lora = base_model_gen
-            # 3. Fusionar el modelo base y los adaptadores para una inferencia más rápida
-            final_model = model_with_lora.merge_and_unload()
-            final_model.eval() # Poner en modo evaluación
-            # 4. Inicializar el pipeline global
-            lora_generator = pipeline("text-generation", model=final_model, tokenizer=tokenizer)
-        # Generar la respuesta
-        output = lora_generator(prompt_text, max_new_tokens=150, temperature=0.7, top_p=0.9)
-        return output[0]["generated_text"]
-    except Exception as e:
-        return f"❌ Error generando texto (Asegúrate de que el modelo base/LoRA esté cargado): {e}"
-# ============================================================
-# 💻 INTERFAZ GRADIO
-# ============================================================
-with gr.Blocks(title="AmorCoderAI - LoRA") as demo:
-    gr.Markdown("# 💙 AmorCoderAI - Entrenamiento y Pruebas LoRA")
-    gr.Markdown(f"Modelo base: `{BASE_MODEL}`. Adaptadores guardados en `{LORA_PATH}`. **El auto-entrenamiento se ejecuta al iniciar.**")
-    with gr.Tab("🧠 Entrenar (Manual)"):
-        gr.Markdown("--- **¡CUIDADO!** El entrenamiento es lento y consume muchos recursos (VRAM/RAM). ---")
-        epochs = gr.Number(value=1, label="Épocas", precision=0)
-        batch_size = gr.Number(value=2, label="Tamaño de lote (ajusta según tu VRAM)", precision=0)
-        learning_rate = gr.Number(value=5e-5, label="Tasa de aprendizaje")
-        train_button = gr.Button("🚀 Iniciar Entrenamiento Manual")
-        train_output = gr.Textbox(label="Resultado del Entrenamiento Manual")
-        train_button.click(
-            train_lora,
-            inputs=[epochs, batch_size, learning_rate],
-            outputs=train_output
-        )
-    with gr.Tab("✨ Probar modelo"):
-        prompt = gr.Textbox(label="Escribe código (ej: 'def fibonacci(n):')", lines=4)
-        generate_button = gr.Button("💬 Generar código")
-        output_box = gr.Textbox(label="Salida generada", lines=10)
-        generate_button.click(generate_text, inputs=prompt, outputs=output_box)
-# ============================================================
-# 🚀 LANZAR APP Y AUTO-ENTRENAMIENTO (¡AQUÍ SUCEDE LA MAGIA!)
-# ============================================================
-if __name__ == "__main__":
-    # 1. Cargar todos los recursos globales
-    setup_resources()
-    # 2. AUTO-ENTRENAMIENTO (Se ejecuta con valores por defecto)
-    print("\n=============================================")
-    print("🤖 INICIANDO AUTO-ENTRENAMIENTO (1 Época, 2 Batch Size)")
-    print("=============================================")
-    # Parámetros por defecto para el auto-entrenamiento
-    auto_train_result = train_lora(epochs=1, batch_size=2, learning_rate=5e-5)
-    print(f"\nFIN DEL AUTO-ENTRENAMIENTO: {auto_train_result}")
-    # 3. Lanzar la Interfaz Gradio
-    print("\n=============================================")
-    print("💻 LANZANDO INTERFAZ GRADIO")
-    print("=============================================")
-    demo.launch()

+INICIANDO AUTO-ENTRENAMIENTO (1 Época, 2 Batch Size)
+=============================================
+The model is already on multiple devices. Skipping the move to device specified in `args`.
+  0%|          | 0/9 [00:00<?, ?it/s]/usr/local/lib/python3.10/site-packages/torch/utils/data/dataloader.py:668: UserWarning: 'pin_memory' argument is set as true but no accelerator is found, then device pinned memory won't be used.
+  warnings.warn(warn_msg)
+`loss_type=None` was set in the config but it is unrecognized. Using the default loss: `ForCausalLMLoss`.
+ 11%|█         | 1/9 [00:22<02:58, 22.28s/it]
+ 22%|██▏       | 2/9 [00:38<02:11, 18.80s/it]
+ 33%|███▎      | 3/9 [00:54<01:45, 17.56s/it]
+ 44%|████▍     | 4/9 [01:10<01:24, 16.89s/it]
+ 56%|█████▌    | 5/9 [01:26<01:05, 16.40s/it]
+ 67%|██████▋   | 6/9 [01:42<00:48, 16.28s/it]
+ 78%|███████▊  | 7/9 [01:58<00:32, 16.15s/it]
+ 89%|████████▉ | 8/9 [02:13<00:15, 15.94s/it]
+100%|██████████| 9/9 [02:28<00:00, 15.71s/it]
+{'train_runtime': 148.9425, 'train_samples_per_second': 0.121, 'train_steps_per_second': 0.06, 'train_loss': 9.368481106228298, 'epoch': 1.0}
+100%|██████████| 9/9 [02:28<00:00, 15.71s/it]
+100%|██████████| 9/9 [02:28<00:00, 16.55s/it]
+FIN DEL AUTO-ENTRENAMIENTO: ✅ Entrenamiento completado. Adaptadores LoRA guardados en **./lora_output**