Spaces:

Andro0s
/

AmorCoderAI-Train

Runtime error

App Files Files Community

Andro0s commited on Oct 21

Commit

8a66252

verified ·

1 Parent(s): 6768da8

Update app.py

Browse files

Files changed (1) hide show

app.py +144 -63

app.py CHANGED Viewed

@@ -1,121 +1,202 @@
 import os
 import gradio as gr
 from huggingface_hub import login
-from datasets import load_dataset
 from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments, DataCollatorForLanguageModeling, pipeline
-from peft import PeftModel
 # ============================================================
-# 🔐 Autenticación HuggingFace
 # ============================================================
-hf_token = os.environ.get("HF_TOKEN")
-if hf_token:
-    login(token=hf_token)
-else:
-    print("⚠️ No se encontró el token. Agrega 'HF_TOKEN' en Settings → Secrets.")
-# ============================================================
-# ⚙️ Configuración del modelo y dataset
-# ============================================================
-BASE_MODEL = "bigcode/santacoder"  # Modelo público
-LORA_PATH = "./lora_output"        # Carpeta donde se guardará LoRA
-DATASET_PATH = "tu_dataset.json"   # Cambia aquí al nombre de tu dataset
 # ============================================================
-# 🔧 Inicializar tokenizer y modelo base
 # ============================================================
-tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
-base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL)
-# 🔧 Asegurar que haya un pad_token
-if tokenizer.pad_token is None:
-    tokenizer.pad_token = tokenizer.eos_token
-# ============================================================
-# 🧩 Función de entrenamiento LoRA
-# ============================================================
-def train_lora(epochs, batch_size, learning_rate):
     try:
-        dataset = load_dataset("json", data_files=DATASET_PATH)
-        tokenized = dataset.map(
             lambda e: tokenizer(
                 e["prompt"] + e["completion"],
                 truncation=True,
                 padding="max_length",
-                max_length=256
             ),
-            batched=True
         )
         data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
         training_args = TrainingArguments(
             output_dir=LORA_PATH,
             per_device_train_batch_size=int(batch_size),
-            num_train_epochs=int(epochs),
-            learning_rate=learning_rate,
             save_total_limit=1,
             logging_steps=10,
-            push_to_hub=False
         )
         trainer = Trainer(
-            model=base_model,
             args=training_args,
-            train_dataset=tokenized["train"],
             data_collator=data_collator,
         )
         trainer.train()
-        # Guardar LoRA
-        base_model.save_pretrained(LORA_PATH)
-        tokenizer.save_pretrained(LORA_PATH)
-        return "✅ Entrenamiento completado y guardado en ./lora_output"
     except Exception as e:
         return f"❌ Error durante el entrenamiento: {e}"
 # ============================================================
-# 🤖 Función para generar texto usando LoRA sobre el modelo base
 # ============================================================
 def generate_text(prompt_text):
-    try:
-        # Cargar modelo base
-        tokenizer_gen = AutoTokenizer.from_pretrained(BASE_MODEL)
-        base_model_gen = AutoModelForCausalLM.from_pretrained(BASE_MODEL)
-        # Aplicar LoRA
-        model = PeftModel.from_pretrained(base_model_gen, LORA_PATH)
-        generator = pipeline("text-generation", model=model, tokenizer=tokenizer_gen)
-        output = generator(prompt_text, max_new_tokens=100, temperature=0.7, top_p=0.9)
         return output[0]["generated_text"]
     except Exception as e:
-        return f"❌ Error generando texto: {e}"
 # ============================================================
-# 💻 Interfaz Gradio
 # ============================================================
-with gr.Blocks(title="AmorCoderAI - Entrenamiento LoRA") as demo:
-    gr.Markdown("# 💙 AmorCoderAI - Entrenamiento y Pruebas")
-    gr.Markdown("Entrena y prueba tu modelo basado en `bigcode/santacoder` con LoRA")
     with gr.Tab("🧠 Entrenar"):
-        epochs = gr.Number(value=1, label="Épocas")
-        batch_size = gr.Number(value=2, label="Tamaño de lote")
         learning_rate = gr.Number(value=5e-5, label="Tasa de aprendizaje")
-        train_button = gr.Button("🚀 Iniciar entrenamiento")
-        train_output = gr.Textbox(label="Resultado")
-        train_button.click(train_lora, inputs=[epochs, batch_size, learning_rate], outputs=train_output)
     with gr.Tab("✨ Probar modelo"):
-        prompt = gr.Textbox(label="Escribe un prompt")
-        generate_button = gr.Button("💬 Generar texto")
-        output_box = gr.Textbox(label="Salida generada")
         generate_button.click(generate_text, inputs=prompt, outputs=output_box)
 # ============================================================
-# 🚀 Lanzar app
 # ============================================================
 if __name__ == "__main__":
-    demo.launch()

 import os
 import gradio as gr
 from huggingface_hub import login
+from datasets import load_dataset, Dataset
 from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments, DataCollatorForLanguageModeling, pipeline
+from peft import get_peft_model, LoraConfig, TaskType, PeftModel
 # ============================================================
+# ⚙️ CONFIGURACIÓN GLOBAL
 # ============================================================
+BASE_MODEL = "bigcode/santacoder"  # Modelo a refinar
+LORA_PATH = "./lora_output"        # Directorio para guardar los adaptadores
+DATASET_PATH = "tu_dataset.json"   # ¡Asegúrate de que este archivo exista!
+# Variables globales inicializadas como None
+tokenizer = None
+lora_model = None
+tokenized_dataset = None
+lora_generator = None
 # ============================================================
+# 🔐 AUTENTICACIÓN Y PRE-CARGA
 # ============================================================
+def setup_resources():
+    """Carga y configura todos los recursos (modelo, tokenizer, dataset) una sola vez."""
+    global tokenizer, lora_model, tokenized_dataset
+    # 1. Autenticación
+    hf_token = os.environ.get("HF_TOKEN")
+    if hf_token:
+        login(token=hf_token)
+    else:
+        print("⚠️ Token no encontrado. La app intentará correr sin autenticación de escritura.")
+    # 2. Carga del Tokenizer y Modelo Base
+    print("\n🔄 Cargando modelo y tokenizer...")
+    tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+    # Usa device_map="auto" para cargar el modelo de forma eficiente en la(s) GPU
+    base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = tokenizer.eos_token
+    # 3. Configuración y Aplicación LoRA (PEFT)
+    peft_config = LoraConfig(
+        task_type=TaskType.CAUSAL_LM,
+        r=8,
+        lora_alpha=32,
+        lora_dropout=0.1,
+        # 'c_proj' y 'c_attn' son comunes en modelos GPT/causales
+        target_modules=["c_proj", "c_attn"],
+    )
+    lora_model = get_peft_model(base_model, peft_config)
+    print(f"✅ Modelo LoRA preparado. Parámetros entrenables: {lora_model.print_trainable_parameters()}")
+    # 4. Carga y Tokenización del Dataset (para evitar errores de longitud)
+    print("📚 Cargando y tokenizando dataset...")
     try:
+        raw_dataset = load_dataset("json", data_files=DATASET_PATH)
+        tokenized_dataset = raw_dataset.map(
             lambda e: tokenizer(
                 e["prompt"] + e["completion"],
                 truncation=True,
                 padding="max_length",
+                max_length=256 # Mantener esta longitud consistente para evitar errores
             ),
+            batched=True,
+            remove_columns=raw_dataset["train"].column_names
         )
+        print("✅ Dataset tokenizado correctamente.")
+    except Exception as e:
+        tokenized_dataset = None
+        print(f"❌ Error al cargar o tokenizar el dataset. El auto-entrenamiento fallará. {e}")
+# ============================================================
+# 🧩 FUNCIÓN DE ENTRENAMIENTO
+# ============================================================
+def train_lora(epochs=1, batch_size=2, learning_rate=5e-5):
+    """Ejecuta el entrenamiento del modelo LoRA."""
+    global lora_model, tokenized_dataset, lora_generator
+    if tokenized_dataset is None or "train" not in tokenized_dataset:
+        return "❌ Error: El dataset no pudo cargarse o está vacío. No se puede entrenar."
+    try:
+        # Re-inicializa el generador a None para que se recargue después del entrenamiento
+        lora_generator = None
         data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
         training_args = TrainingArguments(
             output_dir=LORA_PATH,
             per_device_train_batch_size=int(batch_size),
+            num_train_epochs=float(epochs),
+            learning_rate=float(learning_rate),
             save_total_limit=1,
             logging_steps=10,
+            push_to_hub=False,
+            # Desactiva la evaluación para simplificar el auto-entrenamiento
+            disable_tqdm=True
         )
         trainer = Trainer(
+            model=lora_model, # Usa el modelo LoRA global
             args=training_args,
+            train_dataset=tokenized_dataset["train"],
             data_collator=data_collator,
         )
         trainer.train()
+        # Guardar solo los adaptadores LoRA (PEFT)
+        lora_model.save_pretrained(LORA_PATH)
+        tokenizer.save_pretrained(LORA_PATH)
+        return "✅ Entrenamiento completado y adaptadores LoRA guardados en **./lora_output**"
     except Exception as e:
         return f"❌ Error durante el entrenamiento: {e}"
 # ============================================================
+# 🤖 FUNCIÓN DE GENERACIÓN (INFERENCIA)
 # ============================================================
 def generate_text(prompt_text):
+    """Genera texto usando el modelo base + adaptadores LoRA."""
+    global lora_generator, lora_model
+    try:
+        # Carga el generador SOLO la primera vez o después del entrenamiento
+        if lora_generator is None:
+            # Cargar el modelo base limpio (sin los adaptadores LoRA)
+            base_model_gen = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
+            # Aplicar los adaptadores guardados
+            if os.path.exists(LORA_PATH):
+                model_with_lora = PeftModel.from_pretrained(base_model_gen, LORA_PATH)
+            else:
+                # Si no hay adaptadores entrenados, usa el modelo base inicial
+                model_with_lora = lora_model if lora_model else base_model_gen
+            # Fusionar el modelo base y los adaptadores para una inferencia más rápida
+            final_model = model_with_lora.merge_and_unload()
+            lora_generator = pipeline("text-generation", model=final_model, tokenizer=tokenizer)
+        output = lora_generator(prompt_text, max_new_tokens=100, temperature=0.7, top_p=0.9)
         return output[0]["generated_text"]
     except Exception as e:
+        return f"❌ Error generando texto (Asegúrate de que el modelo base y/o LoRA estén cargados): {e}"
 # ============================================================
+# 💻 INTERFAZ GRADIO
 # ============================================================
+with gr.Blocks(title="AmorCoderAI - LoRA") as demo:
+    gr.Markdown("# 💙 AmorCoderAI - Entrenamiento y Pruebas LoRA")
+    gr.Markdown(f"Modelo base: `{BASE_MODEL}`. Adaptadores guardados en `{LORA_PATH}`.")
     with gr.Tab("🧠 Entrenar"):
+        gr.Markdown("--- **¡CUIDADO!** El entrenamiento es lento y consume muchos recursos. ---")
+        epochs = gr.Number(value=1, label="Épocas", precision=0)
+        batch_size = gr.Number(value=2, label="Tamaño de lote (ajusta según tu RAM/VRAM)", precision=0)
         learning_rate = gr.Number(value=5e-5, label="Tasa de aprendizaje")
+        train_button = gr.Button("🚀 Iniciar entrenamiento Manual")
+        train_output = gr.Textbox(label="Resultado del Entrenamiento Manual")
+        train_button.click(
+            train_lora,
+            inputs=[epochs, batch_size, learning_rate],
+            outputs=train_output
+        )
     with gr.Tab("✨ Probar modelo"):
+        prompt = gr.Textbox(label="Escribe código (ej: 'def bubble_sort(arr):')", lines=4)
+        generate_button = gr.Button("💬 Generar código")
+        output_box = gr.Textbox(label="Salida generada", lines=10)
         generate_button.click(generate_text, inputs=prompt, outputs=output_box)
 # ============================================================
+# 🚀 LANZAR APP Y AUTO-ENTRENAMIENTO
 # ============================================================
 if __name__ == "__main__":
+    # 1. Cargar recursos
+    setup_resources()
+    # 2. AUTO-ENTRENAMIENTO (¡El código se 'autocorre' aquí!)
+    print("\n=============================================")
+    print("🤖 INICIANDO AUTO-ENTRENAMIENTO...")
+    print("=============================================")
+    # Parámetros de auto-entrenamiento: 1 época, batch size 2, LR 5e-5
+    auto_train_result = train_lora(epochs=1, batch_size=2, learning_rate=5e-5)
+    print(f"\nFIN DEL AUTO-ENTRENAMIENTO: {auto_train_result}")
+    # 3. Lanzar la Interfaz Gradio
+    print("\n=============================================")
+    print("💻 LANZANDO INTERFAZ GRADIO")
+    print("=============================================")
+    demo.launch()