Spaces:

Andro0s
/

AmorCoderAI-Train

Runtime error

App Files Files Community

Andro0s commited on Oct 21

Commit

932f265

verified ·

1 Parent(s): 8a66252

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -44

app.py CHANGED Viewed

@@ -8,25 +8,27 @@ from peft import get_peft_model, LoraConfig, TaskType, PeftModel
 # ============================================================
 # ⚙️ CONFIGURACIÓN GLOBAL
 # ============================================================
-BASE_MODEL = "bigcode/santacoder"  # Modelo a refinar
-LORA_PATH = "./lora_output"        # Directorio para guardar los adaptadores
-DATASET_PATH = "tu_dataset.json"   # ¡Asegúrate de que este archivo exista!
-# Variables globales inicializadas como None
 tokenizer = None
 lora_model = None
 tokenized_dataset = None
 lora_generator = None
 # ============================================================
-# 🔐 AUTENTICACIÓN Y PRE-CARGA
 # ============================================================
 def setup_resources():
     """Carga y configura todos los recursos (modelo, tokenizer, dataset) una sola vez."""
     global tokenizer, lora_model, tokenized_dataset
-    # 1. Autenticación
     hf_token = os.environ.get("HF_TOKEN")
     if hf_token:
         login(token=hf_token)
@@ -34,9 +36,8 @@ def setup_resources():
         print("⚠️ Token no encontrado. La app intentará correr sin autenticación de escritura.")
     # 2. Carga del Tokenizer y Modelo Base
-    print("\n🔄 Cargando modelo y tokenizer...")
     tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
-    # Usa device_map="auto" para cargar el modelo de forma eficiente en la(s) GPU
     base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
     if tokenizer.pad_token is None:
@@ -48,22 +49,23 @@ def setup_resources():
         r=8,
         lora_alpha=32,
         lora_dropout=0.1,
-        # 'c_proj' y 'c_attn' son comunes en modelos GPT/causales
-        target_modules=["c_proj", "c_attn"],
     )
     lora_model = get_peft_model(base_model, peft_config)
     print(f"✅ Modelo LoRA preparado. Parámetros entrenables: {lora_model.print_trainable_parameters()}")
-    # 4. Carga y Tokenización del Dataset (para evitar errores de longitud)
-    print("📚 Cargando y tokenizando dataset...")
     try:
         raw_dataset = load_dataset("json", data_files=DATASET_PATH)
         tokenized_dataset = raw_dataset.map(
             lambda e: tokenizer(
                 e["prompt"] + e["completion"],
                 truncation=True,
                 padding="max_length",
-                max_length=256 # Mantener esta longitud consistente para evitar errores
             ),
             batched=True,
             remove_columns=raw_dataset["train"].column_names
@@ -71,21 +73,22 @@ def setup_resources():
         print("✅ Dataset tokenizado correctamente.")
     except Exception as e:
         tokenized_dataset = None
-        print(f"❌ Error al cargar o tokenizar el dataset. El auto-entrenamiento fallará. {e}")
 # ============================================================
 # 🧩 FUNCIÓN DE ENTRENAMIENTO
 # ============================================================
-def train_lora(epochs=1, batch_size=2, learning_rate=5e-5):
     """Ejecuta el entrenamiento del modelo LoRA."""
     global lora_model, tokenized_dataset, lora_generator
     if tokenized_dataset is None or "train" not in tokenized_dataset:
         return "❌ Error: El dataset no pudo cargarse o está vacío. No se puede entrenar."
     try:
-        # Re-inicializa el generador a None para que se recargue después del entrenamiento
         lora_generator = None
         data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
@@ -98,8 +101,6 @@ def train_lora(epochs=1, batch_size=2, learning_rate=5e-5):
             save_total_limit=1,
             logging_steps=10,
             push_to_hub=False,
-            # Desactiva la evaluación para simplificar el auto-entrenamiento
-            disable_tqdm=True
         )
         trainer = Trainer(
@@ -111,11 +112,11 @@ def train_lora(epochs=1, batch_size=2, learning_rate=5e-5):
         trainer.train()
-        # Guardar solo los adaptadores LoRA (PEFT)
         lora_model.save_pretrained(LORA_PATH)
         tokenizer.save_pretrained(LORA_PATH)
-        return "✅ Entrenamiento completado y adaptadores LoRA guardados en **./lora_output**"
     except Exception as e:
         return f"❌ Error durante el entrenamiento: {e}"
@@ -124,47 +125,50 @@ def train_lora(epochs=1, batch_size=2, learning_rate=5e-5):
 # ============================================================
 def generate_text(prompt_text):
     """Genera texto usando el modelo base + adaptadores LoRA."""
-    global lora_generator, lora_model
     try:
-        # Carga el generador SOLO la primera vez o después del entrenamiento
         if lora_generator is None:
-            # Cargar el modelo base limpio (sin los adaptadores LoRA)
             base_model_gen = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
-            # Aplicar los adaptadores guardados
             if os.path.exists(LORA_PATH):
                 model_with_lora = PeftModel.from_pretrained(base_model_gen, LORA_PATH)
             else:
-                # Si no hay adaptadores entrenados, usa el modelo base inicial
-                model_with_lora = lora_model if lora_model else base_model_gen
-            # Fusionar el modelo base y los adaptadores para una inferencia más rápida
-            final_model = model_with_lora.merge_and_unload()
             lora_generator = pipeline("text-generation", model=final_model, tokenizer=tokenizer)
-        output = lora_generator(prompt_text, max_new_tokens=100, temperature=0.7, top_p=0.9)
         return output[0]["generated_text"]
     except Exception as e:
-        return f"❌ Error generando texto (Asegúrate de que el modelo base y/o LoRA estén cargados): {e}"
 # ============================================================
 # 💻 INTERFAZ GRADIO
 # ============================================================
 with gr.Blocks(title="AmorCoderAI - LoRA") as demo:
     gr.Markdown("# 💙 AmorCoderAI - Entrenamiento y Pruebas LoRA")
-    gr.Markdown(f"Modelo base: `{BASE_MODEL}`. Adaptadores guardados en `{LORA_PATH}`.")
-    with gr.Tab("🧠 Entrenar"):
-        gr.Markdown("--- **¡CUIDADO!** El entrenamiento es lento y consume muchos recursos. ---")
         epochs = gr.Number(value=1, label="Épocas", precision=0)
-        batch_size = gr.Number(value=2, label="Tamaño de lote (ajusta según tu RAM/VRAM)", precision=0)
         learning_rate = gr.Number(value=5e-5, label="Tasa de aprendizaje")
-        train_button = gr.Button("🚀 Iniciar entrenamiento Manual")
         train_output = gr.Textbox(label="Resultado del Entrenamiento Manual")
         train_button.click(
             train_lora,
             inputs=[epochs, batch_size, learning_rate],
@@ -172,24 +176,24 @@ with gr.Blocks(title="AmorCoderAI - LoRA") as demo:
         )
     with gr.Tab("✨ Probar modelo"):
-        prompt = gr.Textbox(label="Escribe código (ej: 'def bubble_sort(arr):')", lines=4)
         generate_button = gr.Button("💬 Generar código")
         output_box = gr.Textbox(label="Salida generada", lines=10)
         generate_button.click(generate_text, inputs=prompt, outputs=output_box)
 # ============================================================
-# 🚀 LANZAR APP Y AUTO-ENTRENAMIENTO
 # ============================================================
 if __name__ == "__main__":
-    # 1. Cargar recursos
     setup_resources()
-    # 2. AUTO-ENTRENAMIENTO (¡El código se 'autocorre' aquí!)
     print("\n=============================================")
-    print("🤖 INICIANDO AUTO-ENTRENAMIENTO...")
     print("=============================================")
-    # Parámetros de auto-entrenamiento: 1 época, batch size 2, LR 5e-5
     auto_train_result = train_lora(epochs=1, batch_size=2, learning_rate=5e-5)
     print(f"\nFIN DEL AUTO-ENTRENAMIENTO: {auto_train_result}")
@@ -199,4 +203,3 @@ if __name__ == "__main__":
     print("💻 LANZANDO INTERFAZ GRADIO")
     print("=============================================")
     demo.launch()

 # ============================================================
 # ⚙️ CONFIGURACIÓN GLOBAL
 # ============================================================
+# Modelo base para generación de código
+BASE_MODEL = "bigcode/santacoder"
+LORA_PATH = "./lora_output"        # Directorio para guardar los adaptadores LoRA
+DATASET_PATH = "tu_dataset.json"   # ¡Cambia esto por el nombre de tu archivo JSON!
+MAX_TOKEN_LENGTH = 256             # Longitud de secuencia uniforme (corrige errores de tamaño)
+# Variables globales para acceso a recursos
 tokenizer = None
 lora_model = None
 tokenized_dataset = None
 lora_generator = None
 # ============================================================
+# 🔐 AUTENTICACIÓN Y PRE-CARGA DE RECURSOS (SINGLETON)
 # ============================================================
 def setup_resources():
     """Carga y configura todos los recursos (modelo, tokenizer, dataset) una sola vez."""
     global tokenizer, lora_model, tokenized_dataset
+    # 1. Autenticación con Hugging Face
     hf_token = os.environ.get("HF_TOKEN")
     if hf_token:
         login(token=hf_token)
         print("⚠️ Token no encontrado. La app intentará correr sin autenticación de escritura.")
     # 2. Carga del Tokenizer y Modelo Base
+    print("\n🔄 Cargando modelo y tokenizer una sola vez...")
     tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
     base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
     if tokenizer.pad_token is None:
         r=8,
         lora_alpha=32,
         lora_dropout=0.1,
+        target_modules=["c_proj", "c_attn"], # Adaptado para modelos causales tipo GPT/Santacoder
     )
+    # Envuelve el modelo base con la configuración LoRA
     lora_model = get_peft_model(base_model, peft_config)
     print(f"✅ Modelo LoRA preparado. Parámetros entrenables: {lora_model.print_trainable_parameters()}")
+    # 4. Carga y Tokenización del Dataset (para eficiencia)
+    print("📚 Cargando y tokenizando dataset (esto solo se hace una vez)...")
     try:
         raw_dataset = load_dataset("json", data_files=DATASET_PATH)
+        # Tokenización rápida con batched=True
         tokenized_dataset = raw_dataset.map(
             lambda e: tokenizer(
                 e["prompt"] + e["completion"],
                 truncation=True,
                 padding="max_length",
+                max_length=MAX_TOKEN_LENGTH
             ),
             batched=True,
             remove_columns=raw_dataset["train"].column_names
         print("✅ Dataset tokenizado correctamente.")
     except Exception as e:
         tokenized_dataset = None
+        print(f"❌ Error al cargar o tokenizar el dataset. Asegúrate que '{DATASET_PATH}' exista. {e}")
 # ============================================================
 # 🧩 FUNCIÓN DE ENTRENAMIENTO
 # ============================================================
+def train_lora(epochs, batch_size, learning_rate):
     """Ejecuta el entrenamiento del modelo LoRA."""
     global lora_model, tokenized_dataset, lora_generator
+    # Verifica si el dataset está disponible
     if tokenized_dataset is None or "train" not in tokenized_dataset:
         return "❌ Error: El dataset no pudo cargarse o está vacío. No se puede entrenar."
     try:
+        # Reinicia el generador para que cargue el modelo entrenado en el siguiente test
         lora_generator = None
         data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
             save_total_limit=1,
             logging_steps=10,
             push_to_hub=False,
         )
         trainer = Trainer(
         trainer.train()
+        # Guarda SOLAMENTE los adaptadores LoRA (archivos pequeños)
         lora_model.save_pretrained(LORA_PATH)
         tokenizer.save_pretrained(LORA_PATH)
+        return f"✅ Entrenamiento completado. Adaptadores LoRA guardados en **{LORA_PATH}**"
     except Exception as e:
         return f"❌ Error durante el entrenamiento: {e}"
 # ============================================================
 def generate_text(prompt_text):
     """Genera texto usando el modelo base + adaptadores LoRA."""
+    global lora_generator
     try:
+        # Carga el generador SOLAMENTE si no ha sido cargado aún
         if lora_generator is None:
+            # 1. Cargar el modelo base
             base_model_gen = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
+            # 2. Aplicar adaptadores LoRA si existen
             if os.path.exists(LORA_PATH):
                 model_with_lora = PeftModel.from_pretrained(base_model_gen, LORA_PATH)
             else:
+                # Si no hay LoRA, usa el modelo base (solo si está cargado globalmente)
+                model_with_lora = base_model_gen
+            # 3. Fusionar el modelo base y los adaptadores para una inferencia más rápida
+            final_model = model_with_lora.merge_and_unload()
+            final_model.eval() # Poner en modo evaluación
+            # 4. Inicializar el pipeline global
             lora_generator = pipeline("text-generation", model=final_model, tokenizer=tokenizer)
+        # Generar la respuesta
+        output = lora_generator(prompt_text, max_new_tokens=150, temperature=0.7, top_p=0.9)
         return output[0]["generated_text"]
     except Exception as e:
+        return f"❌ Error generando texto (Asegúrate de que el modelo base/LoRA esté cargado): {e}"
 # ============================================================
 # 💻 INTERFAZ GRADIO
 # ============================================================
 with gr.Blocks(title="AmorCoderAI - LoRA") as demo:
     gr.Markdown("# 💙 AmorCoderAI - Entrenamiento y Pruebas LoRA")
+    gr.Markdown(f"Modelo base: `{BASE_MODEL}`. Adaptadores guardados en `{LORA_PATH}`. **El auto-entrenamiento se ejecuta al iniciar.**")
+    with gr.Tab("🧠 Entrenar (Manual)"):
+        gr.Markdown("--- **¡CUIDADO!** El entrenamiento es lento y consume muchos recursos (VRAM/RAM). ---")
         epochs = gr.Number(value=1, label="Épocas", precision=0)
+        batch_size = gr.Number(value=2, label="Tamaño de lote (ajusta según tu VRAM)", precision=0)
         learning_rate = gr.Number(value=5e-5, label="Tasa de aprendizaje")
+        train_button = gr.Button("🚀 Iniciar Entrenamiento Manual")
         train_output = gr.Textbox(label="Resultado del Entrenamiento Manual")
         train_button.click(
             train_lora,
             inputs=[epochs, batch_size, learning_rate],
         )
     with gr.Tab("✨ Probar modelo"):
+        prompt = gr.Textbox(label="Escribe código (ej: 'def fibonacci(n):')", lines=4)
         generate_button = gr.Button("💬 Generar código")
         output_box = gr.Textbox(label="Salida generada", lines=10)
         generate_button.click(generate_text, inputs=prompt, outputs=output_box)
 # ============================================================
+# �� LANZAR APP Y AUTO-ENTRENAMIENTO (¡AQUÍ SUCEDE LA MAGIA!)
 # ============================================================
 if __name__ == "__main__":
+    # 1. Cargar todos los recursos globales
     setup_resources()
+    # 2. AUTO-ENTRENAMIENTO (Se ejecuta con valores por defecto)
     print("\n=============================================")
+    print("🤖 INICIANDO AUTO-ENTRENAMIENTO (1 Época, 2 Batch Size)")
     print("=============================================")
+    # Parámetros por defecto para el auto-entrenamiento
     auto_train_result = train_lora(epochs=1, batch_size=2, learning_rate=5e-5)
     print(f"\nFIN DEL AUTO-ENTRENAMIENTO: {auto_train_result}")
     print("💻 LANZANDO INTERFAZ GRADIO")
     print("=============================================")
     demo.launch()