Spaces:

Andro0s
/

AmorCoderAI-Train

Runtime error

Andro0s commited on Oct 21

Commit

0b03e03

verified ·

1 Parent(s): bafda90

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,10 +9,14 @@ import json
 # ============================================================
 # ⚙️ CONFIGURACIÓN GLOBAL
 # ============================================================
 BASE_MODEL = "bigcode/santacoder"
-LORA_PATH = "./lora_output"
 DATASET_FILE = "codesearchnet_lora_dataset.json"
-MAX_TOKEN_LENGTH = 256
 NUM_SAMPLES_TO_PROCESS = 5000
 DEFAULT_EPOCHS = 5 # <--- ¡ENTRENAMIENTO PROFUNDO!
@@ -97,9 +101,4 @@ def setup_resources():
         target_modules=["c_proj", "c_attn"],
     )
     lora_model = get_peft_model(base_model, peft_config)
-    print(f"✅ Modelo LoRA preparado. Parámetros entrenables: {lora_model.print_trainable_parameters()}")
-    # 5. Carga y Tokenización del Dataset
-    print(f"📚 Cargando y tokenizando dataset de: {DATASET_FILE}...")
-    try:
-        raw_dataset = load_dataset("json", data_files=DATASET_FILE)

 # ============================================================
 # ⚙️ CONFIGURACIÓN GLOBAL
 # ============================================================
+# Modelo base para generación de código
 BASE_MODEL = "bigcode/santacoder"
+LORA_PATH = "./lora_output"        # Directorio para guardar los adaptadores LoRA
+# Nombre del archivo donde se guardará el dataset procesado
 DATASET_FILE = "codesearchnet_lora_dataset.json"
+MAX_TOKEN_LENGTH = 256             # Longitud de secuencia uniforme
+# Usamos un número manejable (5000) para entornos limitados como un móvil/Spaces
 NUM_SAMPLES_TO_PROCESS = 5000
 DEFAULT_EPOCHS = 5 # <--- ¡ENTRENAMIENTO PROFUNDO!
         target_modules=["c_proj", "c_attn"],
     )
     lora_model = get_peft_model(base_model, peft_config)
+    print(f"✅ Modelo LoRA preparado. Parámetr