Spaces:

seier-brightside
/

vbernal_exp

Runtime error

App Files Files Community

seier-brightside commited on Nov 16, 2025

Commit

1459254

verified ·

1 Parent(s): 48f6c2b

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -12

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
-import gradio as gr
 import json
-from span_marker import SpanMarkerModel, SpanMarkerTrainer, SpanMarkerTrainingArguments
 from datasets import Dataset
 from sklearn.model_selection import train_test_split
 def entrenar(jsonl_file):
-    # Cargar JSONL
     raw = [json.loads(l) for l in jsonl_file.splitlines()]
     dataset = []
@@ -25,9 +25,9 @@ def entrenar(jsonl_file):
     # Extraer etiquetas
     labels = sorted(list({e["label"] for d in dataset for e in d["entities"]}))
-    labels.insert(0, "O")  # obligatorio
-    # Train/test
     train, test = train_test_split(dataset, test_size=0.2, random_state=42)
     train_ds = Dataset.from_list(train)
     test_ds = Dataset.from_list(test)
@@ -38,19 +38,18 @@ def entrenar(jsonl_file):
         labels=labels
     )
-    # Argumentos
     args = SpanMarkerTrainingArguments(
         output_dir="modelo_final",
         learning_rate=5e-5,
         per_device_train_batch_size=2,
         per_device_eval_batch_size=2,
-        num_train_epochs=3,
-        logging_steps=10,
         save_strategy="epoch",
-        evaluation_strategy="epoch"
     )
-    # Entrenador
     trainer = SpanMarkerTrainer(
         model=model,
         args=args,
@@ -60,13 +59,14 @@ def entrenar(jsonl_file):
     trainer.train()
-    return "Entrenamiento completado. El modelo está en /modelo_final"
 ui = gr.Interface(
     fn=entrenar,
-    inputs=gr.File(label="Sube tu archivo JSONL exportado de Label Studio"),
     outputs="text",
     title="Entrenamiento NER Médico con SpanMarker"
 )
 ui.launch()

+    import gradio as gr
 import json
+from span_marker import SpanMarkerModel, SpanMarkerTrainer
+from span_marker import SpanMarkerTrainingArguments
 from datasets import Dataset
 from sklearn.model_selection import train_test_split
 def entrenar(jsonl_file):
     raw = [json.loads(l) for l in jsonl_file.splitlines()]
     dataset = []
     # Extraer etiquetas
     labels = sorted(list({e["label"] for d in dataset for e in d["entities"]}))
+    labels.insert(0, "O")
+    # Datasets Hugging Face
     train, test = train_test_split(dataset, test_size=0.2, random_state=42)
     train_ds = Dataset.from_list(train)
     test_ds = Dataset.from_list(test)
         labels=labels
     )
+    # Args
     args = SpanMarkerTrainingArguments(
         output_dir="modelo_final",
+        num_train_epochs=3,
         learning_rate=5e-5,
         per_device_train_batch_size=2,
         per_device_eval_batch_size=2,
         save_strategy="epoch",
+        evaluation_strategy="epoch",
+        logging_steps=10
     )
     trainer = SpanMarkerTrainer(
         model=model,
         args=args,
     trainer.train()
+    return "¡Entrenamiento completado! Modelo guardado en /modelo_final"
 ui = gr.Interface(
     fn=entrenar,
+    inputs=gr.File(label="Sube tu JSONL exportado de Label Studio"),
     outputs="text",
     title="Entrenamiento NER Médico con SpanMarker"
 )
 ui.launch()