urgency-classifier-retraining

Runtime error

mr-kush commited on Oct 28, 2025

Commit

625fb41

1 Parent(s): 100c22a

Add dataset metadata handling in training pipeline

Files changed (1) hide show

train_model.py CHANGED Viewed

@@ -22,10 +22,12 @@ def run_grievance_training_pipeline():
         print(f"[{time.strftime('%H:%M:%S')}] Loading dataset from hub: {configs.dataset_repo_id} ...", flush=True)
-        dataset = load_dataset_from_hub(
             model_repo=configs.dataset_repo_id,
             hf_token=configs.hf_token
         )
         # Print dataset splits and sizes if available
         def _safe_len(split):
@@ -55,6 +57,7 @@ def run_grievance_training_pipeline():
             train_dataset=dataset['train'],
             eval_dataset=dataset['eval'],
             test_dataset=dataset['test'],
             space_repo_id=configs.space_repo_id,
             hf_training_args={"hub_model_id": configs.hub_model_id},
             api_endpoint=configs.api_endpoint,

         print(f"[{time.strftime('%H:%M:%S')}] Loading dataset from hub: {configs.dataset_repo_id} ...", flush=True)
+        data = load_dataset_from_hub(
             model_repo=configs.dataset_repo_id,
             hf_token=configs.hf_token
         )
+        dataset = data['dataset']
+        dataset_metadata = data['metadata']
         # Print dataset splits and sizes if available
         def _safe_len(split):
             train_dataset=dataset['train'],
             eval_dataset=dataset['eval'],
             test_dataset=dataset['test'],
+            dataset_metadata= dataset_metadata,
             space_repo_id=configs.space_repo_id,
             hf_training_args={"hub_model_id": configs.hub_model_id},
             api_endpoint=configs.api_endpoint,