Spaces:

mr-kush
/

department-classifier-retraining

Paused

mr-kush commited on Oct 28, 2025

Commit

d82407f

1 Parent(s): f7d6bbd

Add dataset metadata parameter to GrievanceClassifier for improved logging

Files changed (1) hide show

model_pipeline.py CHANGED Viewed

@@ -563,6 +563,7 @@ class GrievanceClassifier:
         train_dataset,
         eval_dataset,
         test_dataset,
         space_repo_id: str | None = None,
         hf_training_args: dict | None = None,
         api_endpoint: str | None = None,
@@ -578,6 +579,7 @@ class GrievanceClassifier:
             train_dataset: Hugging Face Dataset for training.
             eval_dataset: Hugging Face Dataset for validation.
             test_dataset: Hugging Face Dataset for testing.
             hf_training_args (dict, optional): Hugging Face TrainingArguments overrides.
             api_endpoint (str, optional): Endpoint of deployed model to compare F1.
             space_repo_id (str): HF Space Repo Id.
@@ -589,6 +591,7 @@ class GrievanceClassifier:
             dict: Contains evaluation metrics, decision, and deployed F1 (if applicable).
         """
         self.space_repo_id= space_repo_id
         # 1. Initialize W&B run
         wandb.init(
@@ -597,6 +600,7 @@ class GrievanceClassifier:
             config={
                 "model_checkpoint": self.model_checkpoint,
                 "num_labels": self.num_labels,
             }
         )

         train_dataset,
         eval_dataset,
         test_dataset,
+        dataset_metadata: dict,
         space_repo_id: str | None = None,
         hf_training_args: dict | None = None,
         api_endpoint: str | None = None,
             train_dataset: Hugging Face Dataset for training.
             eval_dataset: Hugging Face Dataset for validation.
             test_dataset: Hugging Face Dataset for testing.
+            dataset_metadata: Metadata about Data for Logging
             hf_training_args (dict, optional): Hugging Face TrainingArguments overrides.
             api_endpoint (str, optional): Endpoint of deployed model to compare F1.
             space_repo_id (str): HF Space Repo Id.
             dict: Contains evaluation metrics, decision, and deployed F1 (if applicable).
         """
         self.space_repo_id= space_repo_id
+        self.dataset_metadata = dataset_metadata
         # 1. Initialize W&B run
         wandb.init(
             config={
                 "model_checkpoint": self.model_checkpoint,
                 "num_labels": self.num_labels,
+                "dataset_metadata": self.dataset_metadata
             }
         )