Spaces:

GeorgeIbrahim
/

Data_Collection

Sleeping

GeorgeIbrahim commited on Nov 8, 2024

Commit

7da9aa9

1 Parent(s): d7e002e

updates

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,14 +25,15 @@ try:
     dataset = load_dataset(dataset_name, split="train")
     print("Loaded existing dataset:", dataset)
     print("Dataset features:", dataset.features)  # Check if 'split' is part of features
     # Check if the 'split' column exists; if not, add it
     if 'split' not in dataset.column_names:
-        # Define the 'split' values based on `image_id`
-        print(results)
-        print(example["image_id"] in results)
         split_values = [
-            "dev" if example["image_id"] in results else "train"
             for example in dataset
         ]

     dataset = load_dataset(dataset_name, split="train")
     print("Loaded existing dataset:", dataset)
     print("Dataset features:", dataset.features)  # Check if 'split' is part of features
     # Check if the 'split' column exists; if not, add it
     if 'split' not in dataset.column_names:
+        match = re.search(r'_(\d+)\.', example["image_id"])
+        image_id = match.group(1).lstrip('0')
         split_values = [
+            "dev" if image_id in results else "train"
             for example in dataset
         ]