Spaces:

habeebCycle
/

Beit-Retinal

Sleeping

App Files Files Community

Habeeb Okunade commited on Aug 18, 2025

Commit

785b8f1

1 Parent(s): 238cd9e

Update Training script

Browse files

Files changed (1) hide show

train2.py +31 -13

train2.py CHANGED Viewed

@@ -27,6 +27,9 @@ os.makedirs(OUTPUT_DIR, exist_ok=True)
 print("🔹 Loading dataset from 'data/' folder...")
 dataset = load_dataset("imagefolder", data_dir="data")
 print(f"🔹 Dataset loaded. Columns: {dataset['train'].column_names}")
 # ----------------------------
 # PREPROCESSOR
@@ -35,18 +38,33 @@ print(f"🔹 Loading processor from {MODEL_NAME}...")
 processor = AutoImageProcessor.from_pretrained(MODEL_NAME)
 def transform(example):
-    # Determine correct image column
     image_column = "image" if "image" in example else list(example.keys())[0]
-    img = example[image_column]
-    if isinstance(img, str):  # if path, open it
-        img = Image.open(img).convert("RGB")
-    elif isinstance(img, Image.Image):
-        img = img.convert("RGB")
-    else:
-        raise ValueError(f"Unknown type for image: {type(img)}")
-    inputs = processor(img, return_tensors="pt")
-    inputs["label"] = example["label"]
     return inputs
 print("🔹 Applying transform to dataset...")
@@ -80,7 +98,7 @@ def compute_metrics(eval_pred):
     return metrics
 # ----------------------------
-# TRAINING ARGS
 # ----------------------------
 args = TrainingArguments(
     output_dir=OUTPUT_DIR,
@@ -117,7 +135,7 @@ trainer.train()
 print("🔹 Training complete.")
 # ----------------------------
-# SAVE FINAL MODEL + LABELS
 # ----------------------------
 print("🔹 Saving final model and processor...")
 trainer.save_model(OUTPUT_DIR)

 print("🔹 Loading dataset from 'data/' folder...")
 dataset = load_dataset("imagefolder", data_dir="data")
 print(f"🔹 Dataset loaded. Columns: {dataset['train'].column_names}")
+print(f"🔹 Dataset splits: {list(dataset.keys())}")
+print(f"🔹 Number of training samples: {len(dataset['train'])}")
+print(f"🔹 Number of validation samples: {len(dataset['validation'])}")
 # ----------------------------
 # PREPROCESSOR
 processor = AutoImageProcessor.from_pretrained(MODEL_NAME)
 def transform(example):
+    # Determine image column
     image_column = "image" if "image" in example else list(example.keys())[0]
+    images = example[image_column]
+    # Ensure list
+    if not isinstance(images, list):
+        images = [images]
+    processed_images = []
+    for img in images:
+        if isinstance(img, str):
+            img = Image.open(img).convert("RGB")
+        elif isinstance(img, Image.Image):
+            img = img.convert("RGB")
+        else:
+            raise ValueError(f"Unknown type for image: {type(img)}")
+        processed_images.append(img)
+    # Convert images to tensors
+    inputs = processor(images=processed_images, return_tensors="pt")
+    # Handle labels
+    labels = example["label"]
+    if not isinstance(labels, list):
+        labels = [labels]
+    inputs["labels"] = torch.tensor(labels)
     return inputs
 print("🔹 Applying transform to dataset...")
     return metrics
 # ----------------------------
+# TRAINING ARGUMENTS
 # ----------------------------
 args = TrainingArguments(
     output_dir=OUTPUT_DIR,
 print("🔹 Training complete.")
 # ----------------------------
+# SAVE MODEL + PROCESSOR + LABELS
 # ----------------------------
 print("🔹 Saving final model and processor...")
 trainer.save_model(OUTPUT_DIR)