End of training

Browse files

Files changed (5) hide show

README.md +9 -7
all_results.json +15 -15
eval_results.json +10 -10
train_results.json +6 -6
trainer_state.json +356 -483

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ library_name: transformers
 license: other
 base_model: nvidia/mit-b0
 tags:
 - generated_from_trainer
 datasets:
 - generator
@@ -16,16 +18,16 @@ should probably proofread and complete it, then remove this comment. -->
 # autocrop-bilder
-This model is a fine-tuned version of [nvidia/mit-b0](https://huggingface.co/nvidia/mit-b0) on the generator dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1091
-- Mean Iou: 0.4907
-- Mean Accuracy: 0.9814
-- Overall Accuracy: 0.9814
 - Accuracy Background: nan
-- Accuracy Crop: 0.9814
 - Iou Background: 0.0
-- Iou Crop: 0.9814
 ## Model description

 license: other
 base_model: nvidia/mit-b0
 tags:
+- image-segmentation
+- vision
 - generated_from_trainer
 datasets:
 - generator
 # autocrop-bilder
+This model is a fine-tuned version of [nvidia/mit-b0](https://huggingface.co/nvidia/mit-b0) on the /mnt/disk1/autocrop-data/datasets/bilder/ dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1087
+- Mean Iou: 0.4908
+- Mean Accuracy: 0.9816
+- Overall Accuracy: 0.9816
 - Accuracy Background: nan
+- Accuracy Crop: 0.9816
 - Iou Background: 0.0
+- Iou Crop: 0.9816
 ## Model description

all_results.json CHANGED Viewed

@@ -1,19 +1,19 @@
 {
-    "epoch": 25.0,
     "eval_accuracy_background": NaN,
-    "eval_accuracy_crop": 0.9927992276007593,
     "eval_iou_background": 0.0,
-    "eval_iou_crop": 0.9927992276007593,
-    "eval_loss": 0.01961207203567028,
-    "eval_mean_accuracy": 0.9927992276007593,
-    "eval_mean_iou": 0.49639961380037967,
-    "eval_overall_accuracy": 0.9927992276007593,
-    "eval_runtime": 14.9481,
-    "eval_samples_per_second": 59.004,
-    "eval_steps_per_second": 7.426,
-    "total_flos": 2.1901180424159232e+18,
-    "train_loss": 0.0420909201965332,
-    "train_runtime": 1897.2835,
-    "train_samples_per_second": 131.715,
-    "train_steps_per_second": 16.471
 }

 {
+    "epoch": 31.0,
     "eval_accuracy_background": NaN,
+    "eval_accuracy_crop": 0.9816317254805985,
     "eval_iou_background": 0.0,
+    "eval_iou_crop": 0.9816317254805985,
+    "eval_loss": 0.1087288111448288,
+    "eval_mean_accuracy": 0.9816317254805985,
+    "eval_mean_iou": 0.49081586274029926,
+    "eval_overall_accuracy": 0.9816317254805985,
+    "eval_runtime": 0.6022,
+    "eval_samples_per_second": 16.605,
+    "eval_steps_per_second": 3.321,
+    "total_flos": 2.7711697679548416e+16,
+    "train_loss": 0.13814654548047325,
+    "train_runtime": 56.09,
+    "train_samples_per_second": 45.463,
+    "train_steps_per_second": 6.24
 }

eval_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 25.0,
     "eval_accuracy_background": NaN,
-    "eval_accuracy_crop": 0.9927992276007593,
     "eval_iou_background": 0.0,
-    "eval_iou_crop": 0.9927992276007593,
-    "eval_loss": 0.01961207203567028,
-    "eval_mean_accuracy": 0.9927992276007593,
-    "eval_mean_iou": 0.49639961380037967,
-    "eval_overall_accuracy": 0.9927992276007593,
-    "eval_runtime": 14.9481,
-    "eval_samples_per_second": 59.004,
-    "eval_steps_per_second": 7.426
 }

 {
+    "epoch": 31.0,
     "eval_accuracy_background": NaN,
+    "eval_accuracy_crop": 0.9816317254805985,
     "eval_iou_background": 0.0,
+    "eval_iou_crop": 0.9816317254805985,
+    "eval_loss": 0.1087288111448288,
+    "eval_mean_accuracy": 0.9816317254805985,
+    "eval_mean_iou": 0.49081586274029926,
+    "eval_overall_accuracy": 0.9816317254805985,
+    "eval_runtime": 0.6022,
+    "eval_samples_per_second": 16.605,
+    "eval_steps_per_second": 3.321
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 25.0,
-    "total_flos": 2.1901180424159232e+18,
-    "train_loss": 0.0420909201965332,
-    "train_runtime": 1897.2835,
-    "train_samples_per_second": 131.715,
-    "train_steps_per_second": 16.471
 }

 {
+    "epoch": 31.0,
+    "total_flos": 2.7711697679548416e+16,
+    "train_loss": 0.13814654548047325,
+    "train_runtime": 56.09,
+    "train_samples_per_second": 45.463,
+    "train_steps_per_second": 6.24
 }

trainer_state.json CHANGED Viewed

@@ -1,618 +1,491 @@
 {
-  "best_global_step": 13750,
-  "best_metric": 0.01961207203567028,
-  "best_model_checkpoint": "trainer_output/checkpoint-13750",
-  "epoch": 25.0,
   "eval_steps": 500,
-  "global_step": 15625,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
-    {
-      "epoch": 0.8,
-      "grad_norm": 1.1524319648742676,
-      "learning_rate": 9.5808e-06,
-      "loss": 0.43339532470703124,
-      "step": 500
-    },
     {
       "epoch": 1.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9768196565895517,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9768196565895517,
-      "eval_loss": 0.10140044242143631,
-      "eval_mean_accuracy": 0.9768196565895517,
-      "eval_mean_iou": 0.48840982829477586,
-      "eval_overall_accuracy": 0.9768196565895517,
-      "eval_runtime": 16.2848,
-      "eval_samples_per_second": 54.161,
-      "eval_steps_per_second": 6.816,
-      "step": 625
-    },
-    {
-      "epoch": 1.6,
-      "grad_norm": 0.8539880514144897,
-      "learning_rate": 1.91808e-05,
-      "loss": 0.11356404113769532,
-      "step": 1000
     },
     {
       "epoch": 2.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.988345679319867,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.988345679319867,
-      "eval_loss": 0.05029028654098511,
-      "eval_mean_accuracy": 0.988345679319867,
-      "eval_mean_iou": 0.4941728396599335,
-      "eval_overall_accuracy": 0.988345679319867,
-      "eval_runtime": 14.8084,
-      "eval_samples_per_second": 59.561,
-      "eval_steps_per_second": 7.496,
-      "step": 1250
-    },
-    {
-      "epoch": 2.4,
-      "grad_norm": 0.45036041736602783,
-      "learning_rate": 2.87808e-05,
-      "loss": 0.06263476181030274,
-      "step": 1500
     },
     {
       "epoch": 3.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9903214677470595,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9903214677470595,
-      "eval_loss": 0.03654526174068451,
-      "eval_mean_accuracy": 0.9903214677470595,
-      "eval_mean_iou": 0.49516073387352977,
-      "eval_overall_accuracy": 0.9903214677470595,
-      "eval_runtime": 15.7287,
-      "eval_samples_per_second": 56.076,
-      "eval_steps_per_second": 7.057,
-      "step": 1875
-    },
-    {
-      "epoch": 3.2,
-      "grad_norm": 0.3090341091156006,
-      "learning_rate": 3.8380800000000004e-05,
-      "loss": 0.04462788009643555,
-      "step": 2000
-    },
-    {
-      "epoch": 4.0,
-      "grad_norm": 0.24643999338150024,
-      "learning_rate": 4.79808e-05,
-      "loss": 0.03756232452392578,
-      "step": 2500
     },
     {
       "epoch": 4.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9913295270743318,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9913295270743318,
-      "eval_loss": 0.030365047976374626,
-      "eval_mean_accuracy": 0.9913295270743318,
-      "eval_mean_iou": 0.4956647635371659,
-      "eval_overall_accuracy": 0.9913295270743318,
-      "eval_runtime": 13.4769,
-      "eval_samples_per_second": 65.445,
-      "eval_steps_per_second": 8.236,
-      "step": 2500
-    },
-    {
-      "epoch": 4.8,
-      "grad_norm": 0.5337187647819519,
-      "learning_rate": 5.75808e-05,
-      "loss": 0.03314236831665039,
-      "step": 3000
     },
     {
       "epoch": 5.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9890027583743638,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9890027583743638,
-      "eval_loss": 0.027659796178340912,
-      "eval_mean_accuracy": 0.9890027583743638,
-      "eval_mean_iou": 0.4945013791871819,
-      "eval_overall_accuracy": 0.9890027583743638,
-      "eval_runtime": 14.1791,
-      "eval_samples_per_second": 62.204,
-      "eval_steps_per_second": 7.828,
-      "step": 3125
-    },
-    {
-      "epoch": 5.6,
-      "grad_norm": 0.49186381697654724,
-      "learning_rate": 5.9973825042635214e-05,
-      "loss": 0.031177324295043947,
-      "step": 3500
     },
     {
       "epoch": 6.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9922120865322441,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9922120865322441,
-      "eval_loss": 0.02575760707259178,
-      "eval_mean_accuracy": 0.9922120865322441,
-      "eval_mean_iou": 0.49610604326612207,
-      "eval_overall_accuracy": 0.9922120865322441,
-      "eval_runtime": 15.0604,
-      "eval_samples_per_second": 58.564,
-      "eval_steps_per_second": 7.37,
-      "step": 3750
-    },
-    {
-      "epoch": 6.4,
-      "grad_norm": 0.26261016726493835,
-      "learning_rate": 5.985714881662627e-05,
-      "loss": 0.028994924545288087,
-      "step": 4000
     },
     {
       "epoch": 7.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.994066035736691,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.994066035736691,
-      "eval_loss": 0.025171734392642975,
-      "eval_mean_accuracy": 0.994066035736691,
-      "eval_mean_iou": 0.4970330178683455,
-      "eval_overall_accuracy": 0.994066035736691,
-      "eval_runtime": 13.3769,
-      "eval_samples_per_second": 65.935,
-      "eval_steps_per_second": 8.298,
-      "step": 4375
-    },
-    {
-      "epoch": 7.2,
-      "grad_norm": 0.3545992374420166,
-      "learning_rate": 5.9647363918899715e-05,
-      "loss": 0.028564287185668946,
-      "step": 4500
-    },
-    {
-      "epoch": 8.0,
-      "grad_norm": 0.3758007884025574,
-      "learning_rate": 5.9345124557708774e-05,
-      "loss": 0.027177539825439453,
-      "step": 5000
     },
     {
       "epoch": 8.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9899967291210848,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9899967291210848,
-      "eval_loss": 0.024666031822562218,
-      "eval_mean_accuracy": 0.9899967291210848,
-      "eval_mean_iou": 0.4949983645605424,
-      "eval_overall_accuracy": 0.9899967291210848,
-      "eval_runtime": 12.936,
-      "eval_samples_per_second": 68.182,
-      "eval_steps_per_second": 8.581,
-      "step": 5000
-    },
-    {
-      "epoch": 8.8,
-      "grad_norm": 0.22928953170776367,
-      "learning_rate": 5.895137325792861e-05,
-      "loss": 0.026362817764282228,
-      "step": 5500
     },
     {
       "epoch": 9.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9925482629257046,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9925482629257046,
-      "eval_loss": 0.023219820111989975,
-      "eval_mean_accuracy": 0.9925482629257046,
-      "eval_mean_iou": 0.4962741314628523,
-      "eval_overall_accuracy": 0.9925482629257046,
-      "eval_runtime": 12.8673,
-      "eval_samples_per_second": 68.546,
-      "eval_steps_per_second": 8.627,
-      "step": 5625
-    },
-    {
-      "epoch": 9.6,
-      "grad_norm": 0.3915350139141083,
-      "learning_rate": 5.846733792181926e-05,
-      "loss": 0.02600261688232422,
-      "step": 6000
     },
     {
       "epoch": 10.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9927480206245599,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9927480206245599,
-      "eval_loss": 0.02302992343902588,
-      "eval_mean_accuracy": 0.9927480206245599,
-      "eval_mean_iou": 0.49637401031227996,
-      "eval_overall_accuracy": 0.9927480206245599,
-      "eval_runtime": 14.5996,
-      "eval_samples_per_second": 60.412,
-      "eval_steps_per_second": 7.603,
-      "step": 6250
-    },
-    {
-      "epoch": 10.4,
-      "grad_norm": 0.26642245054244995,
-      "learning_rate": 5.78945279998472e-05,
-      "loss": 0.025672937393188478,
-      "step": 6500
     },
     {
       "epoch": 11.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9937102307036272,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9937102307036272,
-      "eval_loss": 0.022344686090946198,
-      "eval_mean_accuracy": 0.9937102307036272,
-      "eval_mean_iou": 0.4968551153518136,
-      "eval_overall_accuracy": 0.9937102307036272,
-      "eval_runtime": 14.6595,
-      "eval_samples_per_second": 60.166,
-      "eval_steps_per_second": 7.572,
-      "step": 6875
-    },
-    {
-      "epoch": 11.2,
-      "grad_norm": 0.5744491815567017,
-      "learning_rate": 5.723472978350694e-05,
-      "loss": 0.024709026336669923,
-      "step": 7000
-    },
-    {
-      "epoch": 12.0,
-      "grad_norm": 0.16804039478302002,
-      "learning_rate": 5.649000083482167e-05,
-      "loss": 0.024350887298583986,
-      "step": 7500
     },
     {
       "epoch": 12.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9931893459362804,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9931893459362804,
-      "eval_loss": 0.021655429154634476,
-      "eval_mean_accuracy": 0.9931893459362804,
-      "eval_mean_iou": 0.4965946729681402,
-      "eval_overall_accuracy": 0.9931893459362804,
-      "eval_runtime": 14.9256,
-      "eval_samples_per_second": 59.093,
-      "eval_steps_per_second": 7.437,
-      "step": 7500
-    },
-    {
-      "epoch": 12.8,
-      "grad_norm": 0.2182096242904663,
-      "learning_rate": 5.566266356989437e-05,
-      "loss": 0.02396395683288574,
-      "step": 8000
     },
     {
       "epoch": 13.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9920321818804473,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9920321818804473,
-      "eval_loss": 0.022262275218963623,
-      "eval_mean_accuracy": 0.9920321818804473,
-      "eval_mean_iou": 0.49601609094022364,
-      "eval_overall_accuracy": 0.9920321818804473,
-      "eval_runtime": 14.7545,
-      "eval_samples_per_second": 59.778,
-      "eval_steps_per_second": 7.523,
-      "step": 8125
-    },
-    {
-      "epoch": 13.6,
-      "grad_norm": 0.2837521731853485,
-      "learning_rate": 5.4755298016519184e-05,
-      "loss": 0.023011560440063476,
-      "step": 8500
     },
     {
       "epoch": 14.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9943180523216922,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9943180523216922,
-      "eval_loss": 0.022013485431671143,
-      "eval_mean_accuracy": 0.9943180523216922,
-      "eval_mean_iou": 0.4971590261608461,
-      "eval_overall_accuracy": 0.9943180523216922,
-      "eval_runtime": 14.3463,
-      "eval_samples_per_second": 61.479,
-      "eval_steps_per_second": 7.737,
-      "step": 8750
-    },
-    {
-      "epoch": 14.4,
-      "grad_norm": 0.2068459540605545,
-      "learning_rate": 5.3770733768437804e-05,
-      "loss": 0.022984485626220703,
-      "step": 9000
     },
     {
       "epoch": 15.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9925804513700699,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9925804513700699,
-      "eval_loss": 0.021278690546751022,
-      "eval_mean_accuracy": 0.9925804513700699,
-      "eval_mean_iou": 0.49629022568503495,
-      "eval_overall_accuracy": 0.9925804513700699,
-      "eval_runtime": 15.0289,
-      "eval_samples_per_second": 58.687,
-      "eval_steps_per_second": 7.386,
-      "step": 9375
-    },
-    {
-      "epoch": 15.2,
-      "grad_norm": 0.28135085105895996,
-      "learning_rate": 5.271204116133174e-05,
-      "loss": 0.022900413513183594,
-      "step": 9500
-    },
-    {
-      "epoch": 16.0,
-      "grad_norm": 0.3188186287879944,
-      "learning_rate": 5.158252169806754e-05,
-      "loss": 0.02281988716125488,
-      "step": 10000
     },
     {
       "epoch": 16.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9927684136520576,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9927684136520576,
-      "eval_loss": 0.02082865871489048,
-      "eval_mean_accuracy": 0.9927684136520576,
-      "eval_mean_iou": 0.4963842068260288,
-      "eval_overall_accuracy": 0.9927684136520576,
-      "eval_runtime": 14.8833,
-      "eval_samples_per_second": 59.261,
-      "eval_steps_per_second": 7.458,
-      "step": 10000
-    },
-    {
-      "epoch": 16.8,
-      "grad_norm": 0.2763194143772125,
-      "learning_rate": 5.038569775305373e-05,
-      "loss": 0.02196409034729004,
-      "step": 10500
     },
     {
       "epoch": 17.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.993036650688435,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.993036650688435,
-      "eval_loss": 0.020577579736709595,
-      "eval_mean_accuracy": 0.993036650688435,
-      "eval_mean_iou": 0.4965183253442175,
-      "eval_overall_accuracy": 0.993036650688435,
-      "eval_runtime": 14.9738,
-      "eval_samples_per_second": 58.903,
-      "eval_steps_per_second": 7.413,
-      "step": 10625
-    },
-    {
-      "epoch": 17.6,
-      "grad_norm": 0.20888900756835938,
-      "learning_rate": 4.912530158781619e-05,
-      "loss": 0.02165799331665039,
-      "step": 11000
     },
     {
       "epoch": 18.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9920524486787513,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9920524486787513,
-      "eval_loss": 0.020513063296675682,
-      "eval_mean_accuracy": 0.9920524486787513,
-      "eval_mean_iou": 0.49602622433937565,
-      "eval_overall_accuracy": 0.9920524486787513,
-      "eval_runtime": 14.9673,
-      "eval_samples_per_second": 58.929,
-      "eval_steps_per_second": 7.416,
-      "step": 11250
-    },
-    {
-      "epoch": 18.4,
-      "grad_norm": 0.23501233756542206,
-      "learning_rate": 4.780526371204638e-05,
-      "loss": 0.021172378540039064,
-      "step": 11500
     },
     {
       "epoch": 19.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9915265427945928,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9915265427945928,
-      "eval_loss": 0.020704658702015877,
-      "eval_mean_accuracy": 0.9915265427945928,
-      "eval_mean_iou": 0.4957632713972964,
-      "eval_overall_accuracy": 0.9915265427945928,
-      "eval_runtime": 14.982,
-      "eval_samples_per_second": 58.871,
-      "eval_steps_per_second": 7.409,
-      "step": 11875
-    },
-    {
-      "epoch": 19.2,
-      "grad_norm": 1.4721801280975342,
-      "learning_rate": 4.642970062641836e-05,
-      "loss": 0.02130653762817383,
-      "step": 12000
-    },
-    {
-      "epoch": 20.0,
-      "grad_norm": 0.5824402570724487,
-      "learning_rate": 4.5002901985398264e-05,
-      "loss": 0.02092706298828125,
-      "step": 12500
     },
     {
       "epoch": 20.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9945885825217533,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9945885825217533,
-      "eval_loss": 0.02044781483709812,
-      "eval_mean_accuracy": 0.9945885825217533,
-      "eval_mean_iou": 0.49729429126087665,
-      "eval_overall_accuracy": 0.9945885825217533,
-      "eval_runtime": 14.9609,
-      "eval_samples_per_second": 58.954,
-      "eval_steps_per_second": 7.419,
-      "step": 12500
-    },
-    {
-      "epoch": 20.8,
-      "grad_norm": 0.17007386684417725,
-      "learning_rate": 4.3529317220078455e-05,
-      "loss": 0.020286674499511718,
-      "step": 13000
     },
     {
       "epoch": 21.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9937273277466255,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9937273277466255,
-      "eval_loss": 0.019753679633140564,
-      "eval_mean_accuracy": 0.9937273277466255,
-      "eval_mean_iou": 0.49686366387331277,
-      "eval_overall_accuracy": 0.9937273277466255,
-      "eval_runtime": 14.9415,
-      "eval_samples_per_second": 59.03,
-      "eval_steps_per_second": 7.429,
-      "step": 13125
-    },
-    {
-      "epoch": 21.6,
-      "grad_norm": 0.4324241876602173,
-      "learning_rate": 4.2013541662752865e-05,
-      "loss": 0.020156242370605468,
-      "step": 13500
     },
     {
       "epoch": 22.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9927992276007593,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9927992276007593,
-      "eval_loss": 0.01961207203567028,
-      "eval_mean_accuracy": 0.9927992276007593,
-      "eval_mean_iou": 0.49639961380037967,
-      "eval_overall_accuracy": 0.9927992276007593,
-      "eval_runtime": 15.1325,
-      "eval_samples_per_second": 58.285,
-      "eval_steps_per_second": 7.335,
-      "step": 13750
-    },
-    {
-      "epoch": 22.4,
-      "grad_norm": 0.1799526959657669,
-      "learning_rate": 4.0460302216503615e-05,
-      "loss": 0.020241693496704103,
-      "step": 14000
     },
     {
       "epoch": 23.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9942146776248755,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9942146776248755,
-      "eval_loss": 0.020346596837043762,
-      "eval_mean_accuracy": 0.9942146776248755,
-      "eval_mean_iou": 0.49710733881243774,
-      "eval_overall_accuracy": 0.9942146776248755,
-      "eval_runtime": 15.1085,
-      "eval_samples_per_second": 58.378,
-      "eval_steps_per_second": 7.347,
-      "step": 14375
-    },
-    {
-      "epoch": 23.2,
-      "grad_norm": 0.19619110226631165,
-      "learning_rate": 3.887444261448782e-05,
-      "loss": 0.019864578247070313,
-      "step": 14500
-    },
-    {
-      "epoch": 24.0,
-      "grad_norm": 0.24014325439929962,
-      "learning_rate": 3.726090831489309e-05,
-      "loss": 0.01975071907043457,
-      "step": 15000
     },
     {
       "epoch": 24.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9932115552616192,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9932115552616192,
-      "eval_loss": 0.01964355632662773,
-      "eval_mean_accuracy": 0.9932115552616192,
-      "eval_mean_iou": 0.4966057776308096,
-      "eval_overall_accuracy": 0.9932115552616192,
-      "eval_runtime": 14.9831,
-      "eval_samples_per_second": 58.866,
-      "eval_steps_per_second": 7.408,
-      "step": 15000
-    },
-    {
-      "epoch": 24.8,
-      "grad_norm": 0.17266370356082916,
-      "learning_rate": 3.5624731078666494e-05,
-      "loss": 0.01938687515258789,
-      "step": 15500
     },
     {
       "epoch": 25.0,
       "eval_accuracy_background": NaN,
-      "eval_accuracy_crop": 0.9932365837056147,
       "eval_iou_background": 0.0,
-      "eval_iou_crop": 0.9932365837056147,
-      "eval_loss": 0.019678112119436264,
-      "eval_mean_accuracy": 0.9932365837056147,
-      "eval_mean_iou": 0.49661829185280737,
-      "eval_overall_accuracy": 0.9932365837056147,
-      "eval_runtime": 15.0672,
-      "eval_samples_per_second": 58.538,
-      "eval_steps_per_second": 7.367,
-      "step": 15625
-    },
-    {
-      "epoch": 25.0,
-      "step": 15625,
-      "total_flos": 2.1901180424159232e+18,
-      "train_loss": 0.0420909201965332,
-      "train_runtime": 1897.2835,
-      "train_samples_per_second": 131.715,
-      "train_steps_per_second": 16.471
     }
   ],
   "logging_steps": 500,
-  "max_steps": 31250,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
@@ -637,7 +510,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.1901180424159232e+18,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 196,
+  "best_metric": 0.1087288111448288,
+  "best_model_checkpoint": "trainer_output/checkpoint-196",
+  "epoch": 31.0,
   "eval_steps": 500,
+  "global_step": 217,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.6798034240092841,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.6798034240092841,
+      "eval_loss": 0.6694175601005554,
+      "eval_mean_accuracy": 0.6798034240092841,
+      "eval_mean_iou": 0.33990171200464203,
+      "eval_overall_accuracy": 0.6798034240092841,
+      "eval_runtime": 0.9318,
+      "eval_samples_per_second": 10.732,
+      "eval_steps_per_second": 2.146,
+      "step": 7
     },
     {
       "epoch": 2.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9246364650670945,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9246364650670945,
+      "eval_loss": 0.5930418968200684,
+      "eval_mean_accuracy": 0.9246364650670945,
+      "eval_mean_iou": 0.46231823253354726,
+      "eval_overall_accuracy": 0.9246364650670945,
+      "eval_runtime": 0.5622,
+      "eval_samples_per_second": 17.787,
+      "eval_steps_per_second": 3.557,
+      "step": 14
     },
     {
       "epoch": 3.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9411854547997284,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9411854547997284,
+      "eval_loss": 0.4609629511833191,
+      "eval_mean_accuracy": 0.9411854547997284,
+      "eval_mean_iou": 0.4705927273998642,
+      "eval_overall_accuracy": 0.9411854547997284,
+      "eval_runtime": 0.5875,
+      "eval_samples_per_second": 17.022,
+      "eval_steps_per_second": 3.404,
+      "step": 21
     },
     {
       "epoch": 4.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9410732062778207,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9410732062778207,
+      "eval_loss": 0.3075406551361084,
+      "eval_mean_accuracy": 0.9410732062778207,
+      "eval_mean_iou": 0.4705366031389103,
+      "eval_overall_accuracy": 0.9410732062778207,
+      "eval_runtime": 0.5543,
+      "eval_samples_per_second": 18.04,
+      "eval_steps_per_second": 3.608,
+      "step": 28
     },
     {
       "epoch": 5.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9417221622132219,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9417221622132219,
+      "eval_loss": 0.20374695956707,
+      "eval_mean_accuracy": 0.9417221622132219,
+      "eval_mean_iou": 0.47086108110661096,
+      "eval_overall_accuracy": 0.9417221622132219,
+      "eval_runtime": 0.5695,
+      "eval_samples_per_second": 17.559,
+      "eval_steps_per_second": 3.512,
+      "step": 35
     },
     {
       "epoch": 6.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9323693454807089,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9323693454807089,
+      "eval_loss": 0.16684319078922272,
+      "eval_mean_accuracy": 0.9323693454807089,
+      "eval_mean_iou": 0.46618467274035447,
+      "eval_overall_accuracy": 0.9323693454807089,
+      "eval_runtime": 0.5262,
+      "eval_samples_per_second": 19.005,
+      "eval_steps_per_second": 3.801,
+      "step": 42
     },
     {
       "epoch": 7.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9503174547678327,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9503174547678327,
+      "eval_loss": 0.1420690268278122,
+      "eval_mean_accuracy": 0.9503174547678327,
+      "eval_mean_iou": 0.47515872738391635,
+      "eval_overall_accuracy": 0.9503174547678327,
+      "eval_runtime": 0.5946,
+      "eval_samples_per_second": 16.818,
+      "eval_steps_per_second": 3.364,
+      "step": 49
     },
     {
       "epoch": 8.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9546798126247078,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9546798126247078,
+      "eval_loss": 0.13820314407348633,
+      "eval_mean_accuracy": 0.9546798126247078,
+      "eval_mean_iou": 0.4773399063123539,
+      "eval_overall_accuracy": 0.9546798126247078,
+      "eval_runtime": 0.5971,
+      "eval_samples_per_second": 16.748,
+      "eval_steps_per_second": 3.35,
+      "step": 56
     },
     {
       "epoch": 9.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9473266143698963,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9473266143698963,
+      "eval_loss": 0.15878096222877502,
+      "eval_mean_accuracy": 0.9473266143698963,
+      "eval_mean_iou": 0.47366330718494815,
+      "eval_overall_accuracy": 0.9473266143698963,
+      "eval_runtime": 0.5896,
+      "eval_samples_per_second": 16.962,
+      "eval_steps_per_second": 3.392,
+      "step": 63
     },
     {
       "epoch": 10.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9690187945735507,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9690187945735507,
+      "eval_loss": 0.13168753683567047,
+      "eval_mean_accuracy": 0.9690187945735507,
+      "eval_mean_iou": 0.48450939728677533,
+      "eval_overall_accuracy": 0.9690187945735507,
+      "eval_runtime": 0.5435,
+      "eval_samples_per_second": 18.4,
+      "eval_steps_per_second": 3.68,
+      "step": 70
     },
     {
       "epoch": 11.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9671203837795366,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9671203837795366,
+      "eval_loss": 0.13073985278606415,
+      "eval_mean_accuracy": 0.9671203837795366,
+      "eval_mean_iou": 0.4835601918897683,
+      "eval_overall_accuracy": 0.9671203837795366,
+      "eval_runtime": 0.5417,
+      "eval_samples_per_second": 18.459,
+      "eval_steps_per_second": 3.692,
+      "step": 77
     },
     {
       "epoch": 12.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9797731843801581,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9797731843801581,
+      "eval_loss": 0.13279679417610168,
+      "eval_mean_accuracy": 0.9797731843801581,
+      "eval_mean_iou": 0.4898865921900791,
+      "eval_overall_accuracy": 0.9797731843801581,
+      "eval_runtime": 0.5591,
+      "eval_samples_per_second": 17.887,
+      "eval_steps_per_second": 3.577,
+      "step": 84
     },
     {
       "epoch": 13.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9725408219658703,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9725408219658703,
+      "eval_loss": 0.12647856771945953,
+      "eval_mean_accuracy": 0.9725408219658703,
+      "eval_mean_iou": 0.48627041098293516,
+      "eval_overall_accuracy": 0.9725408219658703,
+      "eval_runtime": 0.5658,
+      "eval_samples_per_second": 17.675,
+      "eval_steps_per_second": 3.535,
+      "step": 91
     },
     {
       "epoch": 14.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9771607993812224,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9771607993812224,
+      "eval_loss": 0.12825439870357513,
+      "eval_mean_accuracy": 0.9771607993812224,
+      "eval_mean_iou": 0.4885803996906112,
+      "eval_overall_accuracy": 0.9771607993812224,
+      "eval_runtime": 0.5494,
+      "eval_samples_per_second": 18.201,
+      "eval_steps_per_second": 3.64,
+      "step": 98
     },
     {
       "epoch": 15.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.977466875951889,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.977466875951889,
+      "eval_loss": 0.1286262422800064,
+      "eval_mean_accuracy": 0.977466875951889,
+      "eval_mean_iou": 0.4887334379759445,
+      "eval_overall_accuracy": 0.977466875951889,
+      "eval_runtime": 0.5651,
+      "eval_samples_per_second": 17.697,
+      "eval_steps_per_second": 3.539,
+      "step": 105
     },
     {
       "epoch": 16.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9788175384941892,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9788175384941892,
+      "eval_loss": 0.12346808612346649,
+      "eval_mean_accuracy": 0.9788175384941892,
+      "eval_mean_iou": 0.4894087692470946,
+      "eval_overall_accuracy": 0.9788175384941892,
+      "eval_runtime": 0.5641,
+      "eval_samples_per_second": 17.727,
+      "eval_steps_per_second": 3.545,
+      "step": 112
     },
     {
       "epoch": 17.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9795486873363426,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9795486873363426,
+      "eval_loss": 0.12134357541799545,
+      "eval_mean_accuracy": 0.9795486873363426,
+      "eval_mean_iou": 0.4897743436681713,
+      "eval_overall_accuracy": 0.9795486873363426,
+      "eval_runtime": 0.5708,
+      "eval_samples_per_second": 17.52,
+      "eval_steps_per_second": 3.504,
+      "step": 119
     },
     {
       "epoch": 18.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9820856266074387,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9820856266074387,
+      "eval_loss": 0.1223326101899147,
+      "eval_mean_accuracy": 0.9820856266074387,
+      "eval_mean_iou": 0.49104281330371935,
+      "eval_overall_accuracy": 0.9820856266074387,
+      "eval_runtime": 0.5809,
+      "eval_samples_per_second": 17.214,
+      "eval_steps_per_second": 3.443,
+      "step": 126
     },
     {
       "epoch": 19.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9763290562352828,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9763290562352828,
+      "eval_loss": 0.11792740970849991,
+      "eval_mean_accuracy": 0.9763290562352828,
+      "eval_mean_iou": 0.4881645281176414,
+      "eval_overall_accuracy": 0.9763290562352828,
+      "eval_runtime": 0.5496,
+      "eval_samples_per_second": 18.195,
+      "eval_steps_per_second": 3.639,
+      "step": 133
     },
     {
       "epoch": 20.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9828934479372341,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9828934479372341,
+      "eval_loss": 0.11694834381341934,
+      "eval_mean_accuracy": 0.9828934479372341,
+      "eval_mean_iou": 0.49144672396861705,
+      "eval_overall_accuracy": 0.9828934479372341,
+      "eval_runtime": 0.5655,
+      "eval_samples_per_second": 17.684,
+      "eval_steps_per_second": 3.537,
+      "step": 140
     },
     {
       "epoch": 21.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9816378592796099,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9816378592796099,
+      "eval_loss": 0.11534647643566132,
+      "eval_mean_accuracy": 0.9816378592796099,
+      "eval_mean_iou": 0.49081892963980495,
+      "eval_overall_accuracy": 0.9816378592796099,
+      "eval_runtime": 0.5715,
+      "eval_samples_per_second": 17.497,
+      "eval_steps_per_second": 3.499,
+      "step": 147
     },
     {
       "epoch": 22.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9803834973817879,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9803834973817879,
+      "eval_loss": 0.11552004516124725,
+      "eval_mean_accuracy": 0.9803834973817879,
+      "eval_mean_iou": 0.49019174869089394,
+      "eval_overall_accuracy": 0.9803834973817879,
+      "eval_runtime": 0.5635,
+      "eval_samples_per_second": 17.745,
+      "eval_steps_per_second": 3.549,
+      "step": 154
     },
     {
       "epoch": 23.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9838576811418189,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9838576811418189,
+      "eval_loss": 0.11426303535699844,
+      "eval_mean_accuracy": 0.9838576811418189,
+      "eval_mean_iou": 0.49192884057090946,
+      "eval_overall_accuracy": 0.9838576811418189,
+      "eval_runtime": 0.5699,
+      "eval_samples_per_second": 17.546,
+      "eval_steps_per_second": 3.509,
+      "step": 161
     },
     {
       "epoch": 24.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9825499551925982,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9825499551925982,
+      "eval_loss": 0.11150294542312622,
+      "eval_mean_accuracy": 0.9825499551925982,
+      "eval_mean_iou": 0.4912749775962991,
+      "eval_overall_accuracy": 0.9825499551925982,
+      "eval_runtime": 0.5714,
+      "eval_samples_per_second": 17.502,
+      "eval_steps_per_second": 3.5,
+      "step": 168
     },
     {
       "epoch": 25.0,
       "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9840711373474141,
       "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9840711373474141,
+      "eval_loss": 0.11130404472351074,
+      "eval_mean_accuracy": 0.9840711373474141,
+      "eval_mean_iou": 0.49203556867370707,
+      "eval_overall_accuracy": 0.9840711373474141,
+      "eval_runtime": 0.571,
+      "eval_samples_per_second": 17.514,
+      "eval_steps_per_second": 3.503,
+      "step": 175
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.984569201827136,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.984569201827136,
+      "eval_loss": 0.11055157333612442,
+      "eval_mean_accuracy": 0.984569201827136,
+      "eval_mean_iou": 0.492284600913568,
+      "eval_overall_accuracy": 0.984569201827136,
+      "eval_runtime": 0.5673,
+      "eval_samples_per_second": 17.626,
+      "eval_steps_per_second": 3.525,
+      "step": 182
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9813649052236045,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9813649052236045,
+      "eval_loss": 0.10974361002445221,
+      "eval_mean_accuracy": 0.9813649052236045,
+      "eval_mean_iou": 0.49068245261180227,
+      "eval_overall_accuracy": 0.9813649052236045,
+      "eval_runtime": 0.5718,
+      "eval_samples_per_second": 17.49,
+      "eval_steps_per_second": 3.498,
+      "step": 189
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9816317254805985,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9816317254805985,
+      "eval_loss": 0.1087288111448288,
+      "eval_mean_accuracy": 0.9816317254805985,
+      "eval_mean_iou": 0.49081586274029926,
+      "eval_overall_accuracy": 0.9816317254805985,
+      "eval_runtime": 0.5686,
+      "eval_samples_per_second": 17.588,
+      "eval_steps_per_second": 3.518,
+      "step": 196
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9839582754456052,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9839582754456052,
+      "eval_loss": 0.10943397134542465,
+      "eval_mean_accuracy": 0.9839582754456052,
+      "eval_mean_iou": 0.4919791377228026,
+      "eval_overall_accuracy": 0.9839582754456052,
+      "eval_runtime": 0.5769,
+      "eval_samples_per_second": 17.334,
+      "eval_steps_per_second": 3.467,
+      "step": 203
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9821169089823966,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9821169089823966,
+      "eval_loss": 0.10927335917949677,
+      "eval_mean_accuracy": 0.9821169089823966,
+      "eval_mean_iou": 0.4910584544911983,
+      "eval_overall_accuracy": 0.9821169089823966,
+      "eval_runtime": 0.5836,
+      "eval_samples_per_second": 17.134,
+      "eval_steps_per_second": 3.427,
+      "step": 210
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy_background": NaN,
+      "eval_accuracy_crop": 0.9813661319834068,
+      "eval_iou_background": 0.0,
+      "eval_iou_crop": 0.9813661319834068,
+      "eval_loss": 0.10906684398651123,
+      "eval_mean_accuracy": 0.9813661319834068,
+      "eval_mean_iou": 0.4906830659917034,
+      "eval_overall_accuracy": 0.9813661319834068,
+      "eval_runtime": 0.5612,
+      "eval_samples_per_second": 17.82,
+      "eval_steps_per_second": 3.564,
+      "step": 217
+    },
+    {
+      "epoch": 31.0,
+      "step": 217,
+      "total_flos": 2.7711697679548416e+16,
+      "train_loss": 0.13814654548047325,
+      "train_runtime": 56.09,
+      "train_samples_per_second": 45.463,
+      "train_steps_per_second": 6.24
     }
   ],
   "logging_steps": 500,
+  "max_steps": 350,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 2.7711697679548416e+16,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null