Training in progress, epoch 1

Browse files

Files changed (5) hide show

all_results.json +13 -0
eval_results.json +8 -0
model.safetensors +1 -1
train_results.json +8 -0
trainer_state.json +313 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 30.0,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.0019323596497997642,
+    "eval_runtime": 0.4972,
+    "eval_samples_per_second": 20.114,
+    "eval_steps_per_second": 2.011,
+    "total_flos": 8918092191375360.0,
+    "train_loss": 0.0005863850936293602,
+    "train_runtime": 162.4577,
+    "train_samples_per_second": 2.585,
+    "train_steps_per_second": 0.185
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 30.0,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.0019323596497997642,
+    "eval_runtime": 0.4972,
+    "eval_samples_per_second": 20.114,
+    "eval_steps_per_second": 2.011
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89b84b2118b2b3b144bb1eff7d92e88635169d2bccebf1f80bd192bbe3601eb3
 size 94294756

 version https://git-lfs.github.com/spec/v1
+oid sha256:e528fb14c305af83f68c4c19e3bf6e8d5b953440e2e4db2dffeec7a1fc6ec362
 size 94294756

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 30.0,
+    "total_flos": 8918092191375360.0,
+    "train_loss": 0.0005863850936293602,
+    "train_runtime": 162.4577,
+    "train_samples_per_second": 2.585,
+    "train_steps_per_second": 0.185
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,313 @@

+{
+  "best_global_step": 1,
+  "best_metric": 1.0,
+  "best_model_checkpoint": "./resnet50-finetuned-coco/checkpoint-1",
+  "epoch": 30.0,
+  "eval_steps": 500,
+  "global_step": 30,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0019323596497997642,
+      "eval_runtime": 4.4987,
+      "eval_samples_per_second": 2.223,
+      "eval_steps_per_second": 0.222,
+      "step": 1
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0014340047491714358,
+      "eval_runtime": 0.5098,
+      "eval_samples_per_second": 19.614,
+      "eval_steps_per_second": 1.961,
+      "step": 2
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0010718145640566945,
+      "eval_runtime": 0.5032,
+      "eval_samples_per_second": 19.874,
+      "eval_steps_per_second": 1.987,
+      "step": 3
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0008249193197116256,
+      "eval_runtime": 0.6956,
+      "eval_samples_per_second": 14.377,
+      "eval_steps_per_second": 1.438,
+      "step": 4
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0011749675031751394,
+      "eval_runtime": 0.7554,
+      "eval_samples_per_second": 13.237,
+      "eval_steps_per_second": 1.324,
+      "step": 5
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0019186580320820212,
+      "eval_runtime": 0.4856,
+      "eval_samples_per_second": 20.595,
+      "eval_steps_per_second": 2.06,
+      "step": 6
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.002705862745642662,
+      "eval_runtime": 0.4973,
+      "eval_samples_per_second": 20.11,
+      "eval_steps_per_second": 2.011,
+      "step": 7
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.00382140651345253,
+      "eval_runtime": 0.802,
+      "eval_samples_per_second": 12.47,
+      "eval_steps_per_second": 1.247,
+      "step": 8
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.005335311871021986,
+      "eval_runtime": 0.502,
+      "eval_samples_per_second": 19.922,
+      "eval_steps_per_second": 1.992,
+      "step": 9
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006471132393926382,
+      "eval_runtime": 0.4806,
+      "eval_samples_per_second": 20.808,
+      "eval_steps_per_second": 2.081,
+      "step": 10
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.007191370241343975,
+      "eval_runtime": 0.898,
+      "eval_samples_per_second": 11.135,
+      "eval_steps_per_second": 1.114,
+      "step": 11
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.007900777272880077,
+      "eval_runtime": 0.4922,
+      "eval_samples_per_second": 20.316,
+      "eval_steps_per_second": 2.032,
+      "step": 12
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.00863733608275652,
+      "eval_runtime": 0.4715,
+      "eval_samples_per_second": 21.209,
+      "eval_steps_per_second": 2.121,
+      "step": 13
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.010232715867459774,
+      "eval_runtime": 0.505,
+      "eval_samples_per_second": 19.802,
+      "eval_steps_per_second": 1.98,
+      "step": 14
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.011720546521246433,
+      "eval_runtime": 0.5554,
+      "eval_samples_per_second": 18.005,
+      "eval_steps_per_second": 1.801,
+      "step": 15
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.012477124109864235,
+      "eval_runtime": 0.5068,
+      "eval_samples_per_second": 19.732,
+      "eval_steps_per_second": 1.973,
+      "step": 16
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.01326531171798706,
+      "eval_runtime": 0.4999,
+      "eval_samples_per_second": 20.005,
+      "eval_steps_per_second": 2.001,
+      "step": 17
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.012465937063097954,
+      "eval_runtime": 0.4736,
+      "eval_samples_per_second": 21.114,
+      "eval_steps_per_second": 2.111,
+      "step": 18
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.011286773718893528,
+      "eval_runtime": 0.4807,
+      "eval_samples_per_second": 20.805,
+      "eval_steps_per_second": 2.08,
+      "step": 19
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.010712802410125732,
+      "eval_runtime": 0.4988,
+      "eval_samples_per_second": 20.049,
+      "eval_steps_per_second": 2.005,
+      "step": 20
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.00999603420495987,
+      "eval_runtime": 0.4827,
+      "eval_samples_per_second": 20.719,
+      "eval_steps_per_second": 2.072,
+      "step": 21
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.009599635377526283,
+      "eval_runtime": 0.7185,
+      "eval_samples_per_second": 13.918,
+      "eval_steps_per_second": 1.392,
+      "step": 22
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.009064934216439724,
+      "eval_runtime": 0.4758,
+      "eval_samples_per_second": 21.016,
+      "eval_steps_per_second": 2.102,
+      "step": 23
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.00888894684612751,
+      "eval_runtime": 0.5421,
+      "eval_samples_per_second": 18.446,
+      "eval_steps_per_second": 1.845,
+      "step": 24
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.008358614519238472,
+      "eval_runtime": 0.4808,
+      "eval_samples_per_second": 20.8,
+      "eval_steps_per_second": 2.08,
+      "step": 25
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.007842540740966797,
+      "eval_runtime": 0.5519,
+      "eval_samples_per_second": 18.12,
+      "eval_steps_per_second": 1.812,
+      "step": 26
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.007688184734433889,
+      "eval_runtime": 0.4658,
+      "eval_samples_per_second": 21.469,
+      "eval_steps_per_second": 2.147,
+      "step": 27
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.007302085869014263,
+      "eval_runtime": 0.4838,
+      "eval_samples_per_second": 20.671,
+      "eval_steps_per_second": 2.067,
+      "step": 28
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.006760203279554844,
+      "eval_runtime": 0.4878,
+      "eval_samples_per_second": 20.498,
+      "eval_steps_per_second": 2.05,
+      "step": 29
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.005953826941549778,
+      "eval_runtime": 0.8908,
+      "eval_samples_per_second": 11.225,
+      "eval_steps_per_second": 1.123,
+      "step": 30
+    },
+    {
+      "epoch": 30.0,
+      "step": 30,
+      "total_flos": 8918092191375360.0,
+      "train_loss": 0.0005863850936293602,
+      "train_runtime": 162.4577,
+      "train_samples_per_second": 2.585,
+      "train_steps_per_second": 0.185
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 30,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 30,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 8918092191375360.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}