Training in progress, epoch 0

Browse files

Files changed (10) hide show

all_results.json +5 -5
config.json +58 -11
preprocessor_config.json +9 -8
pytorch_model.bin +2 -2
runs/Jul10_17-16-51_teesta/events.out.tfevents.1688989619.teesta.40693.0 +2 -2
runs/Jul10_18-44-31_teesta/1688994879.355163/events.out.tfevents.1688994879.teesta.6977.1 +3 -0
runs/Jul10_18-44-31_teesta/events.out.tfevents.1688994879.teesta.6977.0 +3 -0
train_results.json +5 -5
trainer_state.json +172 -172
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 19.73,
-    "total_flos": 2.8684782950326272e+17,
-    "train_loss": 0.7429648399353027,
-    "train_runtime": 749.9349,
-    "train_samples_per_second": 18.242,
-    "train_steps_per_second": 0.053
 }

 {
     "epoch": 19.73,
+    "total_flos": 1.0467617957139087e+18,
+    "train_loss": 0.13025596663355826,
+    "train_runtime": 778.539,
+    "train_samples_per_second": 17.571,
+    "train_steps_per_second": 0.051
 }

config.json CHANGED Viewed

@@ -1,32 +1,79 @@
 {
-  "_name_or_path": "google/vit-base-patch16-224",
   "architectures": [
-    "ViTForImageClassification"
   ],
   "attention_probs_dropout_prob": 0.0,
-  "encoder_stride": 16,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.0,
-  "hidden_size": 768,
   "id2label": {
     "0": "0",
     "1": "1"
   },
   "image_size": 224,
   "initializer_range": 0.02,
-  "intermediate_size": 3072,
   "label2id": {
     "0": "0",
     "1": "1"
   },
-  "layer_norm_eps": 1e-12,
-  "model_type": "vit",
-  "num_attention_heads": 12,
   "num_channels": 3,
-  "num_hidden_layers": 12,
-  "patch_size": 16,
   "problem_type": "single_label_classification",
-  "qkv_bias": true,
   "torch_dtype": "float32",
   "transformers_version": "4.24.0"
 }

 {
+  "_name_or_path": "nvidia/mit-b0",
   "architectures": [
+    "SegformerForImageClassification"
   ],
   "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout_prob": 0.1,
+  "decoder_hidden_size": 256,
+  "depths": [
+    2,
+    2,
+    2,
+    2
+  ],
+  "downsampling_rates": [
+    1,
+    4,
+    8,
+    16
+  ],
+  "drop_path_rate": 0.1,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.0,
+  "hidden_sizes": [
+    32,
+    64,
+    160,
+    256
+  ],
   "id2label": {
     "0": "0",
     "1": "1"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "label2id": {
     "0": "0",
     "1": "1"
   },
+  "layer_norm_eps": 1e-06,
+  "mlp_ratios": [
+    4,
+    4,
+    4,
+    4
+  ],
+  "model_type": "segformer",
+  "num_attention_heads": [
+    1,
+    2,
+    5,
+    8
+  ],
   "num_channels": 3,
+  "num_encoder_blocks": 4,
+  "patch_sizes": [
+    7,
+    3,
+    3,
+    3
+  ],
   "problem_type": "single_label_classification",
+  "reshape_last_stage": true,
+  "semantic_loss_ignore_index": 255,
+  "sr_ratios": [
+    8,
+    4,
+    2,
+    1
+  ],
+  "strides": [
+    4,
+    2,
+    2,
+    2
+  ],
   "torch_dtype": "float32",
   "transformers_version": "4.24.0"
 }

preprocessor_config.json CHANGED Viewed

@@ -1,17 +1,18 @@
 {
   "do_normalize": true,
   "do_resize": true,
-  "feature_extractor_type": "ViTFeatureExtractor",
   "image_mean": [
-    0.5,
-    0.5,
-    0.5
   ],
   "image_std": [
-    0.5,
-    0.5,
-    0.5
   ],
   "resample": 2,
-  "size": 224
 }

 {
   "do_normalize": true,
   "do_resize": true,
+  "feature_extractor_type": "SegformerFeatureExtractor",
   "image_mean": [
+    0.485,
+    0.456,
+    0.406
   ],
   "image_std": [
+    0.229,
+    0.224,
+    0.225
   ],
+  "reduce_labels": false,
   "resample": 2,
+  "size": 512
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:224dbd38a59daef862ff8fa079d716ec204db588af8e4fec55ac30f4cbcea941
-size 343268717

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c025b0f5f2d4657ee30064a00ccb79687a000bec30ee8c7d9598e4c133589d0
+size 13346069

runs/Jul10_17-16-51_teesta/events.out.tfevents.1688989619.teesta.40693.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb5e3920b732a5c13696b02fc8cc666c6d5c950c08707b4489efaa68067ceef1
-size 11981

 version https://git-lfs.github.com/spec/v1
+oid sha256:56520f237cd1741d0c2646cdfe5ce70c168ac03c523e7b5c1ab6e09f0016ad7d
+size 13872

runs/Jul10_18-44-31_teesta/1688994879.355163/events.out.tfevents.1688994879.teesta.6977.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:928f72464bf9a1d8b64a66ec6db0a226ce672259395c94cdaf10ca74a730a8c3
+size 5427

runs/Jul10_18-44-31_teesta/events.out.tfevents.1688994879.teesta.6977.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46b375bfef68a0ff2197730553438ae480eb207020337ca4dda51b979cd775ad
+size 4568

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 19.73,
-    "total_flos": 2.8684782950326272e+17,
-    "train_loss": 0.7429648399353027,
-    "train_runtime": 749.9349,
-    "train_samples_per_second": 18.242,
-    "train_steps_per_second": 0.053
 }

 {
     "epoch": 19.73,
+    "total_flos": 1.0467617957139087e+18,
+    "train_loss": 0.13025596663355826,
+    "train_runtime": 778.539,
+    "train_samples_per_second": 17.571,
+    "train_steps_per_second": 0.051
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8333333333333334,
-  "best_model_checkpoint": "test/checkpoint-34",
   "epoch": 19.727272727272727,
   "global_step": 40,
   "is_hyper_param_search": false,
@@ -9,281 +9,281 @@
   "log_history": [
     {
       "epoch": 0.73,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_f1": 0.770940170940171,
-      "eval_loss": 0.6720435619354248,
-      "eval_precision": 0.7695473251028806,
-      "eval_recall": 0.7777777777777778,
-      "eval_runtime": 7.169,
-      "eval_samples_per_second": 5.022,
-      "eval_steps_per_second": 0.139,
       "step": 2
     },
     {
       "epoch": 1.73,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_f1": 0.7613168724279835,
-      "eval_loss": 0.6651345491409302,
-      "eval_precision": 0.7690202517788725,
-      "eval_recall": 0.7777777777777778,
-      "eval_runtime": 5.928,
-      "eval_samples_per_second": 6.073,
-      "eval_steps_per_second": 0.169,
       "step": 4
     },
     {
       "epoch": 2.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.6119802984209763,
-      "eval_loss": 0.6359639763832092,
-      "eval_precision": 0.6429738562091504,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 4.9898,
-      "eval_samples_per_second": 7.215,
-      "eval_steps_per_second": 0.2,
       "step": 6
     },
     {
       "epoch": 3.73,
-      "eval_accuracy": 0.6666666666666666,
-      "eval_f1": 0.5555555555555556,
-      "eval_loss": 0.6130982041358948,
-      "eval_precision": 0.47619047619047616,
-      "eval_recall": 0.6666666666666666,
-      "eval_runtime": 5.5773,
-      "eval_samples_per_second": 6.455,
-      "eval_steps_per_second": 0.179,
       "step": 8
     },
     {
       "epoch": 4.73,
       "learning_rate": 0.0001,
-      "loss": 0.85,
       "step": 10
     },
     {
       "epoch": 4.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.569216757741348,
-      "eval_loss": 0.5958656668663025,
-      "eval_precision": 0.48225308641975306,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 5.3816,
-      "eval_samples_per_second": 6.689,
-      "eval_steps_per_second": 0.186,
       "step": 10
     },
     {
       "epoch": 5.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.569216757741348,
-      "eval_loss": 0.5696195960044861,
-      "eval_precision": 0.48225308641975306,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 5.4307,
-      "eval_samples_per_second": 6.629,
-      "eval_steps_per_second": 0.184,
       "step": 12
     },
     {
       "epoch": 6.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.569216757741348,
-      "eval_loss": 0.5393776297569275,
-      "eval_precision": 0.48225308641975306,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 5.3348,
-      "eval_samples_per_second": 6.748,
-      "eval_steps_per_second": 0.187,
       "step": 14
     },
     {
       "epoch": 7.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.569216757741348,
-      "eval_loss": 0.525506317615509,
-      "eval_precision": 0.48225308641975306,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 4.9234,
-      "eval_samples_per_second": 7.312,
-      "eval_steps_per_second": 0.203,
       "step": 16
     },
     {
       "epoch": 8.73,
-      "eval_accuracy": 0.7222222222222222,
-      "eval_f1": 0.6296296296296295,
-      "eval_loss": 0.5029427409172058,
-      "eval_precision": 0.8015873015873016,
-      "eval_recall": 0.7222222222222222,
-      "eval_runtime": 4.9254,
-      "eval_samples_per_second": 7.309,
-      "eval_steps_per_second": 0.203,
       "step": 18
     },
     {
       "epoch": 9.73,
       "learning_rate": 6.666666666666667e-05,
-      "loss": 0.7809,
       "step": 20
     },
     {
       "epoch": 9.73,
-      "eval_accuracy": 0.7222222222222222,
-      "eval_f1": 0.6296296296296295,
-      "eval_loss": 0.49091774225234985,
-      "eval_precision": 0.8015873015873016,
-      "eval_recall": 0.7222222222222222,
-      "eval_runtime": 5.0878,
-      "eval_samples_per_second": 7.076,
-      "eval_steps_per_second": 0.197,
       "step": 20
     },
     {
       "epoch": 10.73,
-      "eval_accuracy": 0.6944444444444444,
-      "eval_f1": 0.569216757741348,
-      "eval_loss": 0.47324174642562866,
-      "eval_precision": 0.48225308641975306,
-      "eval_recall": 0.6944444444444444,
-      "eval_runtime": 6.264,
-      "eval_samples_per_second": 5.747,
-      "eval_steps_per_second": 0.16,
       "step": 22
     },
     {
       "epoch": 11.73,
-      "eval_accuracy": 0.7222222222222222,
-      "eval_f1": 0.6296296296296295,
-      "eval_loss": 0.47097042202949524,
-      "eval_precision": 0.8015873015873016,
-      "eval_recall": 0.7222222222222222,
-      "eval_runtime": 4.8001,
-      "eval_samples_per_second": 7.5,
-      "eval_steps_per_second": 0.208,
       "step": 24
     },
     {
       "epoch": 12.73,
-      "eval_accuracy": 0.7222222222222222,
-      "eval_f1": 0.6296296296296295,
-      "eval_loss": 0.4540965259075165,
-      "eval_precision": 0.8015873015873016,
-      "eval_recall": 0.7222222222222222,
-      "eval_runtime": 4.7617,
-      "eval_samples_per_second": 7.56,
-      "eval_steps_per_second": 0.21,
       "step": 26
     },
     {
       "epoch": 13.73,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_f1": 0.7296113847837985,
-      "eval_loss": 0.44506168365478516,
-      "eval_precision": 0.8316498316498316,
-      "eval_recall": 0.7777777777777778,
-      "eval_runtime": 4.873,
-      "eval_samples_per_second": 7.388,
-      "eval_steps_per_second": 0.205,
       "step": 28
     },
     {
       "epoch": 14.73,
       "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.6976,
       "step": 30
     },
     {
       "epoch": 14.73,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_f1": 0.7296113847837985,
-      "eval_loss": 0.44511425495147705,
-      "eval_precision": 0.8316498316498316,
-      "eval_recall": 0.7777777777777778,
-      "eval_runtime": 5.299,
-      "eval_samples_per_second": 6.794,
-      "eval_steps_per_second": 0.189,
       "step": 30
     },
     {
       "epoch": 15.73,
-      "eval_accuracy": 0.8055555555555556,
-      "eval_f1": 0.7721247563352827,
-      "eval_loss": 0.4380625784397125,
-      "eval_precision": 0.8480902777777778,
-      "eval_recall": 0.8055555555555556,
-      "eval_runtime": 5.0388,
-      "eval_samples_per_second": 7.145,
-      "eval_steps_per_second": 0.198,
       "step": 32
     },
     {
       "epoch": 16.73,
-      "eval_accuracy": 0.8333333333333334,
-      "eval_f1": 0.8110119047619047,
-      "eval_loss": 0.4326169788837433,
-      "eval_precision": 0.8655913978494624,
-      "eval_recall": 0.8333333333333334,
-      "eval_runtime": 5.6799,
-      "eval_samples_per_second": 6.338,
-      "eval_steps_per_second": 0.176,
       "step": 34
     },
     {
       "epoch": 17.73,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_f1": 0.7296113847837985,
-      "eval_loss": 0.4337227940559387,
-      "eval_precision": 0.8316498316498316,
-      "eval_recall": 0.7777777777777778,
-      "eval_runtime": 4.7411,
-      "eval_samples_per_second": 7.593,
-      "eval_steps_per_second": 0.211,
       "step": 36
     },
     {
       "epoch": 18.73,
-      "eval_accuracy": 0.8055555555555556,
-      "eval_f1": 0.7721247563352827,
-      "eval_loss": 0.4260648787021637,
-      "eval_precision": 0.8480902777777778,
-      "eval_recall": 0.8055555555555556,
-      "eval_runtime": 5.2317,
-      "eval_samples_per_second": 6.881,
-      "eval_steps_per_second": 0.191,
       "step": 38
     },
     {
       "epoch": 19.73,
       "learning_rate": 0.0,
-      "loss": 0.6433,
       "step": 40
     },
     {
       "epoch": 19.73,
-      "eval_accuracy": 0.75,
-      "eval_f1": 0.6825293350717081,
-      "eval_loss": 0.42079275846481323,
-      "eval_precision": 0.8161764705882353,
-      "eval_recall": 0.75,
-      "eval_runtime": 6.4007,
-      "eval_samples_per_second": 5.624,
-      "eval_steps_per_second": 0.156,
       "step": 40
     },
     {
       "epoch": 19.73,
       "step": 40,
-      "total_flos": 2.8684782950326272e+17,
-      "train_loss": 0.7429648399353027,
-      "train_runtime": 749.9349,
-      "train_samples_per_second": 18.242,
-      "train_steps_per_second": 0.053
     }
   ],
   "max_steps": 40,
   "num_train_epochs": 20,
-  "total_flos": 2.8684782950326272e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9444444444444444,
+  "best_model_checkpoint": "test/checkpoint-18",
   "epoch": 19.727272727272727,
   "global_step": 40,
   "is_hyper_param_search": false,
   "log_history": [
     {
       "epoch": 0.73,
+      "eval_accuracy": 0.6388888888888888,
+      "eval_f1": 0.6513851917578626,
+      "eval_loss": 0.6436764597892761,
+      "eval_precision": 0.6720549981419547,
+      "eval_recall": 0.6388888888888888,
+      "eval_runtime": 6.0758,
+      "eval_samples_per_second": 5.925,
+      "eval_steps_per_second": 0.165,
       "step": 2
     },
     {
       "epoch": 1.73,
+      "eval_accuracy": 0.8055555555555556,
+      "eval_f1": 0.7647399681297986,
+      "eval_loss": 0.3604269325733185,
+      "eval_precision": 0.8468013468013468,
+      "eval_recall": 0.8055555555555556,
+      "eval_runtime": 5.7608,
+      "eval_samples_per_second": 6.249,
+      "eval_steps_per_second": 0.174,
       "step": 4
     },
     {
       "epoch": 2.73,
+      "eval_accuracy": 0.8888888888888888,
+      "eval_f1": 0.8888888888888888,
+      "eval_loss": 0.22702129185199738,
+      "eval_precision": 0.8888888888888888,
+      "eval_recall": 0.8888888888888888,
+      "eval_runtime": 4.8725,
+      "eval_samples_per_second": 7.388,
+      "eval_steps_per_second": 0.205,
       "step": 6
     },
     {
       "epoch": 3.73,
+      "eval_accuracy": 0.8888888888888888,
+      "eval_f1": 0.8888888888888888,
+      "eval_loss": 0.16791754961013794,
+      "eval_precision": 0.8888888888888888,
+      "eval_recall": 0.8888888888888888,
+      "eval_runtime": 6.131,
+      "eval_samples_per_second": 5.872,
+      "eval_steps_per_second": 0.163,
       "step": 8
     },
     {
       "epoch": 4.73,
       "learning_rate": 0.0001,
+      "loss": 0.4939,
       "step": 10
     },
     {
       "epoch": 4.73,
+      "eval_accuracy": 0.8888888888888888,
+      "eval_f1": 0.8888888888888888,
+      "eval_loss": 0.15902230143547058,
+      "eval_precision": 0.8888888888888888,
+      "eval_recall": 0.8888888888888888,
+      "eval_runtime": 4.9896,
+      "eval_samples_per_second": 7.215,
+      "eval_steps_per_second": 0.2,
       "step": 10
     },
     {
       "epoch": 5.73,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_f1": 0.9152598477325389,
+      "eval_loss": 0.15024107694625854,
+      "eval_precision": 0.9156378600823045,
+      "eval_recall": 0.9166666666666666,
+      "eval_runtime": 4.9812,
+      "eval_samples_per_second": 7.227,
+      "eval_steps_per_second": 0.201,
       "step": 12
     },
     {
       "epoch": 6.73,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_f1": 0.9152598477325389,
+      "eval_loss": 0.13303342461585999,
+      "eval_precision": 0.9156378600823045,
+      "eval_recall": 0.9166666666666666,
+      "eval_runtime": 4.8591,
+      "eval_samples_per_second": 7.409,
+      "eval_steps_per_second": 0.206,
       "step": 14
     },
     {
       "epoch": 7.73,
+      "eval_accuracy": 0.8888888888888888,
+      "eval_f1": 0.8888888888888888,
+      "eval_loss": 0.12413659691810608,
+      "eval_precision": 0.8888888888888888,
+      "eval_recall": 0.8888888888888888,
+      "eval_runtime": 5.4858,
+      "eval_samples_per_second": 6.562,
+      "eval_steps_per_second": 0.182,
       "step": 16
     },
     {
       "epoch": 8.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.0989239364862442,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.6045,
+      "eval_samples_per_second": 6.423,
+      "eval_steps_per_second": 0.178,
       "step": 18
     },
     {
       "epoch": 9.73,
       "learning_rate": 6.666666666666667e-05,
+      "loss": 0.0234,
       "step": 20
     },
     {
       "epoch": 9.73,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_f1": 0.9152598477325389,
+      "eval_loss": 0.10008219629526138,
+      "eval_precision": 0.9156378600823045,
+      "eval_recall": 0.9166666666666666,
+      "eval_runtime": 6.5249,
+      "eval_samples_per_second": 5.517,
+      "eval_steps_per_second": 0.153,
       "step": 20
     },
     {
       "epoch": 10.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.09186337888240814,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.01,
+      "eval_samples_per_second": 7.186,
+      "eval_steps_per_second": 0.2,
       "step": 22
     },
     {
       "epoch": 11.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.09773090481758118,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.7387,
+      "eval_samples_per_second": 6.273,
+      "eval_steps_per_second": 0.174,
       "step": 24
     },
     {
       "epoch": 12.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.10761526226997375,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.1262,
+      "eval_samples_per_second": 7.023,
+      "eval_steps_per_second": 0.195,
       "step": 26
     },
     {
       "epoch": 13.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.09590016305446625,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.0649,
+      "eval_samples_per_second": 7.108,
+      "eval_steps_per_second": 0.197,
       "step": 28
     },
     {
       "epoch": 14.73,
       "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.0024,
       "step": 30
     },
     {
       "epoch": 14.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.11737969517707825,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 10.5713,
+      "eval_samples_per_second": 3.405,
+      "eval_steps_per_second": 0.095,
       "step": 30
     },
     {
       "epoch": 15.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.10555433481931686,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.3198,
+      "eval_samples_per_second": 6.767,
+      "eval_steps_per_second": 0.188,
       "step": 32
     },
     {
       "epoch": 16.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.1085939034819603,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.2418,
+      "eval_samples_per_second": 6.868,
+      "eval_steps_per_second": 0.191,
       "step": 34
     },
     {
       "epoch": 17.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.11273058503866196,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 6.5423,
+      "eval_samples_per_second": 5.503,
+      "eval_steps_per_second": 0.153,
       "step": 36
     },
     {
       "epoch": 18.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.1172882616519928,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.9599,
+      "eval_samples_per_second": 6.04,
+      "eval_steps_per_second": 0.168,
       "step": 38
     },
     {
       "epoch": 19.73,
       "learning_rate": 0.0,
+      "loss": 0.0013,
       "step": 40
     },
     {
       "epoch": 19.73,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_f1": 0.9423868312757201,
+      "eval_loss": 0.11149459332227707,
+      "eval_precision": 0.9484126984126983,
+      "eval_recall": 0.9444444444444444,
+      "eval_runtime": 5.9908,
+      "eval_samples_per_second": 6.009,
+      "eval_steps_per_second": 0.167,
       "step": 40
     },
     {
       "epoch": 19.73,
       "step": 40,
+      "total_flos": 1.0467617957139087e+18,
+      "train_loss": 0.13025596663355826,
+      "train_runtime": 778.539,
+      "train_samples_per_second": 17.571,
+      "train_steps_per_second": 0.051
     }
   ],
   "max_steps": 40,
   "num_train_epochs": 20,
+  "total_flos": 1.0467617957139087e+18,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a24e0b9bc7c80089107c68a211b86b5a64a5036f730fcfc386da6a2e2aef4e1f
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:49aab5e5341ad6773a4a7b366c080f1cd6f47aa4da51bb4235c3e6f7333bdf36
 size 3387