End of training

Browse files

Files changed (6) hide show

README.md +3 -3
all_results.json +4 -4
confusion_matrix_test_fold_2.png +0 -0
confusion_matrix_valid_fold_2.png +0 -0
test_results.json +4 -4
trainer_state.json +224 -126

README.md CHANGED Viewed

@@ -18,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7688
 - Accuracy: 0.7782
 ## Model description
@@ -45,13 +45,13 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
-- training_steps: 2677
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.0193        | 1.0   | 2677 | 0.0293          | 0.9951   |
 ### Framework versions

 This model is a fine-tuned version of [facebook/timesformer-base-finetuned-k400](https://huggingface.co/facebook/timesformer-base-finetuned-k400) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8434
 - Accuracy: 0.7782
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
+- training_steps: 4015
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.0403        | 1.0   | 4015 | 0.0018          | 0.9997   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "eval_accuracy": 0.7782131661442007,
-    "eval_loss": 0.7687952518463135,
-    "eval_runtime": 496.727,
-    "eval_samples_per_second": 2.569,
-    "eval_steps_per_second": 1.284
 }

 {
     "epoch": 1.0,
     "eval_accuracy": 0.7782131661442007,
+    "eval_loss": 0.843409538269043,
+    "eval_runtime": 509.169,
+    "eval_samples_per_second": 2.506,
+    "eval_steps_per_second": 1.253
 }

confusion_matrix_test_fold_2.png ADDED Viewed

confusion_matrix_valid_fold_2.png ADDED Viewed

test_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "eval_accuracy": 0.7782131661442007,
-    "eval_loss": 0.7687952518463135,
-    "eval_runtime": 496.727,
-    "eval_samples_per_second": 2.569,
-    "eval_steps_per_second": 1.284
 }

 {
     "epoch": 1.0,
     "eval_accuracy": 0.7782131661442007,
+    "eval_loss": 0.843409538269043,
+    "eval_runtime": 509.169,
+    "eval_samples_per_second": 2.506,
+    "eval_steps_per_second": 1.253
 }

trainer_state.json CHANGED Viewed

@@ -1,225 +1,323 @@
 {
-  "best_metric": 0.9951438177063877,
-  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10epoch_noAug_batch4/checkpoint-2677",
   "epoch": 1.0,
   "eval_steps": 500,
-  "global_step": 2677,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.03735524841240194,
-      "grad_norm": 24.989120483398438,
-      "learning_rate": 1.865671641791045e-05,
-      "loss": 4.2246,
       "step": 100
     },
     {
-      "epoch": 0.07471049682480388,
-      "grad_norm": 20.024639129638672,
-      "learning_rate": 3.73134328358209e-05,
-      "loss": 3.6841,
       "step": 200
     },
     {
-      "epoch": 0.11206574523720583,
-      "grad_norm": 17.28092384338379,
-      "learning_rate": 4.933582399335824e-05,
-      "loss": 3.234,
       "step": 300
     },
     {
-      "epoch": 0.14942099364960776,
-      "grad_norm": 18.406675338745117,
-      "learning_rate": 4.726027397260274e-05,
-      "loss": 2.5559,
       "step": 400
     },
     {
-      "epoch": 0.1867762420620097,
-      "grad_norm": 26.896827697753906,
-      "learning_rate": 4.518472395184724e-05,
-      "loss": 1.8677,
       "step": 500
     },
     {
-      "epoch": 0.22413149047441167,
-      "grad_norm": 12.695908546447754,
-      "learning_rate": 4.310917393109174e-05,
-      "loss": 1.5554,
       "step": 600
     },
     {
-      "epoch": 0.2614867388868136,
-      "grad_norm": 7.8890886306762695,
-      "learning_rate": 4.103362391033624e-05,
-      "loss": 1.1195,
       "step": 700
     },
     {
-      "epoch": 0.2988419872992155,
-      "grad_norm": 17.791894912719727,
-      "learning_rate": 3.895807388958074e-05,
-      "loss": 0.9177,
       "step": 800
     },
     {
-      "epoch": 0.33619723571161747,
-      "grad_norm": 13.646657943725586,
-      "learning_rate": 3.688252386882524e-05,
-      "loss": 0.7677,
       "step": 900
     },
     {
-      "epoch": 0.3735524841240194,
-      "grad_norm": 3.417719841003418,
-      "learning_rate": 3.480697384806974e-05,
-      "loss": 0.6837,
       "step": 1000
     },
     {
-      "epoch": 0.4109077325364214,
-      "grad_norm": 20.28173828125,
-      "learning_rate": 3.2731423827314236e-05,
-      "loss": 0.468,
       "step": 1100
     },
     {
-      "epoch": 0.44826298094882333,
-      "grad_norm": 2.7610223293304443,
-      "learning_rate": 3.065587380655874e-05,
-      "loss": 0.4672,
       "step": 1200
     },
     {
-      "epoch": 0.48561822936122523,
-      "grad_norm": 6.17078971862793,
-      "learning_rate": 2.8580323785803237e-05,
-      "loss": 0.2766,
       "step": 1300
     },
     {
-      "epoch": 0.5229734777736272,
-      "grad_norm": 0.5839480757713318,
-      "learning_rate": 2.650477376504774e-05,
-      "loss": 0.4097,
       "step": 1400
     },
     {
-      "epoch": 0.5603287261860291,
-      "grad_norm": 1.3034311532974243,
-      "learning_rate": 2.4429223744292238e-05,
-      "loss": 0.234,
       "step": 1500
     },
     {
-      "epoch": 0.597683974598431,
-      "grad_norm": 0.7230249047279358,
-      "learning_rate": 2.2353673723536738e-05,
-      "loss": 0.1931,
       "step": 1600
     },
     {
-      "epoch": 0.635039223010833,
-      "grad_norm": 0.3991735875606537,
-      "learning_rate": 2.027812370278124e-05,
-      "loss": 0.1586,
       "step": 1700
     },
     {
-      "epoch": 0.6723944714232349,
-      "grad_norm": 0.385985404253006,
-      "learning_rate": 1.8202573682025735e-05,
-      "loss": 0.1193,
       "step": 1800
     },
     {
-      "epoch": 0.709749719835637,
-      "grad_norm": 0.18072636425495148,
-      "learning_rate": 1.612702366127024e-05,
-      "loss": 0.1239,
       "step": 1900
     },
     {
-      "epoch": 0.7471049682480388,
-      "grad_norm": 0.08895082771778107,
-      "learning_rate": 1.4051473640514736e-05,
-      "loss": 0.0821,
       "step": 2000
     },
     {
-      "epoch": 0.7844602166604407,
-      "grad_norm": 0.7674840688705444,
-      "learning_rate": 1.1975923619759236e-05,
-      "loss": 0.0666,
       "step": 2100
     },
     {
-      "epoch": 0.8218154650728428,
-      "grad_norm": 0.36039838194847107,
-      "learning_rate": 9.900373599003735e-06,
-      "loss": 0.0496,
       "step": 2200
     },
     {
-      "epoch": 0.8591707134852447,
-      "grad_norm": 14.090306282043457,
-      "learning_rate": 7.824823578248236e-06,
-      "loss": 0.0759,
       "step": 2300
     },
     {
-      "epoch": 0.8965259618976467,
-      "grad_norm": 0.8630295395851135,
-      "learning_rate": 5.749273557492736e-06,
-      "loss": 0.0754,
       "step": 2400
     },
     {
-      "epoch": 0.9338812103100486,
-      "grad_norm": 0.2037580907344818,
-      "learning_rate": 3.6737235367372358e-06,
-      "loss": 0.0292,
       "step": 2500
     },
     {
-      "epoch": 0.9712364587224505,
-      "grad_norm": 0.09266289323568344,
-      "learning_rate": 1.598173515981735e-06,
-      "loss": 0.0193,
       "step": 2600
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.9951438177063877,
-      "eval_loss": 0.029290661215782166,
-      "eval_runtime": 1164.368,
-      "eval_samples_per_second": 2.299,
-      "eval_steps_per_second": 1.15,
-      "step": 2677
     },
     {
       "epoch": 1.0,
-      "step": 2677,
-      "total_flos": 4.692618096962568e+18,
-      "train_loss": 0.8774151888898295,
-      "train_runtime": 3932.2419,
-      "train_samples_per_second": 1.362,
-      "train_steps_per_second": 0.681
     },
     {
       "epoch": 1.0,
       "eval_accuracy": 0.7782131661442007,
-      "eval_loss": 0.7687952518463135,
-      "eval_runtime": 496.727,
-      "eval_samples_per_second": 2.569,
-      "eval_steps_per_second": 1.284,
-      "step": 2677
     }
   ],
   "logging_steps": 100,
-  "max_steps": 2677,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 9223372036854775807,
   "save_steps": 500,
@@ -235,7 +333,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 4.692618096962568e+18,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.9997126436781609,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/Timesformer_default_fold_10_10epoch_noAug_batch4/checkpoint-4015",
   "epoch": 1.0,
   "eval_steps": 500,
+  "global_step": 4015,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.024906600249066,
+      "grad_norm": 0.0679977759718895,
+      "learning_rate": 1.2437810945273633e-05,
+      "loss": 0.0161,
       "step": 100
     },
     {
+      "epoch": 0.049813200498132,
+      "grad_norm": 1.2939980030059814,
+      "learning_rate": 2.4875621890547266e-05,
+      "loss": 0.0335,
       "step": 200
     },
     {
+      "epoch": 0.074719800747198,
+      "grad_norm": 23.8648738861084,
+      "learning_rate": 3.73134328358209e-05,
+      "loss": 0.0463,
       "step": 300
     },
     {
+      "epoch": 0.099626400996264,
+      "grad_norm": 0.10109841078519821,
+      "learning_rate": 4.975124378109453e-05,
+      "loss": 0.0968,
       "step": 400
     },
     {
+      "epoch": 0.12453300124533001,
+      "grad_norm": 0.40682753920555115,
+      "learning_rate": 4.864378632715195e-05,
+      "loss": 0.1198,
       "step": 500
     },
     {
+      "epoch": 0.149439601494396,
+      "grad_norm": 3.5996460914611816,
+      "learning_rate": 4.7259894824245784e-05,
+      "loss": 0.2129,
       "step": 600
     },
     {
+      "epoch": 0.17434620174346202,
+      "grad_norm": 0.060298651456832886,
+      "learning_rate": 4.587600332133961e-05,
+      "loss": 0.1732,
       "step": 700
     },
     {
+      "epoch": 0.199252801992528,
+      "grad_norm": 0.05418834835290909,
+      "learning_rate": 4.449211181843343e-05,
+      "loss": 0.1067,
       "step": 800
     },
     {
+      "epoch": 0.22415940224159403,
+      "grad_norm": 0.07002612948417664,
+      "learning_rate": 4.3108220315527264e-05,
+      "loss": 0.0959,
       "step": 900
     },
     {
+      "epoch": 0.24906600249066002,
+      "grad_norm": 0.09562501311302185,
+      "learning_rate": 4.1724328812621095e-05,
+      "loss": 0.114,
       "step": 1000
     },
     {
+      "epoch": 0.273972602739726,
+      "grad_norm": 2.8778584003448486,
+      "learning_rate": 4.034043730971492e-05,
+      "loss": 0.1913,
       "step": 1100
     },
     {
+      "epoch": 0.298879202988792,
+      "grad_norm": 0.15859746932983398,
+      "learning_rate": 3.895654580680875e-05,
+      "loss": 0.0471,
       "step": 1200
     },
     {
+      "epoch": 0.32378580323785805,
+      "grad_norm": 0.038741584867239,
+      "learning_rate": 3.7572654303902575e-05,
+      "loss": 0.1192,
       "step": 1300
     },
     {
+      "epoch": 0.34869240348692404,
+      "grad_norm": 3.3708555698394775,
+      "learning_rate": 3.6188762800996406e-05,
+      "loss": 0.0563,
       "step": 1400
     },
     {
+      "epoch": 0.37359900373599003,
+      "grad_norm": 0.10332904011011124,
+      "learning_rate": 3.480487129809023e-05,
+      "loss": 0.0653,
       "step": 1500
     },
     {
+      "epoch": 0.398505603985056,
+      "grad_norm": 0.05150986090302467,
+      "learning_rate": 3.342097979518406e-05,
+      "loss": 0.0765,
       "step": 1600
     },
     {
+      "epoch": 0.42341220423412207,
+      "grad_norm": 4.3742194175720215,
+      "learning_rate": 3.2037088292277886e-05,
+      "loss": 0.0732,
       "step": 1700
     },
     {
+      "epoch": 0.44831880448318806,
+      "grad_norm": 0.17955519258975983,
+      "learning_rate": 3.065319678937171e-05,
+      "loss": 0.0852,
       "step": 1800
     },
     {
+      "epoch": 0.47322540473225405,
+      "grad_norm": 0.017491327598690987,
+      "learning_rate": 2.926930528646554e-05,
+      "loss": 0.0321,
       "step": 1900
     },
     {
+      "epoch": 0.49813200498132004,
+      "grad_norm": 0.062625452876091,
+      "learning_rate": 2.7885413783559373e-05,
+      "loss": 0.0639,
       "step": 2000
     },
     {
+      "epoch": 0.523038605230386,
+      "grad_norm": 0.01796746626496315,
+      "learning_rate": 2.6501522280653197e-05,
+      "loss": 0.0204,
       "step": 2100
     },
     {
+      "epoch": 0.547945205479452,
+      "grad_norm": 0.006298160646110773,
+      "learning_rate": 2.5117630777747025e-05,
+      "loss": 0.0376,
       "step": 2200
     },
     {
+      "epoch": 0.572851805728518,
+      "grad_norm": 0.11808665096759796,
+      "learning_rate": 2.3733739274840856e-05,
+      "loss": 0.0786,
       "step": 2300
     },
     {
+      "epoch": 0.597758405977584,
+      "grad_norm": 0.026163829490542412,
+      "learning_rate": 2.234984777193468e-05,
+      "loss": 0.0087,
       "step": 2400
     },
     {
+      "epoch": 0.6226650062266501,
+      "grad_norm": 0.051311738789081573,
+      "learning_rate": 2.0965956269028508e-05,
+      "loss": 0.0345,
       "step": 2500
     },
     {
+      "epoch": 0.6475716064757161,
+      "grad_norm": 0.004274987615644932,
+      "learning_rate": 1.958206476612234e-05,
+      "loss": 0.0484,
       "step": 2600
     },
+    {
+      "epoch": 0.6724782067247821,
+      "grad_norm": 0.008581398986279964,
+      "learning_rate": 1.8198173263216163e-05,
+      "loss": 0.0112,
+      "step": 2700
+    },
+    {
+      "epoch": 0.6973848069738481,
+      "grad_norm": 0.08034462481737137,
+      "learning_rate": 1.681428176030999e-05,
+      "loss": 0.0118,
+      "step": 2800
+    },
+    {
+      "epoch": 0.7222914072229141,
+      "grad_norm": 0.0067258900962769985,
+      "learning_rate": 1.543039025740382e-05,
+      "loss": 0.0251,
+      "step": 2900
+    },
+    {
+      "epoch": 0.7471980074719801,
+      "grad_norm": 0.004430562723428011,
+      "learning_rate": 1.4046498754497647e-05,
+      "loss": 0.0085,
+      "step": 3000
+    },
+    {
+      "epoch": 0.772104607721046,
+      "grad_norm": 0.0027492486406117678,
+      "learning_rate": 1.2662607251591476e-05,
+      "loss": 0.0089,
+      "step": 3100
+    },
+    {
+      "epoch": 0.797011207970112,
+      "grad_norm": 0.003413543803617358,
+      "learning_rate": 1.1278715748685304e-05,
+      "loss": 0.0069,
+      "step": 3200
+    },
+    {
+      "epoch": 0.821917808219178,
+      "grad_norm": 0.00517587224021554,
+      "learning_rate": 9.894824245779132e-06,
+      "loss": 0.001,
+      "step": 3300
+    },
+    {
+      "epoch": 0.8468244084682441,
+      "grad_norm": 0.0020790928974747658,
+      "learning_rate": 8.51093274287296e-06,
+      "loss": 0.002,
+      "step": 3400
+    },
+    {
+      "epoch": 0.8717310087173101,
+      "grad_norm": 0.010764083825051785,
+      "learning_rate": 7.127041239966786e-06,
+      "loss": 0.0009,
+      "step": 3500
+    },
+    {
+      "epoch": 0.8966376089663761,
+      "grad_norm": 0.005092688836157322,
+      "learning_rate": 5.743149737060614e-06,
+      "loss": 0.0003,
+      "step": 3600
+    },
+    {
+      "epoch": 0.9215442092154421,
+      "grad_norm": 0.0029076840728521347,
+      "learning_rate": 4.359258234154443e-06,
+      "loss": 0.0012,
+      "step": 3700
+    },
+    {
+      "epoch": 0.9464508094645081,
+      "grad_norm": 0.0030453051440417767,
+      "learning_rate": 2.97536673124827e-06,
+      "loss": 0.0032,
+      "step": 3800
+    },
+    {
+      "epoch": 0.9713574097135741,
+      "grad_norm": 0.002343358937650919,
+      "learning_rate": 1.5914752283420978e-06,
+      "loss": 0.0028,
+      "step": 3900
+    },
+    {
+      "epoch": 0.9962640099626401,
+      "grad_norm": 0.007323646917939186,
+      "learning_rate": 2.0758372543592582e-07,
+      "loss": 0.0403,
+      "step": 4000
+    },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.9997126436781609,
+      "eval_loss": 0.0017972222995012999,
+      "eval_runtime": 1501.9344,
+      "eval_samples_per_second": 2.317,
+      "eval_steps_per_second": 1.159,
+      "step": 4015
     },
     {
       "epoch": 1.0,
+      "step": 4015,
+      "total_flos": 7.038050675870269e+18,
+      "train_loss": 0.054263464616586085,
+      "train_runtime": 5551.0777,
+      "train_samples_per_second": 1.447,
+      "train_steps_per_second": 0.723
     },
     {
       "epoch": 1.0,
       "eval_accuracy": 0.7782131661442007,
+      "eval_loss": 0.843409538269043,
+      "eval_runtime": 509.169,
+      "eval_samples_per_second": 2.506,
+      "eval_steps_per_second": 1.253,
+      "step": 4015
     }
   ],
   "logging_steps": 100,
+  "max_steps": 4015,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 9223372036854775807,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 7.038050675870269e+18,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null