Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

checkpoint-latest/model.safetensors +1 -1
checkpoint-latest/optimizer.pt +1 -1
checkpoint-latest/rng_state.pth +1 -1
checkpoint-latest/scheduler.pt +1 -1
checkpoint-latest/trainer_state.json +35 -35
checkpoint-latest/training_args.bin +1 -1

checkpoint-latest/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:393c31c029be3e0c558e9b43e5093997ec4c94e8cc3df4239769190abffdda69
 size 62293080

 version https://git-lfs.github.com/spec/v1
+oid sha256:05526172b6b183727ed691244d8fca12632b8705fa3b5f5582a369439119e9f7
 size 62293080

checkpoint-latest/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0e0467a1e128a83101d757df9edbc49229825b87355d89ca5c115347fdffcc60
 size 124642443

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ae74e3c93a2f232f2571925d5902330db686e4ed3351b82bafa9a5dbb3dca60
 size 124642443

checkpoint-latest/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8442053f994922dc69efe15ac7d6938fd15f0fd7a705fec6122ab91041dc1f14
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:111dc925ae2f7248f73dcd9582f2230af09b95cb292fde39121b77d0a24595e6
 size 14645

checkpoint-latest/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85ab8cc1fdedbccfbfeb8687bbad9305fda8976259d4a6ffe9a48f328a2c592d
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec9761731a5aa3d5575ffed14f4165db19c93fbedd2eb3e25069def656bd6d84
 size 1465

checkpoint-latest/trainer_state.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "best_global_step": null,
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.18950161076369149,
   "eval_steps": 500,
   "global_step": 1000,
   "is_hyper_param_search": false,
@@ -10,52 +10,52 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.04263786242183058,
-      "grad_norm": NaN,
-      "learning_rate": 0.0002957551639188933,
-      "loss": 0.0,
-      "step": 225
     },
     {
-      "epoch": 0.08527572484366117,
-      "grad_norm": NaN,
-      "learning_rate": 0.0002914913776767102,
-      "loss": 0.0,
-      "step": 450
     },
     {
-      "epoch": 0.09475080538184574,
-      "eval_loss": NaN,
-      "eval_runtime": 58.7663,
-      "eval_samples_per_second": 167.613,
-      "eval_steps_per_second": 5.99,
       "step": 500
     },
     {
-      "epoch": 0.12791358726549176,
-      "grad_norm": NaN,
-      "learning_rate": 0.0002872275914345272,
-      "loss": 0.0,
-      "step": 675
     },
     {
-      "epoch": 0.17055144968732233,
-      "grad_norm": NaN,
-      "learning_rate": 0.0002829638051923441,
-      "loss": 0.0,
-      "step": 900
     },
     {
-      "epoch": 0.18950161076369149,
-      "eval_loss": NaN,
-      "eval_runtime": 58.8198,
-      "eval_samples_per_second": 167.46,
-      "eval_steps_per_second": 5.984,
       "step": 1000
     }
   ],
-  "logging_steps": 225,
-  "max_steps": 15831,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 1000,
@@ -71,8 +71,8 @@
       "attributes": {}
     }
   },
-  "total_flos": 631844634624000.0,
-  "train_batch_size": 28,
   "trial_name": null,
   "trial_params": null
 }

   "best_global_step": null,
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.10828370330265295,
   "eval_steps": 500,
   "global_step": 1000,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.02707092582566324,
+      "grad_norm": 0.8431992530822754,
+      "learning_rate": 9.910124526258799e-05,
+      "loss": 4.3576,
+      "step": 250
     },
     {
+      "epoch": 0.05414185165132648,
+      "grad_norm": 0.8061181306838989,
+      "learning_rate": 9.819888106839921e-05,
+      "loss": 4.2775,
+      "step": 500
     },
     {
+      "epoch": 0.05414185165132648,
+      "eval_loss": 3.5462777614593506,
+      "eval_runtime": 87.734,
+      "eval_samples_per_second": 112.271,
+      "eval_steps_per_second": 7.021,
       "step": 500
     },
     {
+      "epoch": 0.08121277747698971,
+      "grad_norm": 0.7875335812568665,
+      "learning_rate": 9.729651687421044e-05,
+      "loss": 4.1927,
+      "step": 750
     },
     {
+      "epoch": 0.10828370330265295,
+      "grad_norm": 1.0330173969268799,
+      "learning_rate": 9.639415268002166e-05,
+      "loss": 4.1178,
+      "step": 1000
     },
     {
+      "epoch": 0.10828370330265295,
+      "eval_loss": 3.3765828609466553,
+      "eval_runtime": 87.6227,
+      "eval_samples_per_second": 112.414,
+      "eval_steps_per_second": 7.03,
       "step": 1000
     }
   ],
+  "logging_steps": 250,
+  "max_steps": 27705,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 1000,
       "attributes": {}
     }
   },
+  "total_flos": 361054076928000.0,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-latest/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:669a48aa09ae0e5107616885177fad4ad55736c6332be20bb6f916b99a7e1ab7
 size 6033

 version https://git-lfs.github.com/spec/v1
+oid sha256:f217a06d41692f3ee4559764c88c0b3c805db6ef1541a53dc2503e0626aeaf07
 size 6033