Upload llama3/28-05-24-Weni-runpod_debug_Experiment with SFT and Llama3 8B, 1.0.5.-2_max_steps-30_batch_1_2024-05-28_ppid_9/checkpoint-30/trainer_state.json with huggingface_hub

Browse files

Files changed (1) hide show

llama3/28-05-24-Weni-runpod_debug_Experiment with SFT and Llama3 8B, 1.0.5.-2_max_steps-30_batch_1_2024-05-28_ppid_9/checkpoint-30/trainer_state.json +78 -0

llama3/28-05-24-Weni-runpod_debug_Experiment with SFT and Llama3 8B, 1.0.5.-2_max_steps-30_batch_1_2024-05-28_ppid_9/checkpoint-30/trainer_state.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "best_metric": 1.2126582860946655,
+  "best_model_checkpoint": "./llama3/28-05-24-Weni-runpod_debug_Experiment with SFT and Llama3 8B, 1.0.5.-2_max_steps-30_batch_1_2024-05-28_ppid_9/checkpoint-30",
+  "epoch": 0.3592814371257485,
+  "eval_steps": 10,
+  "global_step": 30,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.11976047904191617,
+      "grad_norm": 0.2804673910140991,
+      "learning_rate": 0.00015000000000000001,
+      "loss": 1.5929,
+      "step": 10
+    },
+    {
+      "epoch": 0.11976047904191617,
+      "eval_loss": 1.2905054092407227,
+      "eval_runtime": 24.052,
+      "eval_samples_per_second": 3.118,
+      "eval_steps_per_second": 3.118,
+      "step": 10
+    },
+    {
+      "epoch": 0.23952095808383234,
+      "grad_norm": 0.2738259732723236,
+      "learning_rate": 5.000000000000002e-05,
+      "loss": 1.2188,
+      "step": 20
+    },
+    {
+      "epoch": 0.23952095808383234,
+      "eval_loss": 1.2275362014770508,
+      "eval_runtime": 24.2586,
+      "eval_samples_per_second": 3.092,
+      "eval_steps_per_second": 3.092,
+      "step": 20
+    },
+    {
+      "epoch": 0.3592814371257485,
+      "grad_norm": 0.19172628223896027,
+      "learning_rate": 0.0,
+      "loss": 1.2161,
+      "step": 30
+    },
+    {
+      "epoch": 0.3592814371257485,
+      "eval_loss": 1.2126582860946655,
+      "eval_runtime": 24.1568,
+      "eval_samples_per_second": 3.105,
+      "eval_steps_per_second": 3.105,
+      "step": 30
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 30,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 10,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.6688436867735552e+16,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}