MelMitchell8 commited on Jun 2, 2023

Commit

3289f63

1 Parent(s): f7ae1ca

Upload 37 files

Browse files

Files changed (37) hide show

experiments/.DS_Store +0 -0
experiments/adapter_config.json +20 -0
experiments/adapter_model.bin +3 -0
experiments/checkpoint-200/optimizer.pt +3 -0
experiments/checkpoint-200/pytorch_model.bin +3 -0
experiments/checkpoint-200/rng_state.pth +3 -0
experiments/checkpoint-200/scheduler.pt +3 -0
experiments/checkpoint-200/trainer_state.json +168 -0
experiments/checkpoint-200/training_args.bin +3 -0
experiments/checkpoint-250/optimizer.pt +3 -0
experiments/checkpoint-250/pytorch_model.bin +3 -0
experiments/checkpoint-250/rng_state.pth +3 -0
experiments/checkpoint-250/scheduler.pt +3 -0
experiments/checkpoint-250/trainer_state.json +206 -0
experiments/checkpoint-250/training_args.bin +3 -0
experiments/checkpoint-300/optimizer.pt +3 -0
experiments/checkpoint-300/pytorch_model.bin +3 -0
experiments/checkpoint-300/rng_state.pth +3 -0
experiments/checkpoint-300/scheduler.pt +3 -0
experiments/checkpoint-300/trainer_state.json +244 -0
experiments/checkpoint-300/training_args.bin +3 -0
experiments/runs/Jun01_05-20-38_342e8c5b39dd/1685596839.0285306/events.out.tfevents.1685596839.342e8c5b39dd.10274.1 +3 -0
experiments/runs/Jun01_05-20-38_342e8c5b39dd/1685596845.6246781/events.out.tfevents.1685596845.342e8c5b39dd.10274.3 +3 -0
experiments/runs/Jun01_05-20-38_342e8c5b39dd/events.out.tfevents.1685596839.342e8c5b39dd.10274.0 +3 -0
experiments/runs/Jun01_05-20-38_342e8c5b39dd/events.out.tfevents.1685596845.342e8c5b39dd.10274.2 +3 -0
experiments/runs/Jun01_05-25-44_342e8c5b39dd/1685597145.1742842/events.out.tfevents.1685597145.342e8c5b39dd.13098.1 +3 -0
experiments/runs/Jun01_05-25-44_342e8c5b39dd/events.out.tfevents.1685597145.342e8c5b39dd.13098.0 +3 -0
experiments/runs/Jun01_07-13-15_090d8d4aa7e2/1685603596.0617163/events.out.tfevents.1685603596.090d8d4aa7e2.1898.1 +3 -0
experiments/runs/Jun01_07-13-15_090d8d4aa7e2/events.out.tfevents.1685603596.090d8d4aa7e2.1898.0 +3 -0
experiments/runs/Jun01_08-58-37_11b0426da60f/1685609918.3124719/events.out.tfevents.1685609918.11b0426da60f.611.1 +3 -0
experiments/runs/Jun01_08-58-37_11b0426da60f/events.out.tfevents.1685609918.11b0426da60f.611.0 +3 -0
experiments/runs/Jun01_09-00-06_05555eff8aef/1685610006.9899611/events.out.tfevents.1685610007.05555eff8aef.2638.1 +3 -0
experiments/runs/Jun01_09-00-06_05555eff8aef/events.out.tfevents.1685610006.05555eff8aef.2638.0 +3 -0
experiments/runs/Jun01_16-23-40_05555eff8aef/1685636620.8436341/events.out.tfevents.1685636620.05555eff8aef.113292.1 +3 -0
experiments/runs/Jun01_16-23-40_05555eff8aef/events.out.tfevents.1685636620.05555eff8aef.113292.0 +3 -0
experiments/runs/Jun01_19-42-51_d1618e311822/1685648572.7311761/events.out.tfevents.1685648572.d1618e311822.5586.1 +3 -0
experiments/runs/Jun01_19-42-51_d1618e311822/events.out.tfevents.1685648572.d1618e311822.5586.0 +3 -0

experiments/.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

experiments/adapter_config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "base_model_name_or_path": "decapoda-research/llama-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

experiments/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e1621f48d9ad8feb1d6d31050275f0aafd080c5c07153301fe2f48411f4406
+size 443

experiments/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a3eb06a66b599a0807a07ddfa32489b8c0cf87fa0eea6db3d52000561ff6ed6
+size 33661637

experiments/checkpoint-200/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d0f8e7b279fab15d49443678eccd6482012c33bb76f6d9e6ba28035e113200e
+size 16822989

experiments/checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:632fe9e673aa097636302f655e7ca5746c01c4d73d7117950cc839f7c5530c88
+size 14575

experiments/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:070d5feb292b6cdd1e6d789531daa5537e6f20b2480db363c1778451c80883ab
+size 627

experiments/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,168 @@

+{
+  "best_metric": 0.6030644774436951,
+  "best_model_checkpoint": "experiments/checkpoint-200",
+  "epoch": 0.311284046692607,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.5075,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 5.6999999999999996e-05,
+      "loss": 2.3737,
+      "step": 20
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 8.699999999999999e-05,
+      "loss": 2.0938,
+      "step": 30
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 0.00011399999999999999,
+      "loss": 1.4761,
+      "step": 40
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.00014399999999999998,
+      "loss": 1.0161,
+      "step": 50
+    },
+    {
+      "epoch": 0.08,
+      "eval_loss": 0.9799935817718506,
+      "eval_runtime": 9.5951,
+      "eval_samples_per_second": 20.844,
+      "eval_steps_per_second": 2.605,
+      "step": 50
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 0.00017399999999999997,
+      "loss": 0.9253,
+      "step": 60
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 0.000204,
+      "loss": 0.8183,
+      "step": 70
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 0.000234,
+      "loss": 0.7652,
+      "step": 80
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.00026399999999999997,
+      "loss": 0.7233,
+      "step": 90
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.000294,
+      "loss": 0.7036,
+      "step": 100
+    },
+    {
+      "epoch": 0.16,
+      "eval_loss": 0.7070202827453613,
+      "eval_runtime": 9.6202,
+      "eval_samples_per_second": 20.79,
+      "eval_steps_per_second": 2.599,
+      "step": 100
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 0.00028799999999999995,
+      "loss": 0.6666,
+      "step": 110
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.00027299999999999997,
+      "loss": 0.6375,
+      "step": 120
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.000258,
+      "loss": 0.6207,
+      "step": 130
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 0.000243,
+      "loss": 0.6246,
+      "step": 140
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00022799999999999999,
+      "loss": 0.6133,
+      "step": 150
+    },
+    {
+      "epoch": 0.23,
+      "eval_loss": 0.6191394925117493,
+      "eval_runtime": 9.5788,
+      "eval_samples_per_second": 20.879,
+      "eval_steps_per_second": 2.61,
+      "step": 150
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.00021299999999999997,
+      "loss": 0.6044,
+      "step": 160
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.000198,
+      "loss": 0.6098,
+      "step": 170
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00018299999999999998,
+      "loss": 0.6011,
+      "step": 180
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.000168,
+      "loss": 0.594,
+      "step": 190
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00015299999999999998,
+      "loss": 0.6002,
+      "step": 200
+    },
+    {
+      "epoch": 0.31,
+      "eval_loss": 0.6030644774436951,
+      "eval_runtime": 9.6172,
+      "eval_samples_per_second": 20.796,
+      "eval_steps_per_second": 2.6,
+      "step": 200
+    }
+  ],
+  "max_steps": 300,
+  "num_train_epochs": 1,
+  "total_flos": 1.7718117662588928e+17,
+  "trial_name": null,
+  "trial_params": null
+}

experiments/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be4ec138b6339576c00fef284fd852b5850365d5171336195581652280fa859d
+size 3899

experiments/checkpoint-250/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f33867a68b34b68aee6b7e327a6c5ae88a958b71d6df154c4b00b7572f1a1c0
+size 33661637

experiments/checkpoint-250/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c67dfd06a2b81ab91049f6fc5c7d34345e3923ab46ff47060ab4ceb2458b5275
+size 16822989

experiments/checkpoint-250/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b0dbc1ef06a8bc675ce99c64e3cfe20966be764652d80828d89f3b5ce43fcc6
+size 14575

experiments/checkpoint-250/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fba7862dfae2e2b45b88440253138cc9d2ebd0c12a903e1b4d46e6141f5a3a5e
+size 627

experiments/checkpoint-250/trainer_state.json ADDED Viewed

	@@ -0,0 +1,206 @@

+{
+  "best_metric": 0.594174325466156,
+  "best_model_checkpoint": "experiments/checkpoint-250",
+  "epoch": 0.38910505836575876,
+  "global_step": 250,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.5075,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 5.6999999999999996e-05,
+      "loss": 2.3737,
+      "step": 20
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 8.699999999999999e-05,
+      "loss": 2.0938,
+      "step": 30
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 0.00011399999999999999,
+      "loss": 1.4761,
+      "step": 40
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.00014399999999999998,
+      "loss": 1.0161,
+      "step": 50
+    },
+    {
+      "epoch": 0.08,
+      "eval_loss": 0.9799935817718506,
+      "eval_runtime": 9.5951,
+      "eval_samples_per_second": 20.844,
+      "eval_steps_per_second": 2.605,
+      "step": 50
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 0.00017399999999999997,
+      "loss": 0.9253,
+      "step": 60
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 0.000204,
+      "loss": 0.8183,
+      "step": 70
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 0.000234,
+      "loss": 0.7652,
+      "step": 80
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.00026399999999999997,
+      "loss": 0.7233,
+      "step": 90
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.000294,
+      "loss": 0.7036,
+      "step": 100
+    },
+    {
+      "epoch": 0.16,
+      "eval_loss": 0.7070202827453613,
+      "eval_runtime": 9.6202,
+      "eval_samples_per_second": 20.79,
+      "eval_steps_per_second": 2.599,
+      "step": 100
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 0.00028799999999999995,
+      "loss": 0.6666,
+      "step": 110
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.00027299999999999997,
+      "loss": 0.6375,
+      "step": 120
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.000258,
+      "loss": 0.6207,
+      "step": 130
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 0.000243,
+      "loss": 0.6246,
+      "step": 140
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00022799999999999999,
+      "loss": 0.6133,
+      "step": 150
+    },
+    {
+      "epoch": 0.23,
+      "eval_loss": 0.6191394925117493,
+      "eval_runtime": 9.5788,
+      "eval_samples_per_second": 20.879,
+      "eval_steps_per_second": 2.61,
+      "step": 150
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.00021299999999999997,
+      "loss": 0.6044,
+      "step": 160
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.000198,
+      "loss": 0.6098,
+      "step": 170
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00018299999999999998,
+      "loss": 0.6011,
+      "step": 180
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.000168,
+      "loss": 0.594,
+      "step": 190
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00015299999999999998,
+      "loss": 0.6002,
+      "step": 200
+    },
+    {
+      "epoch": 0.31,
+      "eval_loss": 0.6030644774436951,
+      "eval_runtime": 9.6172,
+      "eval_samples_per_second": 20.796,
+      "eval_steps_per_second": 2.6,
+      "step": 200
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.000138,
+      "loss": 0.5836,
+      "step": 210
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0.00012299999999999998,
+      "loss": 0.5911,
+      "step": 220
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00010799999999999998,
+      "loss": 0.5946,
+      "step": 230
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 9.3e-05,
+      "loss": 0.5904,
+      "step": 240
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 7.8e-05,
+      "loss": 0.5853,
+      "step": 250
+    },
+    {
+      "epoch": 0.39,
+      "eval_loss": 0.594174325466156,
+      "eval_runtime": 9.5893,
+      "eval_samples_per_second": 20.857,
+      "eval_steps_per_second": 2.607,
+      "step": 250
+    }
+  ],
+  "max_steps": 300,
+  "num_train_epochs": 1,
+  "total_flos": 2.2062818402107392e+17,
+  "trial_name": null,
+  "trial_params": null
+}

experiments/checkpoint-250/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be4ec138b6339576c00fef284fd852b5850365d5171336195581652280fa859d
+size 3899

experiments/checkpoint-300/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c6f1c3758082520d940b854c2d25b58a3f83aa3330aa9001e9d83434d2b7634
+size 33661637

experiments/checkpoint-300/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e54e3c5b13d55e55821cb7c88f704123c5de2c7617cd137d740f1ed06b80e2df
+size 16822989

experiments/checkpoint-300/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3c5f3a418c95e7400992c8f8e6e47e0843d0dfa05067f1d650c66a3a05f3f09a
+size 14575

experiments/checkpoint-300/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:473957f40dfb57902efb831c2282a51b3b67e7025fd09020b4382671aa15b281
+size 627

experiments/checkpoint-300/trainer_state.json ADDED Viewed

	@@ -0,0 +1,244 @@

+{
+  "best_metric": 0.5911636352539062,
+  "best_model_checkpoint": "experiments/checkpoint-300",
+  "epoch": 0.4669260700389105,
+  "global_step": 300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.5075,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 5.6999999999999996e-05,
+      "loss": 2.3737,
+      "step": 20
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 8.699999999999999e-05,
+      "loss": 2.0938,
+      "step": 30
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 0.00011399999999999999,
+      "loss": 1.4761,
+      "step": 40
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.00014399999999999998,
+      "loss": 1.0161,
+      "step": 50
+    },
+    {
+      "epoch": 0.08,
+      "eval_loss": 0.9799935817718506,
+      "eval_runtime": 9.5951,
+      "eval_samples_per_second": 20.844,
+      "eval_steps_per_second": 2.605,
+      "step": 50
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 0.00017399999999999997,
+      "loss": 0.9253,
+      "step": 60
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 0.000204,
+      "loss": 0.8183,
+      "step": 70
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 0.000234,
+      "loss": 0.7652,
+      "step": 80
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.00026399999999999997,
+      "loss": 0.7233,
+      "step": 90
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.000294,
+      "loss": 0.7036,
+      "step": 100
+    },
+    {
+      "epoch": 0.16,
+      "eval_loss": 0.7070202827453613,
+      "eval_runtime": 9.6202,
+      "eval_samples_per_second": 20.79,
+      "eval_steps_per_second": 2.599,
+      "step": 100
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 0.00028799999999999995,
+      "loss": 0.6666,
+      "step": 110
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.00027299999999999997,
+      "loss": 0.6375,
+      "step": 120
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.000258,
+      "loss": 0.6207,
+      "step": 130
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 0.000243,
+      "loss": 0.6246,
+      "step": 140
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00022799999999999999,
+      "loss": 0.6133,
+      "step": 150
+    },
+    {
+      "epoch": 0.23,
+      "eval_loss": 0.6191394925117493,
+      "eval_runtime": 9.5788,
+      "eval_samples_per_second": 20.879,
+      "eval_steps_per_second": 2.61,
+      "step": 150
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.00021299999999999997,
+      "loss": 0.6044,
+      "step": 160
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.000198,
+      "loss": 0.6098,
+      "step": 170
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00018299999999999998,
+      "loss": 0.6011,
+      "step": 180
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.000168,
+      "loss": 0.594,
+      "step": 190
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00015299999999999998,
+      "loss": 0.6002,
+      "step": 200
+    },
+    {
+      "epoch": 0.31,
+      "eval_loss": 0.6030644774436951,
+      "eval_runtime": 9.6172,
+      "eval_samples_per_second": 20.796,
+      "eval_steps_per_second": 2.6,
+      "step": 200
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.000138,
+      "loss": 0.5836,
+      "step": 210
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0.00012299999999999998,
+      "loss": 0.5911,
+      "step": 220
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00010799999999999998,
+      "loss": 0.5946,
+      "step": 230
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 9.3e-05,
+      "loss": 0.5904,
+      "step": 240
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 7.8e-05,
+      "loss": 0.5853,
+      "step": 250
+    },
+    {
+      "epoch": 0.39,
+      "eval_loss": 0.594174325466156,
+      "eval_runtime": 9.5893,
+      "eval_samples_per_second": 20.857,
+      "eval_steps_per_second": 2.607,
+      "step": 250
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.299999999999999e-05,
+      "loss": 0.5778,
+      "step": 260
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.7999999999999994e-05,
+      "loss": 0.5837,
+      "step": 270
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 3.2999999999999996e-05,
+      "loss": 0.574,
+      "step": 280
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 1.7999999999999997e-05,
+      "loss": 0.5868,
+      "step": 290
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 2.9999999999999997e-06,
+      "loss": 0.5822,
+      "step": 300
+    },
+    {
+      "epoch": 0.47,
+      "eval_loss": 0.5911636352539062,
+      "eval_runtime": 9.6181,
+      "eval_samples_per_second": 20.794,
+      "eval_steps_per_second": 2.599,
+      "step": 300
+    }
+  ],
+  "max_steps": 300,
+  "num_train_epochs": 1,
+  "total_flos": 2.6489142544171008e+17,
+  "trial_name": null,
+  "trial_params": null
+}

experiments/checkpoint-300/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be4ec138b6339576c00fef284fd852b5850365d5171336195581652280fa859d
+size 3899

experiments/runs/Jun01_05-20-38_342e8c5b39dd/1685596839.0285306/events.out.tfevents.1685596839.342e8c5b39dd.10274.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b3aecdc3e3b0d4e81dfaa732e0f498a36283db55116e45fcb10636da1a26a575
+size 5868

experiments/runs/Jun01_05-20-38_342e8c5b39dd/1685596845.6246781/events.out.tfevents.1685596845.342e8c5b39dd.10274.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:67bf0346552d0687fb392df5135c1c8c1351735c1ca7d4757882bb2ea02ff116
+size 5868

experiments/runs/Jun01_05-20-38_342e8c5b39dd/events.out.tfevents.1685596839.342e8c5b39dd.10274.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0813a51e29de49d6778894f3d027678813974276862fed2ea3ff9fa4697a1714
+size 88

experiments/runs/Jun01_05-20-38_342e8c5b39dd/events.out.tfevents.1685596845.342e8c5b39dd.10274.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:526c807cec22525b86393df7a49b59bb9531443e9c745abed2bfaf259f1077a3
+size 88

experiments/runs/Jun01_05-25-44_342e8c5b39dd/1685597145.1742842/events.out.tfevents.1685597145.342e8c5b39dd.13098.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c77bab4797108f90d14935eca73e7d6d31d69226cabaa36e1ba09748d5f017aa
+size 5904

experiments/runs/Jun01_05-25-44_342e8c5b39dd/events.out.tfevents.1685597145.342e8c5b39dd.13098.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82349c31bce8248fce0a6bdb56f0da8debc0aa713e19594f941a4572920a1ffc
+size 6679

experiments/runs/Jun01_07-13-15_090d8d4aa7e2/1685603596.0617163/events.out.tfevents.1685603596.090d8d4aa7e2.1898.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa9817e1e0a23e8b8e6123cd3f6f33960e34a4be8de098d5a16dc42a805296b5
+size 5904

experiments/runs/Jun01_07-13-15_090d8d4aa7e2/events.out.tfevents.1685603596.090d8d4aa7e2.1898.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a97d11864f539660db2b76acd30977a428652fe8f181c64c074ed6078c5e1a4f
+size 4915

experiments/runs/Jun01_08-58-37_11b0426da60f/1685609918.3124719/events.out.tfevents.1685609918.11b0426da60f.611.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:14772179c98698c1691a1150f1d29078e402f4357c57ccbd34873c66eac60f05
+size 5904

experiments/runs/Jun01_08-58-37_11b0426da60f/events.out.tfevents.1685609918.11b0426da60f.611.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:30acb00ba89945ec3ff9b0fd151540d8bd6c9241038b69deea7bfe25c36451a3
+size 10943

experiments/runs/Jun01_09-00-06_05555eff8aef/1685610006.9899611/events.out.tfevents.1685610007.05555eff8aef.2638.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45748c8c802b3454a18abecf8ef3f422519bea4ad417df8393e1ef54bedf9513
+size 5904

experiments/runs/Jun01_09-00-06_05555eff8aef/events.out.tfevents.1685610006.05555eff8aef.2638.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4519824f00a804671603fa3dcd76c1fe6b948088bc3b45207c49f31bd38c06de
+size 7892

experiments/runs/Jun01_16-23-40_05555eff8aef/1685636620.8436341/events.out.tfevents.1685636620.05555eff8aef.113292.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ccf0908097aeaad223511b32b0ab7ac61aabebad86f1ee61ff1d3d19fbdcee50
+size 5904

experiments/runs/Jun01_16-23-40_05555eff8aef/events.out.tfevents.1685636620.05555eff8aef.113292.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f3d8da01e8a529e5da4c5a442486dfcfea0b6a2e9ce1ba37b83580f96dcf8b79
+size 4761

experiments/runs/Jun01_19-42-51_d1618e311822/1685648572.7311761/events.out.tfevents.1685648572.d1618e311822.5586.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:291c88c22ebf7db54515c4236949550e1b01087d8ac8b884aa3426b8cb7c0428
+size 5904

experiments/runs/Jun01_19-42-51_d1618e311822/events.out.tfevents.1685648572.d1618e311822.5586.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:913581ad368589620dd81f221d235192b5e1456e3cd238c42a303b5b8c68a47d
+size 10943