SimonWSY commited on Sep 10, 2023

Commit

c62e26d

1 Parent(s): b2666e5

Upload 167 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

hackduke1/README.md +9 -0
hackduke1/adapter_config.json +24 -0
hackduke1/adapter_model.bin +3 -0
hackduke1/all_results.json +7 -0
hackduke1/checkpoint-100/README.md +9 -0
hackduke1/checkpoint-100/adapter_config.json +24 -0
hackduke1/checkpoint-100/adapter_model.bin +3 -0
hackduke1/checkpoint-100/finetuning_args.json +19 -0
hackduke1/checkpoint-100/optimizer.pt +3 -0
hackduke1/checkpoint-100/rng_state.pth +3 -0
hackduke1/checkpoint-100/scheduler.pt +3 -0
hackduke1/checkpoint-100/trainer_state.json +79 -0
hackduke1/checkpoint-100/training_args.bin +3 -0
hackduke1/checkpoint-1000/README.md +9 -0
hackduke1/checkpoint-1000/adapter_config.json +24 -0
hackduke1/checkpoint-1000/adapter_model.bin +3 -0
hackduke1/checkpoint-1000/finetuning_args.json +19 -0
hackduke1/checkpoint-1000/optimizer.pt +3 -0
hackduke1/checkpoint-1000/rng_state.pth +3 -0
hackduke1/checkpoint-1000/scheduler.pt +3 -0
hackduke1/checkpoint-1000/trainer_state.json +619 -0
hackduke1/checkpoint-1000/training_args.bin +3 -0
hackduke1/checkpoint-1100/README.md +9 -0
hackduke1/checkpoint-1100/adapter_config.json +24 -0
hackduke1/checkpoint-1100/adapter_model.bin +3 -0
hackduke1/checkpoint-1100/finetuning_args.json +19 -0
hackduke1/checkpoint-1100/optimizer.pt +3 -0
hackduke1/checkpoint-1100/rng_state.pth +3 -0
hackduke1/checkpoint-1100/scheduler.pt +3 -0
hackduke1/checkpoint-1100/trainer_state.json +679 -0
hackduke1/checkpoint-1100/training_args.bin +3 -0
hackduke1/checkpoint-200/README.md +9 -0
hackduke1/checkpoint-200/adapter_config.json +24 -0
hackduke1/checkpoint-200/adapter_model.bin +3 -0
hackduke1/checkpoint-200/finetuning_args.json +19 -0
hackduke1/checkpoint-200/optimizer.pt +3 -0
hackduke1/checkpoint-200/rng_state.pth +3 -0
hackduke1/checkpoint-200/scheduler.pt +3 -0
hackduke1/checkpoint-200/trainer_state.json +139 -0
hackduke1/checkpoint-200/training_args.bin +3 -0
hackduke1/checkpoint-300/README.md +9 -0
hackduke1/checkpoint-300/adapter_config.json +24 -0
hackduke1/checkpoint-300/adapter_model.bin +3 -0
hackduke1/checkpoint-300/finetuning_args.json +19 -0
hackduke1/checkpoint-300/optimizer.pt +3 -0
hackduke1/checkpoint-300/rng_state.pth +3 -0
hackduke1/checkpoint-300/scheduler.pt +3 -0
hackduke1/checkpoint-300/trainer_state.json +199 -0
hackduke1/checkpoint-300/training_args.bin +3 -0
hackduke1/checkpoint-400/README.md +9 -0

hackduke1/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:116af431e95ed2f09284b37c37fc71f713d8d4f96fd3c1efc52dead97ca87b4c
+size 33576177

hackduke1/all_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 9.93,
+    "train_loss": 1.5241096448090117,
+    "train_runtime": 23566.1012,
+    "train_samples_per_second": 1.614,
+    "train_steps_per_second": 0.05
+}

hackduke1/checkpoint-100/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/checkpoint-100/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/checkpoint-100/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55deaa7606be5a01e5039dc34669b4348778b72310cc1e0d9e243ac10b19d5a4
+size 33576177

hackduke1/checkpoint-100/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 16,
+  "lora_target": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

hackduke1/checkpoint-100/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ac0a142daf62a2a49db3546027f1df8b629f14a1e994e936547e398899f2122
+size 67147589

hackduke1/checkpoint-100/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:db50077f1eb9cbedc143814b21b2be4cafe9bbc984e227373d92c61ebf315465
+size 14575

hackduke1/checkpoint-100/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d041a7e96c17819841a9a0c03258454e444965f215930b8240eeecb6ee97e88
+size 627

hackduke1/checkpoint-100/trainer_state.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.8412197686645636,
+  "eval_steps": 100.0,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 5e-06,
+      "loss": 4.1311,
+      "step": 10
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1e-05,
+      "loss": 4.0983,
+      "step": 20
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.5e-05,
+      "loss": 3.9944,
+      "step": 30
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2e-05,
+      "loss": 3.8495,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.5e-05,
+      "loss": 3.5944,
+      "step": 50
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 3e-05,
+      "loss": 3.1649,
+      "step": 60
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.5e-05,
+      "loss": 3.0072,
+      "step": 70
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4e-05,
+      "loss": 2.9697,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.5e-05,
+      "loss": 2.8497,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 5e-05,
+      "loss": 2.8376,
+      "step": 100
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1180,
+  "num_train_epochs": 10,
+  "save_steps": 100,
+  "total_flos": 8.641986753645773e+16,
+  "trial_name": null,
+  "trial_params": null
+}

hackduke1/checkpoint-100/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53de37053b6032a74e6fda2a983e6126718c64bf2e866e225af8abfa727bba20
+size 3347

hackduke1/checkpoint-1000/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/checkpoint-1000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/checkpoint-1000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77465051c0e3b489a82396200a03f3aaa589feb7dfeb82a0afdee4ee67e02905
+size 33576177

hackduke1/checkpoint-1000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 16,
+  "lora_target": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

hackduke1/checkpoint-1000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d03d67f3f8b3c98c291f9aaf18ab103185885eaac4648280aa3722c64b81998d
+size 67147653

hackduke1/checkpoint-1000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1989b96431be4c9d668275f57ec5ec884da4ce3dcd28562a0ab40aae8fb83e14
+size 14575

hackduke1/checkpoint-1000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a1d5d6425646b33604eed6cb67a751cd38fe0fd43bbe4c65d1ec71837a4a2b3
+size 627

hackduke1/checkpoint-1000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,619 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 8.412197686645635,
+  "eval_steps": 100.0,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 5e-06,
+      "loss": 4.1311,
+      "step": 10
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1e-05,
+      "loss": 4.0983,
+      "step": 20
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.5e-05,
+      "loss": 3.9944,
+      "step": 30
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2e-05,
+      "loss": 3.8495,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.5e-05,
+      "loss": 3.5944,
+      "step": 50
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 3e-05,
+      "loss": 3.1649,
+      "step": 60
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.5e-05,
+      "loss": 3.0072,
+      "step": 70
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4e-05,
+      "loss": 2.9697,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.5e-05,
+      "loss": 2.8497,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 5e-05,
+      "loss": 2.8376,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.998942375205502e-05,
+      "loss": 2.8255,
+      "step": 110
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.995770395678171e-05,
+      "loss": 2.7066,
+      "step": 120
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 4.990486745229364e-05,
+      "loss": 2.6717,
+      "step": 130
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 4.983095894354858e-05,
+      "loss": 2.6093,
+      "step": 140
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 4.973604096452361e-05,
+      "loss": 2.588,
+      "step": 150
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 4.962019382530521e-05,
+      "loss": 2.5881,
+      "step": 160
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 4.948351554413879e-05,
+      "loss": 2.4645,
+      "step": 170
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 4.9326121764495596e-05,
+      "loss": 2.4118,
+      "step": 180
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 4.914814565722671e-05,
+      "loss": 2.5078,
+      "step": 190
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.894973780788722e-05,
+      "loss": 2.3461,
+      "step": 200
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 4.873106608932585e-05,
+      "loss": 2.3559,
+      "step": 210
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 4.849231551964771e-05,
+      "loss": 2.4097,
+      "step": 220
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 4.823368810567056e-05,
+      "loss": 2.2607,
+      "step": 230
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 4.7955402672006854e-05,
+      "loss": 2.1208,
+      "step": 240
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 4.765769467591625e-05,
+      "loss": 2.112,
+      "step": 250
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 4.734081600808531e-05,
+      "loss": 2.1259,
+      "step": 260
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 4.700503477950278e-05,
+      "loss": 2.1712,
+      "step": 270
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 4.665063509461097e-05,
+      "loss": 1.9872,
+      "step": 280
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.627791681092499e-05,
+      "loss": 1.9918,
+      "step": 290
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 4.588719528532342e-05,
+      "loss": 2.0882,
+      "step": 300
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 4.54788011072248e-05,
+      "loss": 1.9361,
+      "step": 310
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 4.50530798188761e-05,
+      "loss": 1.9715,
+      "step": 320
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 4.4610391622989396e-05,
+      "loss": 1.8659,
+      "step": 330
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 4.415111107797445e-05,
+      "loss": 1.8453,
+      "step": 340
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 4.36756267810249e-05,
+      "loss": 1.9347,
+      "step": 350
+    },
+    {
+      "epoch": 3.03,
+      "learning_rate": 4.318434103932622e-05,
+      "loss": 1.8471,
+      "step": 360
+    },
+    {
+      "epoch": 3.11,
+      "learning_rate": 4.267766952966369e-05,
+      "loss": 1.7312,
+      "step": 370
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 4.215604094671835e-05,
+      "loss": 1.5693,
+      "step": 380
+    },
+    {
+      "epoch": 3.28,
+      "learning_rate": 4.1619896640348445e-05,
+      "loss": 1.7114,
+      "step": 390
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 4.1069690242163484e-05,
+      "loss": 1.5693,
+      "step": 400
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 4.05058872817065e-05,
+      "loss": 1.588,
+      "step": 410
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 3.9928964792569655e-05,
+      "loss": 1.6776,
+      "step": 420
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 3.933941090877615e-05,
+      "loss": 1.633,
+      "step": 430
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 3.873772445177015e-05,
+      "loss": 1.5435,
+      "step": 440
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 3.8124414508364e-05,
+      "loss": 1.522,
+      "step": 450
+    },
+    {
+      "epoch": 3.87,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 1.4307,
+      "step": 460
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 3.686500924369101e-05,
+      "loss": 1.6171,
+      "step": 470
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 3.621997950501156e-05,
+      "loss": 1.482,
+      "step": 480
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 3.556545654351749e-05,
+      "loss": 1.4552,
+      "step": 490
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 3.490199415097892e-05,
+      "loss": 1.2726,
+      "step": 500
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 3.423015368281711e-05,
+      "loss": 1.312,
+      "step": 510
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 3.355050358314172e-05,
+      "loss": 1.3236,
+      "step": 520
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 3.2863618903790346e-05,
+      "loss": 1.2786,
+      "step": 530
+    },
+    {
+      "epoch": 4.54,
+      "learning_rate": 3.217008081777726e-05,
+      "loss": 1.2587,
+      "step": 540
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 3.147047612756302e-05,
+      "loss": 1.3509,
+      "step": 550
+    },
+    {
+      "epoch": 4.71,
+      "learning_rate": 3.076539676856101e-05,
+      "loss": 1.2632,
+      "step": 560
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 3.0055439308300952e-05,
+      "loss": 1.2215,
+      "step": 570
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 2.9341204441673266e-05,
+      "loss": 1.2773,
+      "step": 580
+    },
+    {
+      "epoch": 4.96,
+      "learning_rate": 2.8623296482681166e-05,
+      "loss": 1.3122,
+      "step": 590
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 2.7902322853130757e-05,
+      "loss": 1.2999,
+      "step": 600
+    },
+    {
+      "epoch": 5.13,
+      "learning_rate": 2.717889356869146e-05,
+      "loss": 1.13,
+      "step": 610
+    },
+    {
+      "epoch": 5.22,
+      "learning_rate": 2.6453620722761896e-05,
+      "loss": 1.1283,
+      "step": 620
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 2.5727117968577784e-05,
+      "loss": 1.0922,
+      "step": 630
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 2.5e-05,
+      "loss": 1.0549,
+      "step": 640
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 2.4272882031422215e-05,
+      "loss": 1.0966,
+      "step": 650
+    },
+    {
+      "epoch": 5.55,
+      "learning_rate": 2.3546379277238107e-05,
+      "loss": 1.2114,
+      "step": 660
+    },
+    {
+      "epoch": 5.64,
+      "learning_rate": 2.2821106431308544e-05,
+      "loss": 0.9685,
+      "step": 670
+    },
+    {
+      "epoch": 5.72,
+      "learning_rate": 2.2097677146869242e-05,
+      "loss": 0.9688,
+      "step": 680
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 2.1376703517318837e-05,
+      "loss": 1.0943,
+      "step": 690
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 2.0658795558326743e-05,
+      "loss": 0.9363,
+      "step": 700
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 1.9944560691699057e-05,
+      "loss": 1.1054,
+      "step": 710
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 1.9234603231438995e-05,
+      "loss": 1.0781,
+      "step": 720
+    },
+    {
+      "epoch": 6.14,
+      "learning_rate": 1.852952387243698e-05,
+      "loss": 0.8869,
+      "step": 730
+    },
+    {
+      "epoch": 6.23,
+      "learning_rate": 1.7829919182222752e-05,
+      "loss": 0.8957,
+      "step": 740
+    },
+    {
+      "epoch": 6.31,
+      "learning_rate": 1.7136381096209664e-05,
+      "loss": 1.0628,
+      "step": 750
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 1.6449496416858284e-05,
+      "loss": 1.0005,
+      "step": 760
+    },
+    {
+      "epoch": 6.48,
+      "learning_rate": 1.5769846317182893e-05,
+      "loss": 0.9747,
+      "step": 770
+    },
+    {
+      "epoch": 6.56,
+      "learning_rate": 1.509800584902108e-05,
+      "loss": 1.0524,
+      "step": 780
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 1.443454345648252e-05,
+      "loss": 1.0064,
+      "step": 790
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 1.3780020494988446e-05,
+      "loss": 0.979,
+      "step": 800
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 1.313499075630899e-05,
+      "loss": 0.9495,
+      "step": 810
+    },
+    {
+      "epoch": 6.9,
+      "learning_rate": 1.2500000000000006e-05,
+      "loss": 0.8098,
+      "step": 820
+    },
+    {
+      "epoch": 6.98,
+      "learning_rate": 1.1875585491636e-05,
+      "loss": 0.9074,
+      "step": 830
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 1.126227554822985e-05,
+      "loss": 0.8522,
+      "step": 840
+    },
+    {
+      "epoch": 7.15,
+      "learning_rate": 1.0660589091223855e-05,
+      "loss": 0.8949,
+      "step": 850
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1.0071035207430352e-05,
+      "loss": 0.9344,
+      "step": 860
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 9.494112718293501e-06,
+      "loss": 0.7258,
+      "step": 870
+    },
+    {
+      "epoch": 7.4,
+      "learning_rate": 8.930309757836517e-06,
+      "loss": 0.8315,
+      "step": 880
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 8.380103359651553e-06,
+      "loss": 0.9103,
+      "step": 890
+    },
+    {
+      "epoch": 7.57,
+      "learning_rate": 7.843959053281663e-06,
+      "loss": 0.8161,
+      "step": 900
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 7.3223304703363135e-06,
+      "loss": 0.8657,
+      "step": 910
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 6.815658960673782e-06,
+      "loss": 0.8315,
+      "step": 920
+    },
+    {
+      "epoch": 7.82,
+      "learning_rate": 6.324373218975105e-06,
+      "loss": 0.8273,
+      "step": 930
+    },
+    {
+      "epoch": 7.91,
+      "learning_rate": 5.848888922025553e-06,
+      "loss": 0.8765,
+      "step": 940
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 5.389608377010608e-06,
+      "loss": 0.8816,
+      "step": 950
+    },
+    {
+      "epoch": 8.08,
+      "learning_rate": 4.946920181123904e-06,
+      "loss": 0.8582,
+      "step": 960
+    },
+    {
+      "epoch": 8.16,
+      "learning_rate": 4.521198892775203e-06,
+      "loss": 0.7583,
+      "step": 970
+    },
+    {
+      "epoch": 8.24,
+      "learning_rate": 4.112804714676594e-06,
+      "loss": 0.862,
+      "step": 980
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 3.7220831890750067e-06,
+      "loss": 0.8618,
+      "step": 990
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 3.3493649053890326e-06,
+      "loss": 0.6312,
+      "step": 1000
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1180,
+  "num_train_epochs": 10,
+  "save_steps": 100,
+  "total_flos": 8.63087876644012e+17,
+  "trial_name": null,
+  "trial_params": null
+}

hackduke1/checkpoint-1000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53de37053b6032a74e6fda2a983e6126718c64bf2e866e225af8abfa727bba20
+size 3347

hackduke1/checkpoint-1100/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/checkpoint-1100/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/checkpoint-1100/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dbc59d19d1ca82c85201de069cfc037a61f048a13dd3c481b1b04e5691e660de
+size 33576177

hackduke1/checkpoint-1100/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 16,
+  "lora_target": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

hackduke1/checkpoint-1100/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80d4cf7300a93886bdfdaabcd8ea4203feb38cdba1dd85d1be25f29cd41e305a
+size 67147653

hackduke1/checkpoint-1100/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9e3b3f700cfedc34d382047ee40e12ae29301b40125f7c8fbdc132d03520170
+size 14575

hackduke1/checkpoint-1100/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57781510400d40de02766b75b37cd6fbec2419b43e817559e3a8cf8ed6822b95
+size 627

hackduke1/checkpoint-1100/trainer_state.json ADDED Viewed

	@@ -0,0 +1,679 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 9.253417455310199,
+  "eval_steps": 100.0,
+  "global_step": 1100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 5e-06,
+      "loss": 4.1311,
+      "step": 10
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1e-05,
+      "loss": 4.0983,
+      "step": 20
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.5e-05,
+      "loss": 3.9944,
+      "step": 30
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2e-05,
+      "loss": 3.8495,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.5e-05,
+      "loss": 3.5944,
+      "step": 50
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 3e-05,
+      "loss": 3.1649,
+      "step": 60
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.5e-05,
+      "loss": 3.0072,
+      "step": 70
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4e-05,
+      "loss": 2.9697,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.5e-05,
+      "loss": 2.8497,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 5e-05,
+      "loss": 2.8376,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.998942375205502e-05,
+      "loss": 2.8255,
+      "step": 110
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.995770395678171e-05,
+      "loss": 2.7066,
+      "step": 120
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 4.990486745229364e-05,
+      "loss": 2.6717,
+      "step": 130
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 4.983095894354858e-05,
+      "loss": 2.6093,
+      "step": 140
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 4.973604096452361e-05,
+      "loss": 2.588,
+      "step": 150
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 4.962019382530521e-05,
+      "loss": 2.5881,
+      "step": 160
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 4.948351554413879e-05,
+      "loss": 2.4645,
+      "step": 170
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 4.9326121764495596e-05,
+      "loss": 2.4118,
+      "step": 180
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 4.914814565722671e-05,
+      "loss": 2.5078,
+      "step": 190
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.894973780788722e-05,
+      "loss": 2.3461,
+      "step": 200
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 4.873106608932585e-05,
+      "loss": 2.3559,
+      "step": 210
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 4.849231551964771e-05,
+      "loss": 2.4097,
+      "step": 220
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 4.823368810567056e-05,
+      "loss": 2.2607,
+      "step": 230
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 4.7955402672006854e-05,
+      "loss": 2.1208,
+      "step": 240
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 4.765769467591625e-05,
+      "loss": 2.112,
+      "step": 250
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 4.734081600808531e-05,
+      "loss": 2.1259,
+      "step": 260
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 4.700503477950278e-05,
+      "loss": 2.1712,
+      "step": 270
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 4.665063509461097e-05,
+      "loss": 1.9872,
+      "step": 280
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.627791681092499e-05,
+      "loss": 1.9918,
+      "step": 290
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 4.588719528532342e-05,
+      "loss": 2.0882,
+      "step": 300
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 4.54788011072248e-05,
+      "loss": 1.9361,
+      "step": 310
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 4.50530798188761e-05,
+      "loss": 1.9715,
+      "step": 320
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 4.4610391622989396e-05,
+      "loss": 1.8659,
+      "step": 330
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 4.415111107797445e-05,
+      "loss": 1.8453,
+      "step": 340
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 4.36756267810249e-05,
+      "loss": 1.9347,
+      "step": 350
+    },
+    {
+      "epoch": 3.03,
+      "learning_rate": 4.318434103932622e-05,
+      "loss": 1.8471,
+      "step": 360
+    },
+    {
+      "epoch": 3.11,
+      "learning_rate": 4.267766952966369e-05,
+      "loss": 1.7312,
+      "step": 370
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 4.215604094671835e-05,
+      "loss": 1.5693,
+      "step": 380
+    },
+    {
+      "epoch": 3.28,
+      "learning_rate": 4.1619896640348445e-05,
+      "loss": 1.7114,
+      "step": 390
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 4.1069690242163484e-05,
+      "loss": 1.5693,
+      "step": 400
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 4.05058872817065e-05,
+      "loss": 1.588,
+      "step": 410
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 3.9928964792569655e-05,
+      "loss": 1.6776,
+      "step": 420
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 3.933941090877615e-05,
+      "loss": 1.633,
+      "step": 430
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 3.873772445177015e-05,
+      "loss": 1.5435,
+      "step": 440
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 3.8124414508364e-05,
+      "loss": 1.522,
+      "step": 450
+    },
+    {
+      "epoch": 3.87,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 1.4307,
+      "step": 460
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 3.686500924369101e-05,
+      "loss": 1.6171,
+      "step": 470
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 3.621997950501156e-05,
+      "loss": 1.482,
+      "step": 480
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 3.556545654351749e-05,
+      "loss": 1.4552,
+      "step": 490
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 3.490199415097892e-05,
+      "loss": 1.2726,
+      "step": 500
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 3.423015368281711e-05,
+      "loss": 1.312,
+      "step": 510
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 3.355050358314172e-05,
+      "loss": 1.3236,
+      "step": 520
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 3.2863618903790346e-05,
+      "loss": 1.2786,
+      "step": 530
+    },
+    {
+      "epoch": 4.54,
+      "learning_rate": 3.217008081777726e-05,
+      "loss": 1.2587,
+      "step": 540
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 3.147047612756302e-05,
+      "loss": 1.3509,
+      "step": 550
+    },
+    {
+      "epoch": 4.71,
+      "learning_rate": 3.076539676856101e-05,
+      "loss": 1.2632,
+      "step": 560
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 3.0055439308300952e-05,
+      "loss": 1.2215,
+      "step": 570
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 2.9341204441673266e-05,
+      "loss": 1.2773,
+      "step": 580
+    },
+    {
+      "epoch": 4.96,
+      "learning_rate": 2.8623296482681166e-05,
+      "loss": 1.3122,
+      "step": 590
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 2.7902322853130757e-05,
+      "loss": 1.2999,
+      "step": 600
+    },
+    {
+      "epoch": 5.13,
+      "learning_rate": 2.717889356869146e-05,
+      "loss": 1.13,
+      "step": 610
+    },
+    {
+      "epoch": 5.22,
+      "learning_rate": 2.6453620722761896e-05,
+      "loss": 1.1283,
+      "step": 620
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 2.5727117968577784e-05,
+      "loss": 1.0922,
+      "step": 630
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 2.5e-05,
+      "loss": 1.0549,
+      "step": 640
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 2.4272882031422215e-05,
+      "loss": 1.0966,
+      "step": 650
+    },
+    {
+      "epoch": 5.55,
+      "learning_rate": 2.3546379277238107e-05,
+      "loss": 1.2114,
+      "step": 660
+    },
+    {
+      "epoch": 5.64,
+      "learning_rate": 2.2821106431308544e-05,
+      "loss": 0.9685,
+      "step": 670
+    },
+    {
+      "epoch": 5.72,
+      "learning_rate": 2.2097677146869242e-05,
+      "loss": 0.9688,
+      "step": 680
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 2.1376703517318837e-05,
+      "loss": 1.0943,
+      "step": 690
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 2.0658795558326743e-05,
+      "loss": 0.9363,
+      "step": 700
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 1.9944560691699057e-05,
+      "loss": 1.1054,
+      "step": 710
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 1.9234603231438995e-05,
+      "loss": 1.0781,
+      "step": 720
+    },
+    {
+      "epoch": 6.14,
+      "learning_rate": 1.852952387243698e-05,
+      "loss": 0.8869,
+      "step": 730
+    },
+    {
+      "epoch": 6.23,
+      "learning_rate": 1.7829919182222752e-05,
+      "loss": 0.8957,
+      "step": 740
+    },
+    {
+      "epoch": 6.31,
+      "learning_rate": 1.7136381096209664e-05,
+      "loss": 1.0628,
+      "step": 750
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 1.6449496416858284e-05,
+      "loss": 1.0005,
+      "step": 760
+    },
+    {
+      "epoch": 6.48,
+      "learning_rate": 1.5769846317182893e-05,
+      "loss": 0.9747,
+      "step": 770
+    },
+    {
+      "epoch": 6.56,
+      "learning_rate": 1.509800584902108e-05,
+      "loss": 1.0524,
+      "step": 780
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 1.443454345648252e-05,
+      "loss": 1.0064,
+      "step": 790
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 1.3780020494988446e-05,
+      "loss": 0.979,
+      "step": 800
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 1.313499075630899e-05,
+      "loss": 0.9495,
+      "step": 810
+    },
+    {
+      "epoch": 6.9,
+      "learning_rate": 1.2500000000000006e-05,
+      "loss": 0.8098,
+      "step": 820
+    },
+    {
+      "epoch": 6.98,
+      "learning_rate": 1.1875585491636e-05,
+      "loss": 0.9074,
+      "step": 830
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 1.126227554822985e-05,
+      "loss": 0.8522,
+      "step": 840
+    },
+    {
+      "epoch": 7.15,
+      "learning_rate": 1.0660589091223855e-05,
+      "loss": 0.8949,
+      "step": 850
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1.0071035207430352e-05,
+      "loss": 0.9344,
+      "step": 860
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 9.494112718293501e-06,
+      "loss": 0.7258,
+      "step": 870
+    },
+    {
+      "epoch": 7.4,
+      "learning_rate": 8.930309757836517e-06,
+      "loss": 0.8315,
+      "step": 880
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 8.380103359651553e-06,
+      "loss": 0.9103,
+      "step": 890
+    },
+    {
+      "epoch": 7.57,
+      "learning_rate": 7.843959053281663e-06,
+      "loss": 0.8161,
+      "step": 900
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 7.3223304703363135e-06,
+      "loss": 0.8657,
+      "step": 910
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 6.815658960673782e-06,
+      "loss": 0.8315,
+      "step": 920
+    },
+    {
+      "epoch": 7.82,
+      "learning_rate": 6.324373218975105e-06,
+      "loss": 0.8273,
+      "step": 930
+    },
+    {
+      "epoch": 7.91,
+      "learning_rate": 5.848888922025553e-06,
+      "loss": 0.8765,
+      "step": 940
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 5.389608377010608e-06,
+      "loss": 0.8816,
+      "step": 950
+    },
+    {
+      "epoch": 8.08,
+      "learning_rate": 4.946920181123904e-06,
+      "loss": 0.8582,
+      "step": 960
+    },
+    {
+      "epoch": 8.16,
+      "learning_rate": 4.521198892775203e-06,
+      "loss": 0.7583,
+      "step": 970
+    },
+    {
+      "epoch": 8.24,
+      "learning_rate": 4.112804714676594e-06,
+      "loss": 0.862,
+      "step": 980
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 3.7220831890750067e-06,
+      "loss": 0.8618,
+      "step": 990
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 3.3493649053890326e-06,
+      "loss": 0.6312,
+      "step": 1000
+    },
+    {
+      "epoch": 8.5,
+      "learning_rate": 2.9949652204972254e-06,
+      "loss": 0.8316,
+      "step": 1010
+    },
+    {
+      "epoch": 8.58,
+      "learning_rate": 2.659183991914696e-06,
+      "loss": 0.8118,
+      "step": 1020
+    },
+    {
+      "epoch": 8.66,
+      "learning_rate": 2.3423053240837515e-06,
+      "loss": 0.8255,
+      "step": 1030
+    },
+    {
+      "epoch": 8.75,
+      "learning_rate": 2.044597327993153e-06,
+      "loss": 0.7131,
+      "step": 1040
+    },
+    {
+      "epoch": 8.83,
+      "learning_rate": 1.7663118943294366e-06,
+      "loss": 0.8605,
+      "step": 1050
+    },
+    {
+      "epoch": 8.92,
+      "learning_rate": 1.5076844803522922e-06,
+      "loss": 0.7849,
+      "step": 1060
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 1.2689339106741527e-06,
+      "loss": 0.8457,
+      "step": 1070
+    },
+    {
+      "epoch": 9.09,
+      "learning_rate": 1.0502621921127776e-06,
+      "loss": 0.7074,
+      "step": 1080
+    },
+    {
+      "epoch": 9.17,
+      "learning_rate": 8.51854342773295e-07,
+      "loss": 0.7921,
+      "step": 1090
+    },
+    {
+      "epoch": 9.25,
+      "learning_rate": 6.738782355044049e-07,
+      "loss": 0.7745,
+      "step": 1100
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1180,
+  "num_train_epochs": 10,
+  "save_steps": 100,
+  "total_flos": 9.486456470161981e+17,
+  "trial_name": null,
+  "trial_params": null
+}

hackduke1/checkpoint-1100/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53de37053b6032a74e6fda2a983e6126718c64bf2e866e225af8abfa727bba20
+size 3347

hackduke1/checkpoint-200/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/checkpoint-200/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/checkpoint-200/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffc38b0fc94d5a1f32262242e8bfa00dcce919950c0d2395cd70b6e8d37e2082
+size 33576177

hackduke1/checkpoint-200/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 16,
+  "lora_target": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

hackduke1/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:863092e962bafa936ac7809c037a3f8d0734753f6f4329a4ec99edf773fd08b5
+size 67147589

hackduke1/checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ebf53d5d68fb637ac98b718cd5102b8def2c6ed4594c45d75daad7b25554081
+size 14575

hackduke1/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f3b91ae626c54779c8c48b864855fc030493662d74d678106549aa69ee92904
+size 627

hackduke1/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,139 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.6824395373291272,
+  "eval_steps": 100.0,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 5e-06,
+      "loss": 4.1311,
+      "step": 10
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1e-05,
+      "loss": 4.0983,
+      "step": 20
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.5e-05,
+      "loss": 3.9944,
+      "step": 30
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2e-05,
+      "loss": 3.8495,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.5e-05,
+      "loss": 3.5944,
+      "step": 50
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 3e-05,
+      "loss": 3.1649,
+      "step": 60
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.5e-05,
+      "loss": 3.0072,
+      "step": 70
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4e-05,
+      "loss": 2.9697,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.5e-05,
+      "loss": 2.8497,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 5e-05,
+      "loss": 2.8376,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.998942375205502e-05,
+      "loss": 2.8255,
+      "step": 110
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.995770395678171e-05,
+      "loss": 2.7066,
+      "step": 120
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 4.990486745229364e-05,
+      "loss": 2.6717,
+      "step": 130
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 4.983095894354858e-05,
+      "loss": 2.6093,
+      "step": 140
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 4.973604096452361e-05,
+      "loss": 2.588,
+      "step": 150
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 4.962019382530521e-05,
+      "loss": 2.5881,
+      "step": 160
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 4.948351554413879e-05,
+      "loss": 2.4645,
+      "step": 170
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 4.9326121764495596e-05,
+      "loss": 2.4118,
+      "step": 180
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 4.914814565722671e-05,
+      "loss": 2.5078,
+      "step": 190
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.894973780788722e-05,
+      "loss": 2.3461,
+      "step": 200
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1180,
+  "num_train_epochs": 10,
+  "save_steps": 100,
+  "total_flos": 1.733059225580667e+17,
+  "trial_name": null,
+  "trial_params": null
+}

hackduke1/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53de37053b6032a74e6fda2a983e6126718c64bf2e866e225af8abfa727bba20
+size 3347

hackduke1/checkpoint-300/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0

hackduke1/checkpoint-300/adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "Models/Qwen-7B-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

hackduke1/checkpoint-300/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c7c5504ba98370ec6e102751572e15826d1dfcf25c3137242366ea11ff021ef
+size 33576177

hackduke1/checkpoint-300/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 16,
+  "lora_target": [
+    "c_attn",
+    "o_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

hackduke1/checkpoint-300/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90559a30008bb929e83d33121e2eff56956e57267dc8ebd2da0146e970821bd6
+size 67147653

hackduke1/checkpoint-300/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:36db46935b973ab40f77c618c613f66b954aa6d0944c46d67697e4dc5e9e0136
+size 14575

hackduke1/checkpoint-300/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e0e8ef46b0af798d6a98afd906d7eda3caa728904822a41e829a48ad5e7aa72
+size 627

hackduke1/checkpoint-300/trainer_state.json ADDED Viewed

	@@ -0,0 +1,199 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.5236593059936907,
+  "eval_steps": 100.0,
+  "global_step": 300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 5e-06,
+      "loss": 4.1311,
+      "step": 10
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1e-05,
+      "loss": 4.0983,
+      "step": 20
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 1.5e-05,
+      "loss": 3.9944,
+      "step": 30
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2e-05,
+      "loss": 3.8495,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.5e-05,
+      "loss": 3.5944,
+      "step": 50
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 3e-05,
+      "loss": 3.1649,
+      "step": 60
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.5e-05,
+      "loss": 3.0072,
+      "step": 70
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4e-05,
+      "loss": 2.9697,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.5e-05,
+      "loss": 2.8497,
+      "step": 90
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 5e-05,
+      "loss": 2.8376,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.998942375205502e-05,
+      "loss": 2.8255,
+      "step": 110
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.995770395678171e-05,
+      "loss": 2.7066,
+      "step": 120
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 4.990486745229364e-05,
+      "loss": 2.6717,
+      "step": 130
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 4.983095894354858e-05,
+      "loss": 2.6093,
+      "step": 140
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 4.973604096452361e-05,
+      "loss": 2.588,
+      "step": 150
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 4.962019382530521e-05,
+      "loss": 2.5881,
+      "step": 160
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 4.948351554413879e-05,
+      "loss": 2.4645,
+      "step": 170
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 4.9326121764495596e-05,
+      "loss": 2.4118,
+      "step": 180
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 4.914814565722671e-05,
+      "loss": 2.5078,
+      "step": 190
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.894973780788722e-05,
+      "loss": 2.3461,
+      "step": 200
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 4.873106608932585e-05,
+      "loss": 2.3559,
+      "step": 210
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 4.849231551964771e-05,
+      "loss": 2.4097,
+      "step": 220
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 4.823368810567056e-05,
+      "loss": 2.2607,
+      "step": 230
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 4.7955402672006854e-05,
+      "loss": 2.1208,
+      "step": 240
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 4.765769467591625e-05,
+      "loss": 2.112,
+      "step": 250
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 4.734081600808531e-05,
+      "loss": 2.1259,
+      "step": 260
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 4.700503477950278e-05,
+      "loss": 2.1712,
+      "step": 270
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 4.665063509461097e-05,
+      "loss": 1.9872,
+      "step": 280
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.627791681092499e-05,
+      "loss": 1.9918,
+      "step": 290
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 4.588719528532342e-05,
+      "loss": 2.0882,
+      "step": 300
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1180,
+  "num_train_epochs": 10,
+  "save_steps": 100,
+  "total_flos": 2.5973073683329843e+17,
+  "trial_name": null,
+  "trial_params": null
+}

hackduke1/checkpoint-300/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53de37053b6032a74e6fda2a983e6126718c64bf2e866e225af8abfa727bba20
+size 3347

hackduke1/checkpoint-400/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.4.0