Replace with conservative adapters (LR: 1e-4, 500 iters) - 100% test pass rate

Files changed (7) hide show

0000100_adapters.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa6ec1c44520c102de41a223ceca79bbef6528dbddbccebc979f0238bf2f51ca
-size 6822661

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b3bc5d89ca37687efc247308185d7d85f1e260cbdf86cc33152f87a25538855
+size 3411329

0000200_adapters.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:974dc971289eba9df04a273689a18a74f580f40f4e4e6bb9245ae3899b7a2d4a
-size 6822661

 version https://git-lfs.github.com/spec/v1
+oid sha256:679916c91648bf3dc1bbda797cf55653c71aece2429d71cbada57f677c717b8a
+size 3411329

0000300_adapters.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6154b505f4e55979a12eaa089d1d25a5a842115fcf58fa6d97a456fa310ea97e
-size 6822661

 version https://git-lfs.github.com/spec/v1
+oid sha256:2be5932e764c9707d258639bd4297807132c198ce56a1b9a493f7d46ad011cf9
+size 3411329

0000400_adapters.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c01ddcc4203753bc387c299883048c6d77c37378dbf0768b3518adad53a3594e
+size 3411329

0000500_adapters.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:78097e4cccdf6814c66d0c50fd2318772ef682e44d20eb3fcf087204b9018832
+size 3411329

adapter_config.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "adapter_path": "serum_lora_adapters/production_adapters",
     "batch_size": 8,
     "config": null,
-    "data": "serum_lora_adapters/training_data",
     "fine_tune_type": "lora",
     "grad_checkpoint": false,
-    "iters": 300,
-    "learning_rate": 0.0003,
     "lora_parameters": {
         "rank": 8,
         "dropout": 0.0,
@@ -16,7 +16,7 @@
     "mask_prompt": false,
     "max_seq_length": 2048,
     "model": "NousResearch/Hermes-2-Pro-Mistral-7B",
-    "num_layers": 16,
     "optimizer": "adam",
     "optimizer_config": {
         "adam": {},

 {
+    "adapter_path": "serum_lora_adapters/conservative_adapters",
     "batch_size": 8,
     "config": null,
+    "data": "serum_lora_adapters/training_data_v2",
     "fine_tune_type": "lora",
     "grad_checkpoint": false,
+    "iters": 500,
+    "learning_rate": 0.0001,
     "lora_parameters": {
         "rank": 8,
         "dropout": 0.0,
     "mask_prompt": false,
     "max_seq_length": 2048,
     "model": "NousResearch/Hermes-2-Pro-Mistral-7B",
+    "num_layers": 8,
     "optimizer": "adam",
     "optimizer_config": {
         "adam": {},

adapters.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:78097e4cccdf6814c66d0c50fd2318772ef682e44d20eb3fcf087204b9018832
+size 3411329