Upload SFT model (train=1.5193, eval=0.0000)

Files changed (3) hide show

README.md CHANGED Viewed

@@ -30,9 +30,9 @@ Adapts explanations to different difficulty levels:
 | LoRA Rank | 16 |
 | LoRA Alpha | 32 |
 | Target Modules | q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj |
-| Epochs | 1 |
 | Learning Rate | 0.0001 |
-| Final Train Loss | 1.6684 |
 | Final Eval Loss | 0.0000 |
 ## Team

 | LoRA Rank | 16 |
 | LoRA Alpha | 32 |
 | Target Modules | q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj |
+| Epochs | 3 |
 | Learning Rate | 0.0001 |
+| Final Train Loss | 1.5193 |
 | Final Eval Loss | 0.0000 |
 ## Team

adapter_config.json CHANGED Viewed

@@ -33,13 +33,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "k_proj",
     "q_proj",
-    "v_proj",
-    "down_proj",
-    "o_proj",
     "gate_proj",
-    "up_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "q_proj",
+    "up_proj",
     "gate_proj",
+    "k_proj",
+    "o_proj",
+    "v_proj",
+    "down_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d53beeb58d4d828a298374fcbe160f81d3640ead756919037356893c1b0c3021
 size 73911112

 version https://git-lfs.github.com/spec/v1
+oid sha256:092471a3668cc903a059b0998db1ba2f0849017775c1b937192c40996b0d5d60
 size 73911112