ssaraf1
/

slm-workflow-planner-7b-v2

+{
+  "base_model": "Qwen/Qwen2.5-7B-Instruct",
+  "lora_parameters": {
+    "rank": 16,
+    "scale": 2.0,
+    "dropout": 0.02
+  },
+  "num_layers": 28,
+  "fine_tune_type": "lora",
+  "training": {
+    "stage_a": {
+      "iters": 800,
+      "data": "554K multi-workflow policy-corrected"
+    },
+    "stage_b": {
+      "iters": 100,
+      "data": "20K contrastive alignment"
+    },
+    "learning_rate": 3e-05,
+    "batch_size": 4,
+    "max_seq_length": 512,
+    "mask_prompt": true,
+    "seed": 42
+  },
+  "performance": {
+    "total": "42/76 (55.3%)",
+    "next": "10/22 (45%)",
+    "retry": "7/12 (58%)",
+    "fork": "13/14 (93%)",
+    "join": "10/15 (67%)",
+    "meta": "2/13 (15%)",
+    "beats_gpt41": true
+  }
+}