t2ance
/

CodeRM-OnlineGRPO-Selection-4B-Instance-Net

Model card Files Files and versions

t2ance commited on Jan 28

Commit

26b3515

·

verified ·

1 Parent(s): adb567a

step 500

Files changed (2) hide show

adapter_config.json +9 -5
adapter_model.safetensors +1 -1

adapter_config.json CHANGED Viewed

@@ -1,9 +1,12 @@
 {
   "alpha_pattern": {},
   "auto_mapping": null,
   "base_model_name_or_path": "Qwen/Qwen3-4B-Thinking-2507",
   "bias": "none",
   "corda_config": null,
   "eva_config": null,
   "exclude_modules": null,
   "fan_in_fan_out": false,
@@ -20,18 +23,19 @@
   "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
   "qalora_group_size": 16,
   "r": 64,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "down_proj",
-    "q_proj",
-    "k_proj",
-    "gate_proj",
     "o_proj",
     "up_proj",
-    "v_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

 {
+  "alora_invocation_tokens": null,
   "alpha_pattern": {},
+  "arrow_config": null,
   "auto_mapping": null,
   "base_model_name_or_path": "Qwen/Qwen3-4B-Thinking-2507",
   "bias": "none",
   "corda_config": null,
+  "ensure_weight_tying": false,
   "eva_config": null,
   "exclude_modules": null,
   "fan_in_fan_out": false,
   "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
+  "peft_version": "0.18.0",
   "qalora_group_size": 16,
   "r": 64,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "o_proj",
+    "down_proj",
     "up_proj",
+    "gate_proj",
+    "q_proj",
+    "v_proj",
+    "k_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c8fac39bbd1319b5eb07f53169930709a8475602b69122e44edddc5e769a7e8
 size 528550256

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f664a2f87cb16eab69a4e89f59d5248b525c3338914e9bd2f097890cfab4141
 size 528550256