Update RT-Qwen3-4B with latest interleave_focal checkpoint

Files changed (4) hide show

RT-Qwen3-4B/merge_meta.json ADDED Viewed

+{
+  "base_model": "/inspire/hdd/global_user/shixiaoxin-253107030017/sxx/multi-head/extended-models/Qwen3-4B-Instruct-2507-Extended",
+  "lora_path": "output/4_interleave_focal/epoch4_end",
+  "vocab_size": 151686,
+  "merge_gpu": 0,
+  "merge_time_sec": 124.6
+}

RT-Qwen3-4B/model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:629514f36eed75fa9cacba4ef7ff682a815ebacb51b777165d51d0c161869055
 size 4965935360

 version https://git-lfs.github.com/spec/v1
+oid sha256:df8eb083364542df6acbb761ffdbf66a473f45c8839b7c463f5b2766bdfd18e4
 size 4965935360

RT-Qwen3-4B/model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11e4bb990651ea0c8ca83d8665538f39e8273a88e7a9b39c075521aefa4dae53
-size 3854399144

 version https://git-lfs.github.com/spec/v1
+oid sha256:946ecd2e153a64a0bcf19bbda4eef122a976dc5f61bdef3f383160b29189cb56
+size 3077766632

RT-Qwen3-4B/model.safetensors.index.json CHANGED Viewed

@@ -1,10 +1,9 @@
 {
   "metadata": {
-    "total_parameters": 4410144256,
-    "total_size": 8820288512
   },
   "weight_map": {
-    "lm_head.weight": "model-00002-of-00002.safetensors",
     "model.embed_tokens.weight": "model-00001-of-00002.safetensors",
     "model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
     "model.layers.0.mlp.down_proj.weight": "model-00001-of-00002.safetensors",

 {
   "metadata": {
+    "total_parameters": 4021828096,
+    "total_size": 8043656192
   },
   "weight_map": {
     "model.embed_tokens.weight": "model-00001-of-00002.safetensors",
     "model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
     "model.layers.0.mlp.down_proj.weight": "model-00001-of-00002.safetensors",