Upload final merged Qwen2.5-7B-Instruct ALF+DBB model

Files changed (5) hide show

README.md CHANGED Viewed

@@ -25,7 +25,7 @@ This repository provides a **merged full model** based on
 1. Train LoRA adapter on ALFWorld
 2. Train LoRA adapter on DBBench
-3. Merge adapters using `ties` (density=0.3)
 4. Apply additional stabilization fine-tuning (LoRA)
 5. Merge final adapter into base model
@@ -35,11 +35,11 @@ This repository contains **full merged weights (no adapter required)**.
 - Base model: Qwen/Qwen2.5-7B-Instruct
 - Merge method: ties
-- Merge density: 0.3
 - Final stage epochs: 1
-- Learning rate: 2e-05
-- Final LoRA: r=64, alpha=128
-- Max sequence length: 3072
 ## Datasets
@@ -67,7 +67,7 @@ model = AutoModelForCausalLM.from_pretrained(
 ## Sources & Terms (IMPORTANT)
-Training data:
 - u-10bei/sft_alfworld_trajectory_dataset_v5
 - u-10bei/dbbench_sft_dataset_react_v4

 1. Train LoRA adapter on ALFWorld
 2. Train LoRA adapter on DBBench
+3. Merge adapters using `ties` (density=0.1)
 4. Apply additional stabilization fine-tuning (LoRA)
 5. Merge final adapter into base model
 - Base model: Qwen/Qwen2.5-7B-Instruct
 - Merge method: ties
+- Merge density: 0.1
 - Final stage epochs: 1
+- Learning rate: 1e-05
+- Final LoRA: r=16, alpha=16
+- Max sequence length: 2024
 ## Datasets
 ## Sources & Terms (IMPORTANT)
+Training data:
 - u-10bei/sft_alfworld_trajectory_dataset_v5
 - u-10bei/dbbench_sft_dataset_react_v4

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1a3c9723a6d1f95b40c057f642ab5f6425b628202913170256b92b38604c070
 size 3945426872

 version https://git-lfs.github.com/spec/v1
+oid sha256:117decf3859109ba1183684f69bb6669ec40ab974390dfb5498c2fda237a76ac
 size 3945426872

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d4ca249210e7b6756c49c895098255899d74b6b045879af41664d5bbc984accf
 size 3864726352

 version https://git-lfs.github.com/spec/v1
+oid sha256:349b48a2c1f37c32756e4b550df0494cc5e4e4eb15073be9b5bacef54e90d379
 size 3864726352

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7aaa15a392b451141dc7f0b4c4b0208393f0a71119ee5c9d855da19c7a73c84a
 size 3864726408

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4b483225fbd2b6d514861bb04185ba141bdaf5bd5808c3aba95dbf2b4a7c127
 size 3864726408

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be55353751ad461c5ba0bb1979e1a96a95ce2f43cf86b98ab88583cd20bd3f81
 size 3556392240

 version https://git-lfs.github.com/spec/v1
+oid sha256:37498e609b53015d199760e5921bbaa344fd58251ea5063f0a3a365195183630
 size 3556392240