Upload folder using huggingface_hub

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 base_model:
-- mllm-dev/gpt2_f_experiment_4
 - mllm-dev/gpt2_f_experiment_1
 - mllm-dev/gpt2_f_experiment_2
 - mllm-dev/gpt2_f_experiment_0
 - mllm-dev/gpt2_f_experiment_3
@@ -18,13 +18,13 @@ This is a merge of pre-trained language models created using [mergekit](https://
 ## Merge Details
 ### Merge Method
-This model was merged using the [linear](https://arxiv.org/abs/2203.05482) merge method using [mllm-dev/gpt2_f_experiment_0](https://huggingface.co/mllm-dev/gpt2_f_experiment_0) as a base.
 ### Models Merged
 The following models were included in the merge:
-* [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
 * [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
 * [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
@@ -37,7 +37,7 @@ base_model:
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
-merge_method: linear
 slices:
 - sources:
   - layer_range: [0, 12]

 ---
 base_model:
 - mllm-dev/gpt2_f_experiment_1
+- mllm-dev/gpt2_f_experiment_4
 - mllm-dev/gpt2_f_experiment_2
 - mllm-dev/gpt2_f_experiment_0
 - mllm-dev/gpt2_f_experiment_3
 ## Merge Details
 ### Merge Method
+This model was merged using the linear [DARE](https://arxiv.org/abs/2311.03099) merge method using [mllm-dev/gpt2_f_experiment_0](https://huggingface.co/mllm-dev/gpt2_f_experiment_0) as a base.
 ### Models Merged
 The following models were included in the merge:
 * [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
+* [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
 * [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
+merge_method: dare_linear
 slices:
 - sources:
   - layer_range: [0, 12]

mergekit_config.yml CHANGED Viewed

@@ -2,7 +2,7 @@ base_model:
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
-merge_method: linear
 slices:
 - sources:
   - layer_range: [0, 12]

   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
+merge_method: dare_linear
 slices:
 - sources:
   - layer_range: [0, 12]

model-00001-of-00001.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:109d22198c42220534f2b55ff9566334f14c2d3c6976f90d83b3d654b92dbc74
 size 248902264

 version https://git-lfs.github.com/spec/v1
+oid sha256:aaf8b491f91cfe5f946b0c2df0007e4d670fffa62d27239b1f5d52ffed7b7a2f
 size 248902264