mllm-dev
/

gpt2_m_experiment

Text Classification

Model card Files Files and versions

mllm-dev commited on Mar 26, 2024

Commit

6905f7b

·

verified ·

1 Parent(s): a801b35

Upload folder using huggingface_hub

Files changed (2) hide show

README.md +6 -6
mergekit_config.yml +1 -1

README.md CHANGED Viewed

@@ -1,10 +1,10 @@
 ---
 base_model:
-- mllm-dev/gpt2_f_experiment_1
 - mllm-dev/gpt2_f_experiment_0
 - mllm-dev/gpt2_f_experiment_2
-- mllm-dev/gpt2_f_experiment_4
 - mllm-dev/gpt2_f_experiment_3
 library_name: transformers
 tags:
 - mergekit
@@ -18,15 +18,15 @@ This is a merge of pre-trained language models created using [mergekit](https://
 ## Merge Details
 ### Merge Method
-This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) merge method using [mllm-dev/gpt2_f_experiment_0](https://huggingface.co/mllm-dev/gpt2_f_experiment_0) as a base.
 ### Models Merged
 The following models were included in the merge:
-* [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
-* [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
 * [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
 ### Configuration
@@ -37,7 +37,7 @@ base_model:
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
-merge_method: dare_ties
 parameters:
   int8_mask: 1.0
   normalize: 1.0

 ---
 base_model:
 - mllm-dev/gpt2_f_experiment_0
 - mllm-dev/gpt2_f_experiment_2
 - mllm-dev/gpt2_f_experiment_3
+- mllm-dev/gpt2_f_experiment_4
+- mllm-dev/gpt2_f_experiment_1
 library_name: transformers
 tags:
 - mergekit
 ## Merge Details
 ### Merge Method
+This model was merged using the [TIES](https://arxiv.org/abs/2306.01708) merge method using [mllm-dev/gpt2_f_experiment_0](https://huggingface.co/mllm-dev/gpt2_f_experiment_0) as a base.
 ### Models Merged
 The following models were included in the merge:
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
 * [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
+* [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
+* [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
 ### Configuration
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
+merge_method: ties
 parameters:
   int8_mask: 1.0
   normalize: 1.0

mergekit_config.yml CHANGED Viewed

@@ -2,7 +2,7 @@ base_model:
   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
-merge_method: dare_ties
 parameters:
   int8_mask: 1.0
   normalize: 1.0

   model:
     path: mllm-dev/gpt2_f_experiment_0
 dtype: float16
+merge_method: ties
 parameters:
   int8_mask: 1.0
   normalize: 1.0