Upload folder using huggingface_hub

Browse files

Files changed (3) hide show

README.md +19 -23
mergekit_config.yml +9 -13
model-00001-of-00001.safetensors +1 -1

README.md CHANGED Viewed

@@ -1,14 +1,14 @@
 ---
 base_model:
 - mllm-dev/gpt2_f_experiment_3
-- mllm-dev/gpt2_f_experiment_7
 - mllm-dev/gpt2_f_experiment_0
-- mllm-dev/gpt2_f_experiment_2
-- mllm-dev/gpt2_f_experiment_1
 - mllm-dev/gpt2_f_experiment_8
-- mllm-dev/gpt2_f_experiment_9
 - mllm-dev/gpt2_f_experiment_5
-- mllm-dev/gpt2_f_experiment_6
 - mllm-dev/gpt2_f_experiment_4
 library_name: transformers
 tags:
@@ -28,14 +28,14 @@ This model was merged using the [TIES](https://arxiv.org/abs/2306.01708) merge m
 ### Models Merged
 The following models were included in the merge:
-* [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
-* [mllm-dev/gpt2_f_experiment_7](https://huggingface.co/mllm-dev/gpt2_f_experiment_7)
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
-* [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
-* [mllm-dev/gpt2_f_experiment_8](https://huggingface.co/mllm-dev/gpt2_f_experiment_8)
 * [mllm-dev/gpt2_f_experiment_9](https://huggingface.co/mllm-dev/gpt2_f_experiment_9)
-* [mllm-dev/gpt2_f_experiment_5](https://huggingface.co/mllm-dev/gpt2_f_experiment_5)
 * [mllm-dev/gpt2_f_experiment_6](https://huggingface.co/mllm-dev/gpt2_f_experiment_6)
 * [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
 ### Configuration
@@ -49,7 +49,6 @@ base_model:
 dtype: float16
 merge_method: ties
 parameters:
-  int8_mask: 0.0
   normalize: 1.0
 slices:
 - sources:
@@ -57,70 +56,67 @@ slices:
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_0
-    parameters:
-      density: 0.1
-      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_1
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_5
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_6
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_7
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_8
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_9
     parameters:
-      density: 0.1
       weight: 0.1
 ```

 ---
 base_model:
+- mllm-dev/gpt2_f_experiment_2
 - mllm-dev/gpt2_f_experiment_3
+- mllm-dev/gpt2_f_experiment_9
 - mllm-dev/gpt2_f_experiment_0
+- mllm-dev/gpt2_f_experiment_6
 - mllm-dev/gpt2_f_experiment_8
+- mllm-dev/gpt2_f_experiment_7
 - mllm-dev/gpt2_f_experiment_5
+- mllm-dev/gpt2_f_experiment_1
 - mllm-dev/gpt2_f_experiment_4
 library_name: transformers
 tags:
 ### Models Merged
 The following models were included in the merge:
 * [mllm-dev/gpt2_f_experiment_2](https://huggingface.co/mllm-dev/gpt2_f_experiment_2)
+* [mllm-dev/gpt2_f_experiment_3](https://huggingface.co/mllm-dev/gpt2_f_experiment_3)
 * [mllm-dev/gpt2_f_experiment_9](https://huggingface.co/mllm-dev/gpt2_f_experiment_9)
 * [mllm-dev/gpt2_f_experiment_6](https://huggingface.co/mllm-dev/gpt2_f_experiment_6)
+* [mllm-dev/gpt2_f_experiment_8](https://huggingface.co/mllm-dev/gpt2_f_experiment_8)
+* [mllm-dev/gpt2_f_experiment_7](https://huggingface.co/mllm-dev/gpt2_f_experiment_7)
+* [mllm-dev/gpt2_f_experiment_5](https://huggingface.co/mllm-dev/gpt2_f_experiment_5)
+* [mllm-dev/gpt2_f_experiment_1](https://huggingface.co/mllm-dev/gpt2_f_experiment_1)
 * [mllm-dev/gpt2_f_experiment_4](https://huggingface.co/mllm-dev/gpt2_f_experiment_4)
 ### Configuration
 dtype: float16
 merge_method: ties
 parameters:
   normalize: 1.0
 slices:
 - sources:
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_0
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_1
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_5
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_6
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_7
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_8
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_9
     parameters:
+      density: 0.9
       weight: 0.1
 ```

mergekit_config.yml CHANGED Viewed

@@ -4,7 +4,6 @@ base_model:
 dtype: float16
 merge_method: ties
 parameters:
-  int8_mask: 0.0
   normalize: 1.0
 slices:
 - sources:
@@ -12,69 +11,66 @@ slices:
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_0
-    parameters:
-      density: 0.1
-      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_1
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_5
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_6
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_7
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_8
     parameters:
-      density: 0.1
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_9
     parameters:
-      density: 0.1
       weight: 0.1

 dtype: float16
 merge_method: ties
 parameters:
   normalize: 1.0
 slices:
 - sources:
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_0
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_1
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_5
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_6
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_7
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_8
     parameters:
+      density: 0.9
       weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_9
     parameters:
+      density: 0.9
       weight: 0.1

model-00001-of-00001.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2ec69e8ae66c7de30c52d601ba7fd250b91c6837903b62dea681f384548b6503
 size 248902264

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac2d223e322da400f17b562a754f1a096a848b97d0f1bc42731b7a370dc0d4ef
 size 248902264