p1k0 commited on Sep 11, 2025

Commit

6b907c2

verified ·

1 Parent(s): 5bb93c8

Add files using upload-large-folder tool

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

glue/mistral_weights_pt/pt_layer12_sst2/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer12_sst2/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer12_wnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer12_wnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_mnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_mnli/head_config.json +15 -0
glue/mistral_weights_pt/pt_layer14_mrpc/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_mrpc/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_qnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_qnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_qqp/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_qqp/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_rte/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_rte/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_sst2/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_sst2/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer14_wnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer14_wnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_mnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_mnli/head_config.json +15 -0
glue/mistral_weights_pt/pt_layer22_mrpc/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_mrpc/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_qnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_qnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_qqp/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_qqp/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_rte/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_rte/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_sst2/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_sst2/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer22_wnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer22_wnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_mnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_mnli/head_config.json +15 -0
glue/mistral_weights_pt/pt_layer25_mrpc/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_mrpc/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_qnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_qnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_qqp/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_qqp/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_rte/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_rte/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_sst2/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_sst2/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer25_wnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer25_wnli/head_config.json +14 -0
glue/mistral_weights_pt/pt_layer31_mnli/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer31_mnli/head_config.json +15 -0
glue/mistral_weights_pt/pt_layer31_mrpc/adapter_config.json +53 -0
glue/mistral_weights_pt/pt_layer31_mrpc/head_config.json +14 -0

glue/mistral_weights_pt/pt_layer12_sst2/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer12_sst2",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer12_sst2/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer12_wnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer12_wnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer12_wnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_mnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_mnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_mnli/head_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 3,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_mrpc/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_mrpc",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_mrpc/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_qnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_qnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_qnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_qqp/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_qqp",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_qqp/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_rte/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_rte",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_rte/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_sst2/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_sst2",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_sst2/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_wnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer14_wnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer14_wnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_mnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_mnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_mnli/head_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 3,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_mrpc/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_mrpc",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_mrpc/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_qnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_qnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_qnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_qqp/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_qqp",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_qqp/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_rte/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_rte",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_rte/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_sst2/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_sst2",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_sst2/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_wnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer22_wnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer22_wnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_mnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_mnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_mnli/head_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 3,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_mrpc/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_mrpc",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_mrpc/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_qnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_qnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_qnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_qqp/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_qqp",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_qqp/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_rte/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_rte",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_rte/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_sst2/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_sst2",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_sst2/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_wnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      26,
+      27,
+      28,
+      29,
+      30,
+      31
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer25_wnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer25_wnli/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer31_mnli/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer31_mnli",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer31_mnli/head_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 3,
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer31_mrpc/adapter_config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "config": {
+    "architecture": "prefix_tuning",
+    "bottleneck_size": 512,
+    "cross_prefix": true,
+    "dropout": 0.0,
+    "encoder_prefix": true,
+    "flat": false,
+    "leave_out": [
+      0,
+      1,
+      2,
+      3,
+      4,
+      5,
+      6,
+      7,
+      8,
+      9,
+      10,
+      11,
+      12,
+      13,
+      14,
+      15,
+      16,
+      17,
+      18,
+      19,
+      20,
+      21,
+      22,
+      23,
+      24,
+      25,
+      26,
+      27,
+      28,
+      29,
+      30
+    ],
+    "non_linearity": "tanh",
+    "prefix_length": 30,
+    "shared_gating": true,
+    "use_gating": false
+  },
+  "hidden_size": 4096,
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": "pt_layer31_mrpc",
+  "version": "adapters.1.0.0"
+}

glue/mistral_weights_pt/pt_layer31_mrpc/head_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "config": null,
+  "hidden_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1
+  },
+  "model_class": "MistralForSequenceClassification",
+  "model_name": "/mnt/data/users/liamding/data/TOX/pretrained_models/mistral-7b",
+  "model_type": "mistral",
+  "name": null,
+  "num_labels": 2,
+  "version": "adapters.1.0.0"
+}