Add SetFit model

Browse files

Files changed (8) hide show

config.json +1 -1
config_sentence_transformers.json +2 -2
model_head.pkl +2 -2
modules.json +6 -0
pytorch_model.bin +1 -1
sentence_bert_config.json +1 -1
tokenizer.json +19 -78
tokenizer_config.json +7 -58

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/root/.cache/torch/sentence_transformers/sentence-transformers_paraphrase-mpnet-base-v2/",
   "architectures": [
     "MPNetModel"
   ],

 {
+  "_name_or_path": "/root/.cache/torch/sentence_transformers/sentence-transformers_all-mpnet-base-v2/",
   "architectures": [
     "MPNetModel"
   ],

config_sentence_transformers.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "__version__": {
     "sentence_transformers": "2.0.0",
-    "transformers": "4.7.0",
-    "pytorch": "1.9.0+cu102"
   }
 }

 {
   "__version__": {
     "sentence_transformers": "2.0.0",
+    "transformers": "4.6.1",
+    "pytorch": "1.8.1"
   }
 }

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:09a03f0921a8108f063fc1fe575ea4a81f36dcf218f3d42592d9c31e91f6f88c
-size 10721

 version https://git-lfs.github.com/spec/v1
+oid sha256:a744472affa8dca843cbc658723c8868cc8ae9864402d37a46319a01ac4e6473
+size 10719

modules.json CHANGED Viewed

@@ -10,5 +10,11 @@
     "name": "1",
     "path": "1_Pooling",
     "type": "sentence_transformers.models.Pooling"
   }
 ]

     "name": "1",
     "path": "1_Pooling",
     "type": "sentence_transformers.models.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Normalize",
+    "type": "sentence_transformers.models.Normalize"
   }
 ]

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:040c29909050956ddce80667c883ddcb9a637858391a89ee8961a729c6a7f7f0
 size 438016493

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b7e9a65cf2bb7a86d96b14a82369638b68a8775cc643b913c66a493014a5234
 size 438016493

sentence_bert_config.json CHANGED Viewed

@@ -1,4 +1,4 @@
 {
-  "max_seq_length": 512,
   "do_lower_case": false
 }

 {
+  "max_seq_length": 384,
   "do_lower_case": false
 }

tokenizer.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },
@@ -42,6 +42,15 @@
       "normalized": false,
       "special": true
     },
     {
       "id": 104,
       "content": "[UNK]",
@@ -72,85 +81,17 @@
     "type": "BertPreTokenizer"
   },
   "post_processor": {
-    "type": "TemplateProcessing",
-    "single": [
-      {
-        "SpecialToken": {
-          "id": "<s>",
-          "type_id": 0
-        }
-      },
-      {
-        "Sequence": {
-          "id": "A",
-          "type_id": 0
-        }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 0
-        }
-      }
     ],
-    "pair": [
-      {
-        "SpecialToken": {
-          "id": "<s>",
-          "type_id": 0
-        }
-      },
-      {
-        "Sequence": {
-          "id": "A",
-          "type_id": 0
-        }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 0
-        }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 0
-        }
-      },
-      {
-        "Sequence": {
-          "id": "B",
-          "type_id": 1
-        }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 1
-        }
-      }
     ],
-    "special_tokens": {
-      "</s>": {
-        "id": "</s>",
-        "ids": [
-          2
-        ],
-        "tokens": [
-          "</s>"
-        ]
-      },
-      "<s>": {
-        "id": "<s>",
-        "ids": [
-          0
-        ],
-        "tokens": [
-          "<s>"
-        ]
-      }
-    }
   },
   "decoder": {
     "type": "WordPiece",

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 384,
     "strategy": "LongestFirst",
     "stride": 0
   },
       "normalized": false,
       "special": true
     },
+    {
+      "id": 3,
+      "content": "<unk>",
+      "single_word": false,
+      "lstrip": false,
+      "rstrip": false,
+      "normalized": true,
+      "special": true
+    },
     {
       "id": 104,
       "content": "[UNK]",
     "type": "BertPreTokenizer"
   },
   "post_processor": {
+    "type": "RobertaProcessing",
+    "sep": [
+      "</s>",
+      2
     ],
+    "cls": [
+      "<s>",
+      0
     ],
+    "trim_offsets": true,
+    "add_prefix_space": false
   },
   "decoder": {
     "type": "WordPiece",

tokenizer_config.json CHANGED Viewed

@@ -1,66 +1,15 @@
 {
-  "bos_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
   "clean_up_tokenization_spaces": true,
-  "cls_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "do_basic_tokenize": true,
   "do_lower_case": true,
-  "eos_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "mask_token": {
-    "__type": "AddedToken",
-    "content": "<mask>",
-    "lstrip": true,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
   "model_max_length": 512,
-  "never_split": null,
-  "pad_token": {
-    "__type": "AddedToken",
-    "content": "<pad>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
-  "unk_token": {
-    "__type": "AddedToken",
-    "content": "[UNK]",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "bos_token": "<s>",
   "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
   "do_lower_case": true,
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
   "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
+  "unk_token": "[UNK]"
 }