Add SetFit model

Files changed (13) hide show

1_Pooling/config.json ADDED Viewed

+{
+    "word_embedding_dimension": 768,
+    "pooling_mode_cls_token": false,
+    "pooling_mode_mean_tokens": true,
+    "pooling_mode_max_tokens": false,
+    "pooling_mode_mean_sqrt_len_tokens": false,
+    "pooling_mode_weightedmean_tokens": false,
+    "pooling_mode_lasttoken": false,
+    "include_prompt": true
+}

README.md ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

+{
+  "architectures": [
+    "MPNetModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "mpnet",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "relative_attention_num_buckets": 32,
+  "transformers_version": "4.56.2",
+  "vocab_size": 30527
+}

config_sentence_transformers.json ADDED Viewed

+{
+  "__version__": {
+    "sentence_transformers": "5.1.1",
+    "transformers": "4.56.2",
+    "pytorch": "2.8.0+cu128"
+  },
+  "model_type": "SentenceTransformer",
+  "prompts": {
+    "query": "",
+    "document": ""
+  },
+  "default_prompt_name": null,
+  "similarity_fn_name": "cosine"
+}

config_setfit.json ADDED Viewed

+{
+  "labels": [
+    "RIA",
+    "RIS",
+    "RIE",
+    "RIC",
+    "RAI",
+    "RAS",
+    "RAE",
+    "RAC",
+    "RSI",
+    "RSA",
+    "RSE",
+    "RSC",
+    "REI",
+    "REA",
+    "RES",
+    "REC",
+    "RCI",
+    "RCA",
+    "RCS",
+    "RCE",
+    "IRA",
+    "IRS",
+    "IRE",
+    "IRC",
+    "IAR",
+    "IAS",
+    "IAE",
+    "IAC",
+    "ISR",
+    "ISA",
+    "ISE",
+    "ISC",
+    "IER",
+    "IEA",
+    "IES",
+    "IEC",
+    "ICR",
+    "ICA",
+    "ICS",
+    "ICE",
+    "ARI",
+    "ARS",
+    "ARE",
+    "ARC",
+    "AIR",
+    "AIS",
+    "AIE",
+    "AIC",
+    "ASR",
+    "ASI",
+    "ASE",
+    "ASC",
+    "AER",
+    "AEI",
+    "AES",
+    "AEC",
+    "ACR",
+    "ACI",
+    "ACS",
+    "ACE",
+    "SRI",
+    "SRA",
+    "SRE",
+    "SRC",
+    "SIR",
+    "SIA",
+    "SIE",
+    "SIC",
+    "SAR",
+    "SAI",
+    "SAE",
+    "SAC",
+    "SER",
+    "SEI",
+    "SEA",
+    "SEC",
+    "SCR",
+    "SCI",
+    "SCA",
+    "SCE",
+    "ERI",
+    "ERA",
+    "ERS",
+    "ERC",
+    "EIR",
+    "EIA",
+    "EIS",
+    "EIC",
+    "EAR",
+    "EAI",
+    "EAS",
+    "EAC",
+    "ESR",
+    "ESI",
+    "ESA",
+    "ESC",
+    "ECR",
+    "ECI",
+    "ECA",
+    "ECS",
+    "CRI",
+    "CRA",
+    "CRS",
+    "CRE",
+    "CIR",
+    "CIA",
+    "CIS",
+    "CIE",
+    "CAR",
+    "CAI",
+    "CAS",
+    "CAE",
+    "CSR",
+    "CSI",
+    "CSA",
+    "CSE",
+    "CER",
+    "CEI",
+    "CEA",
+    "CES"
+  ],
+  "normalize_embeddings": false
+}

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:18f139ad8bacf6d4d70ef90c16405b2a0fff81099f77efed80de70d05695e034
+size 437967672

model_head.pkl ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e53c9fd2eb243f1ea8ae9b5ecb886dc3bce9c07d3aed89010d2f04aeb2092c75
+size 740519

modules.json ADDED Viewed

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.models.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.models.Pooling"
+  }
+]

sentence_bert_config.json ADDED Viewed

+{
+    "max_seq_length": 512,
+    "do_lower_case": false
+}

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "104": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "30526": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "<s>",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "MPNetTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff