Add SetFit model

Files changed (6) hide show

README.md CHANGED Viewed

@@ -153,36 +153,26 @@ preds = model("esti")
 - load_best_model_at_end: True
 ### Training Results
-| Epoch   | Step | Training Loss | Validation Loss |
-|:-------:|:----:|:-------------:|:---------------:|
-| 0.0175  | 1    | 0.2373        | -               |
-| 0.8772  | 50   | 0.2157        | 0.0794          |
-| 1.7544  | 100  | 0.0818        | 0.0061          |
-| 2.6316  | 150  | 0.0014        | 0.0069          |
-| 3.5088  | 200  | 0.0004        | 0.0086          |
-| 4.3860  | 250  | 0.0003        | 0.0057          |
-| 5.2632  | 300  | 0.0003        | 0.0103          |
-| 6.1404  | 350  | 0.0002        | 0.0092          |
-| 7.0175  | 400  | 0.0002        | 0.0169          |
-| 7.8947  | 450  | 0.0002        | 0.0110          |
-| 8.7719  | 500  | 0.0002        | 0.0135          |
-| 9.6491  | 550  | 0.0002        | 0.0131          |
-| 10.5263 | 600  | 0.0001        | 0.0120          |
-| 11.4035 | 650  | 0.0001        | 0.0114          |
-| 12.2807 | 700  | 0.0001        | 0.0128          |
-| 13.1579 | 750  | 0.0001        | 0.0135          |
-| 14.0351 | 800  | 0.0001        | 0.0142          |
-| 14.9123 | 850  | 0.0001        | 0.0156          |
-| 15.7895 | 900  | 0.0001        | 0.0160          |
 ### Framework Versions
 - Python: 3.12.10
 - SetFit: 1.1.2
 - Sentence Transformers: 4.1.0
-- Transformers: 4.45.1
-- PyTorch: 2.7.0+cu128
-- Datasets: 3.0.1
-- Tokenizers: 0.20.1
 ## Citation

 - load_best_model_at_end: True
 ### Training Results
+| Epoch  | Step | Training Loss | Validation Loss |
+|:------:|:----:|:-------------:|:---------------:|
+| 0.0175 | 1    | 0.2373        | -               |
+| 0.8772 | 50   | 0.2157        | 0.0794          |
+| 1.7544 | 100  | 0.0818        | 0.0061          |
+| 2.6316 | 150  | 0.0014        | 0.0069          |
+| 3.5088 | 200  | 0.0004        | 0.0086          |
+| 4.3860 | 250  | 0.0003        | 0.0057          |
+| 5.2632 | 300  | 0.0003        | 0.0103          |
+| 6.1404 | 350  | 0.0002        | 0.0092          |
+| 7.0175 | 400  | 0.0002        | 0.0169          |
 ### Framework Versions
 - Python: 3.12.10
 - SetFit: 1.1.2
 - Sentence Transformers: 4.1.0
+- Transformers: 4.51.3
+- PyTorch: 2.6.0+cu126
+- Datasets: 2.19.1
+- Tokenizers: 0.21.1
 ## Citation

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "sentence-transformers/paraphrase-multilingual-mpnet-base-v2",
   "architectures": [
     "XLMRobertaModel"
   ],
@@ -22,7 +21,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.45.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

 {
   "architectures": [
     "XLMRobertaModel"
   ],
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.51.3",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

config_sentence_transformers.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "__version__": {
     "sentence_transformers": "4.1.0",
-    "transformers": "4.45.1",
-    "pytorch": "2.7.0+cu128"
   },
   "prompts": {},
   "default_prompt_name": null,

 {
   "__version__": {
     "sentence_transformers": "4.1.0",
+    "transformers": "4.51.3",
+    "pytorch": "2.6.0+cu126"
   },
   "prompts": {},
   "default_prompt_name": null,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f560cb215e7638a135db656da192436020d775932bcf4465f06c8672a6f70330
 size 1112197096

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c44b5973c58acf265e54b09cd085f68a513c1a7547e09a8b7e275cbb7001ecf
 size 1112197096

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f9956302a9fa640e71c5c62330e6f942505d6db8038fefb9f145a70bea62964
 size 32159

 version https://git-lfs.github.com/spec/v1
+oid sha256:b8f6a53138111ff4e76f97a2b8b08d7ccf9dccc396c47f30e0448a4c03db3abc
 size 32159

tokenizer_config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "clean_up_tokenization_spaces": false,
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": "<mask>",
   "max_length": 128,
   "model_max_length": 128,

   "clean_up_tokenization_spaces": false,
   "cls_token": "<s>",
   "eos_token": "</s>",
+  "extra_special_tokens": {},
   "mask_token": "<mask>",
   "max_length": 128,
   "model_max_length": 128,