Add new SentenceTransformer model.

Files changed (6) hide show

README.md ADDED Viewed

+---
+library_name: light-embed
+pipeline_tag: sentence-similarity
+tags:
+- sentence-transformers
+- feature-extraction
+- sentence-similarity
+---
+# sbert-paraphrase-MiniLM-L6-v2-onnx
+This is the ONNX version of the Sentence Transformers model sentence-transformers/paraphrase-MiniLM-L6-v2 for sentence embedding, optimized for speed and lightweight performance. By utilizing onnxruntime and tokenizers instead of heavier libraries like sentence-transformers and transformers, this version ensures a smaller library size and faster execution. Below are the details of the model:
+- Base model: sentence-transformers/paraphrase-MiniLM-L6-v2
+- Embedding dimension: 384
+- Max sequence length: 128
+- File size on disk:  0.08 GB
+This ONNX model consists all components in the original sentence transformer model:
+Transformer, Pooling
+<!--- Describe your model here -->
+## Usage (LightEmbed)
+Using this model becomes easy when you have [LightEmbed](https://www.light-embed.net) installed:
+```
+pip install -U light-embed
+```
+Then you can use the model like this:
+```python
+from light_embed import TextEmbedding
+sentences = ["This is an example sentence", "Each sentence is converted"]
+model = TextEmbedding('sentence-transformers/paraphrase-MiniLM-L6-v2')
+embeddings = model.encode(sentences)
+print(embeddings)
+```
+## Citing & Authors
+Binh Nguyen / binhcode25@gmail.com

config.json CHANGED Viewed

@@ -1,10 +1,9 @@
 {
-  "_name_or_path": "/Users/Shared/Libs/sentence_transformers/models--sentence-transformers--paraphrase-MiniLM-L6-v2/snapshots/3bf4ae7445aa77c8daaef06518dd78baffff53c9",
   "architectures": [
     "BertModel"
   ],
   "attention_probs_dropout_prob": 0.1,
-  "classifier_dropout": null,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
@@ -18,9 +17,8 @@
   "num_hidden_layers": 6,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
-  "torch_dtype": "float32",
-  "transformers_version": "4.37.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522
-}

 {
+  "_name_or_path": "sentence-transformers/paraphrase-MiniLM-L6-v2",
   "architectures": [
     "BertModel"
   ],
   "attention_probs_dropout_prob": 0.1,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "num_hidden_layers": 6,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
+  "transformers_version": "4.7.0",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522
+}

config_sentence_transformers.json CHANGED Viewed

@@ -3,7 +3,5 @@
     "sentence_transformers": "2.0.0",
     "transformers": "4.7.0",
     "pytorch": "1.9.0+cu102"
-  },
-  "prompts": {},
-  "default_prompt_name": null
 }

     "sentence_transformers": "2.0.0",
     "transformers": "4.7.0",
     "pytorch": "1.9.0+cu102"
+  }
 }

model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9edf23f5ee749d16f3e59c9220bf8ae3e132e5c8850b880f95c0f96069554d84
-size 90979455

 version https://git-lfs.github.com/spec/v1
+oid sha256:7073175d5f2eb39ae4c6e0363753be2b20b1d427419a6fdc67c2a944f28aed0c
+size 90445337

model_description.json ADDED Viewed

+{
+  "base_model": "sentence-transformers/paraphrase-MiniLM-L6-v2",
+  "embedding_dim": 384,
+  "max_seq_length": 128,
+  "model_file_size (GB)": 0.08
+}

modules.json CHANGED Viewed

@@ -2,13 +2,11 @@
   {
     "idx": 0,
     "name": "0",
-    "path": "",
     "type": "sentence_transformers.models.Transformer"
   },
   {
     "idx": 1,
     "name": "1",
-    "path": "1_Pooling",
     "type": "sentence_transformers.models.Pooling"
   }
 ]

   {
     "idx": 0,
     "name": "0",
     "type": "sentence_transformers.models.Transformer"
   },
   {
     "idx": 1,
     "name": "1",
     "type": "sentence_transformers.models.Pooling"
   }
 ]