LightEmbed
/

sbert-all-MiniLM-L12-v2-onnx

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Model card Files Files and versions

binhcode25 commited on Jun 16, 2024

Commit

cd71211

·

verified ·

1 Parent(s): 4efb231

Add new SentenceTransformer model.

Files changed (3) hide show

README.md +45 -0
model.onnx +2 -2
tokenizer.json +16 -2

README.md ADDED Viewed

	@@ -0,0 +1,45 @@

+---
+library_name: light-embed
+pipeline_tag: sentence-similarity
+tags:
+- sentence-transformers
+- feature-extraction
+- sentence-similarity
+---
+# sbert-all-MiniLM-L12-v2-onnx
+This is the ONNX version of the Sentence Transformers model sentence-transformers/all-MiniLM-L12-v2 for sentence embedding, optimized for speed and lightweight performance. By utilizing onnxruntime and tokenizers instead of heavier libraries like sentence-transformers and transformers, this version ensures a smaller library size and faster execution. Below are the details of the model:
+- Base model: sentence-transformers/all-MiniLM-L12-v2
+- Embedding dimension: 384
+- Max sequence length: 128
+- File size on disk:  0.12 GB
+This ONNX model consists all components in the original sentence transformer model:
+Transformer, Pooling, Normalize
+<!--- Describe your model here -->
+## Usage (LightEmbed)
+Using this model becomes easy when you have [LightEmbed](https://www.light-embed.net) installed:
+```
+pip install -U light-embed
+```
+Then you can use the model like this:
+```python
+from light_embed import TextEmbedding
+sentences = ["This is an example sentence", "Each sentence is converted"]
+model = TextEmbedding('sentence-transformers/all-MiniLM-L12-v2')
+embeddings = model.encode(sentences)
+print(embeddings)
+```
+## Citing & Authors
+Binh Nguyen / binhcode25@gmail.com

model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa2f30fd904338a4871270dca3b59d9b05477605bf53fdb217b76b57843a31f4
-size 133203053

 version https://git-lfs.github.com/spec/v1
+oid sha256:94acbe687695083e8e2ebbcb2b6ddc53eda64617e38471af3c08337660b1ff4d
+size 133203111

tokenizer.json CHANGED Viewed

@@ -1,7 +1,21 @@
 {
   "version": "1.0",
-  "truncation": null,
-  "padding": null,
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 128,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
+  "padding": {
+    "strategy": {
+      "Fixed": 128
+    },
+    "direction": "Right",
+    "pad_to_multiple_of": null,
+    "pad_id": 0,
+    "pad_type_id": 0,
+    "pad_token": "[PAD]"
+  },
   "added_tokens": [
     {
       "id": 0,