SAP
/

miCSE

Sentence Similarity

feature-extraction

text-embeddings-inference

Model card Files Files and versions

TJKlein commited on Nov 18, 2022

Commit

71f69a9

·

1 Parent(s): d1858c9

Update README.md

Files changed (1) hide show

README.md +12 -0

README.md CHANGED Viewed

@@ -14,6 +14,7 @@ The **miCSE** language model is trained for sentence similarity computation. Tra
 ```shell
 from transformers import AutoTokenizer, AutoModel
 tokenizer = AutoTokenizer.from_pretrained("sap-ai-research/miCSE")
@@ -43,6 +44,17 @@ outputs = model(**batch, output_hidden_states=True, return_dict=True)
 embeddings = outputs.last_hidden_state[:,0]
 ```

 ```shell
 from transformers import AutoTokenizer, AutoModel
+import torch.nn as nn
 tokenizer = AutoTokenizer.from_pretrained("sap-ai-research/miCSE")
 embeddings = outputs.last_hidden_state[:,0]
+# Define similarity metric, e.g., cosine similarity
+sim = nn.CosineSimilarity(dim=-1)
+# Compute similarity between the **first** and the **second** sentence
+cos_sim = sim(embeddings.unsqueeze(1),
+             embeddings.unsqueeze(0))
+print(f"Distance: {cos_sim[0,1].detach().item()}")
 ```