fkrasnov2
/

SBE

Sentence Similarity

Model card Files Files and versions

fkrasnov2 commited on Sep 28, 2024

Commit

9eb685c

·

verified ·

1 Parent(s): 79693b0

small talk

Files changed (1) hide show

README.md +20 -1

README.md CHANGED Viewed

@@ -1,4 +1,23 @@
 ---
 license: unlicense
 pipeline_tag: sentence-similarity
----

 ---
 license: unlicense
 pipeline_tag: sentence-similarity
+---
+Encoder-model for search query similarity task.
+Fast and accurate.
+Sentence Piece fitted on 269 million Russian search queries log.
+```python
+from transformers import AutoModel, AutoTokenizer
+model = AutoModel.from_pretrained('fkrasnov2/SBE')
+tokenizer = AutoTokenizer.from_pretrained('fkrasnov2/SBE')
+input_ids = tokenizer.encode("чёрное платье", max_length=model.config.max_position_embeddings, truncation=True, return_tensors='pt')
+vector = model(input_ids=input_ids, attention_mask=input_ids>3)[0][0,0]
+assert model.config.hidden_size == vector.shape[0]
+```