Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
Generated from Trainer
dataset_size:10190
loss:TripletLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use Data-Lab/multilingual-e5-large-instruct-embedder-tg with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use Data-Lab/multilingual-e5-large-instruct-embedder-tg with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("Data-Lab/multilingual-e5-large-instruct-embedder-tg") sentences = [ "безглютеновый хлеб", "Instruct: Найти похожие продукты на основе деталей\nQuery: Баклажаны по-сычуаньски баклажаны, азиатская кухня, закуска, терияки, сладкий соус, пряный вкус, овощное блюдо, вегетарианское, пикантное, жареное, замаринованное, кунжут, чеснок, имбирь, рыба, рисовый уксус", "Instruct: Найти похожие продукты на основе деталей\nQuery: Сорбет \"Манго- Маракуйя\" без доб. сахара сладость, десерт, веганский, без сахара, низкокалорийный, охлаждающий, тропические фрукты, натуральный, диетический, сахарозаменитель, фруктовый, без добавок, здоровье", "Instruct: Найти похожие продукты на основе деталей\nQuery: Изделие х/б без глютена с семенами безглютеновый, хлеб, рисовая мука, семена, клетчатка, полезный, сытный, ароматный, выпечка, гастрономия" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
- Xet hash:
- 378707d70990985591af58f9f69683c0b6e06cc9fb248fab50a465573c61531d
- Size of remote file:
- 2.24 GB
- SHA256:
- ad761c65d836c327ba073fc6a10d53c2f87f65373b0a0b08e576c45eadea387d
·
Xet efficiently stores Large Files inside Git, intelligently splitting files into unique chunks and accelerating uploads and downloads. More info.