Sentence Similarity
sentence-transformers
ONNX
Safetensors
nomic_bert
feature-extraction
dense
Generated from Trainer
dataset_size:6294
loss:MultipleNegativesRankingLoss
custom_code
Eval Results (legacy)
text-embeddings-inference
Instructions to use asmud/nomic-embed-indonesian with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use asmud/nomic-embed-indonesian with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("asmud/nomic-embed-indonesian", trust_remote_code=True) sentences = [ "search_query: ['Ketua', 'Umum', 'organisasi', 'apakah', 'Syamsurizal', '?']", "search_document: ['Ketua', 'Umum', 'Pengurus', 'Besar', 'Persatuan', 'Sepak', 'Takraw', 'Seluruh', 'Indonesia', '(', 'PB', 'Persetasi', ')', 'Syamsurizal', 'mengatakan', ',', 'kejurnas', 'kali', 'ini', 'tak', 'hanya', 'dimanfaatkan', 'sebagai', 'sarana', 'mencari', 'bibit', 'baru', '.', '\"', 'Lebih', 'dari', 'itu', ',', 'kejurnas', 'juga', 'dimanfaatkan', 'untuk', 'lebih', 'menyebarluaskan', 'olahraga', 'sepak', 'takraw', ',', '\"', 'ujarnya', '.']", "clustering: Dalam sebuah doa, kucoba merayu Tuhan. Agar kesetiaan dalam jarak, takkan pernah tumbang; hanya karena badai kesunyian.", "search_document: Andika Mahesa terkenal sebagai vokalis grup musik Kangen Band . Selain itu , Andika tampak dekat dengan sejumlah perempuan . Hal tersebut membuatnya mendapat julukan ' Babang Tamvan ' . Mulanya , Andika menganggap sebutan tersebut sebagai musibah . Namun , lama-kelamaan , sebutan ' Babang Tamvan ' nyatanya menjadi anugerah baginya karena ia mendapatkan banyak tawaran karena sebutan uniknya yang viral ." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Welcome to the community
The community tab is the place to discuss and collaborate with the HF community!