Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing

  • Log In
  • Sign Up

mohanprakash462
/
tamil-embed-base

Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
dense
Generated from Trainer
dataset_size:92081
loss:MatryoshkaLoss
loss:MultipleNegativesRankingLoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use mohanprakash462/tamil-embed-base with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use mohanprakash462/tamil-embed-base with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("mohanprakash462/tamil-embed-base")
    
    sentences = [
        "அவர் வீட்டுக்கு திரும்பினார்.அவர் தனது குரங்குக்கு உணவு கொடுத்து சென்றார்.அவரின் குரங்கு எங்கும் காணப்படவில்லை.அவரின் குரங்கு எல்லையில் தேடி வந்தார்.அவருக்கு அடுத்த நாள் தனது குரங்கு கண்டுபிடிக்க முடிந்தது.",
        "Here Comes Santa Claus ஒரு இடத்தில் ஒரு முதல் 10 ஹெட்டாக இருந்தது",
        "சாம் ஒரு Pet Cat",
        "இது ஒரு ergonomic office chair."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
tamil-embed-base
1.13 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
mohanprakash462's picture
mohanprakash462
Tamil embedding model v1
61a2fab verified 2 months ago
  • 1_Pooling
    Tamil embedding model v1 2 months ago
  • .gitattributes
    1.57 kB
    Tamil embedding model v1 2 months ago
  • README.md
    23.4 kB
    Tamil embedding model v1 2 months ago
  • config.json
    741 Bytes
    Tamil embedding model v1 2 months ago
  • config_sentence_transformers.json
    282 Bytes
    Tamil embedding model v1 2 months ago
  • model.safetensors
    1.11 GB
    xet
    Tamil embedding model v1 2 months ago
  • modules.json
    349 Bytes
    Tamil embedding model v1 2 months ago
  • sentence_bert_config.json
    57 Bytes
    Tamil embedding model v1 2 months ago
  • tokenizer.json
    17.1 MB
    xet
    Tamil embedding model v1 2 months ago
  • tokenizer_config.json
    354 Bytes
    Tamil embedding model v1 2 months ago