Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

trmteb
/
multilingual-e5-base_contrastive_loss_training_with_large_data_v2

Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
Generated from Trainer
dataset_size:60000000
loss:MultipleNegativesRankingLoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use trmteb/multilingual-e5-base_contrastive_loss_training_with_large_data_v2 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use trmteb/multilingual-e5-base_contrastive_loss_training_with_large_data_v2 with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("trmteb/multilingual-e5-base_contrastive_loss_training_with_large_data_v2")
    
    sentences = [
        "Ayrıştırma",
        ", üzerinde yazı veya çizim yapılması amacıyla boş kâğıtların birleştirilmesiyle meydana getirilen bir nesnedir. 1920 yılında kâğıtları birleştirip, kartondan kapak ekleyen J.A. Birchall tarafından icat edilmiştir. Pek çok insan günlük hayatta defter kullanır fakat genelde defter kelimesi, bu nesneyi çeşitli derslerde not almak amacıyla kullanan öğrencileri çağrıştırır.",
        "Normalizasyon ( ), veritabanlarında çok fazla sütun ve satırdan oluşan bir tabloyu tekrarlardan arındırmak için daha az satır ve sütun içeren alt kümelerine ayrıştırma işlemidir.",
        ", Çorum - Çorum ili merkez ilçesine bağlı köy\n , Kelkit - Gümüşhane ili Kelkit ilçesine bağlı köy\n , İzmit - Kocaeli ili İzmit ilçesine bağlı mahalle\n , Haliliye - Şanlıurfa ili Haliliye ilçesine bağlı mahalle"
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
multilingual-e5-base_contrastive_loss_training_with_large_data_v2
1.13 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
TR-MTEB's picture
TR-MTEB
Add new SentenceTransformer model
6932a43 verified about 1 year ago
  • 1_Pooling
    Add new SentenceTransformer model about 1 year ago
  • .gitattributes
    1.57 kB
    Add new SentenceTransformer model about 1 year ago
  • README.md
    24.7 kB
    Add new SentenceTransformer model about 1 year ago
  • config.json
    662 Bytes
    Add new SentenceTransformer model about 1 year ago
  • config_sentence_transformers.json
    205 Bytes
    Add new SentenceTransformer model about 1 year ago
  • model.safetensors
    1.11 GB
    xet
    Add new SentenceTransformer model about 1 year ago
  • modules.json
    349 Bytes
    Add new SentenceTransformer model about 1 year ago
  • sentence_bert_config.json
    53 Bytes
    Add new SentenceTransformer model about 1 year ago
  • special_tokens_map.json
    964 Bytes
    Add new SentenceTransformer model about 1 year ago
  • tokenizer.json
    17.1 MB
    xet
    Add new SentenceTransformer model about 1 year ago
  • tokenizer_config.json
    1.37 kB
    Add new SentenceTransformer model about 1 year ago