Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

rztk-bohdanbilonoh
/
multilingual-e5-base-test

Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
Generated from Trainer
dataset_size:44800
loss:RZTKMatryoshka2dLoss
Eval Results (legacy)
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use rztk-bohdanbilonoh/multilingual-e5-base-test with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use rztk-bohdanbilonoh/multilingual-e5-base-test with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("rztk-bohdanbilonoh/multilingual-e5-base-test")
    
    sentences = [
        "папка планшет",
        "<category>Сифони</category><brand>Alcaplast</brand><options><option_title>Гарантія</option_title><option_value>24 місяці офіційної гарантії від виробника</option_value><option_title>Кількість вантажних місць</option_title><option_value>1</option_value><option_title>Країна-виробник товару</option_title><option_value>Чехія</option_value><option_title>Призначення</option_title><option_value>Для душових піддонів</option_value><option_title>Матеріал</option_title><option_value>Пластик</option_value><option_title>Вид</option_title><option_value>Пляшковий</option_value><option_title>Під'єднані до пральної машини</option_title><option_value>Немає</option_value><option_title>Колір</option_title><option_value>Білий + Хром</option_value><option_title>Тип</option_title><option_value>Сифон</option_value><option_title>Теги</option_title><option_value>недорогий сифон</option_value><option_title>відкривання/перекриття зливних отворів</option_title><option_value>Неперекривний</option_value><option_title>Різновид гідрозатвора</option_title><option_value>Мокрий (без мембрани)</option_value><option_title>Діаметр під'єднання</option_title><option_value>90 мм</option_value><option_title>Діаметр патрубка в каналізацію</option_title><option_value>40 мм</option_value><option_title>Переливання</option_title><option_value>Без функції переливу</option_value><option_title>Тип гарантійного талона</option_title><option_value>Гарантія по чеку</option_value><option_title>Доставка Premium</option_title><option_title>Доставка</option_title><option_value>Доставка в магазини ROZETKA</option_value></options>",
        "Сифон для душевого поддона ALCA PLAST A49CR (8594045930627)",
        "<category>Папки-планшеты</category><brand>iTEM</brand><options><option_title>Формат</option_title><option_value>A4</option_value><option_title>Материал</option_title><option_value>Картон</option_value><option_title>Страна регистрации бренда</option_title><option_value>Украина</option_value><option_title>Страна-производитель товара</option_title><option_value>Украина</option_value></options>"
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
multilingual-e5-base-test
578 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 6 commits
rztk-bohdanbilonoh's picture
rztk-bohdanbilonoh
Model save
c1f514e verified over 1 year ago
  • 1_Pooling
    Model save over 1 year ago
  • .gitattributes
    1.57 kB
    Training in progress, step 30 over 1 year ago
  • README.md
    36.5 kB
    Model save over 1 year ago
  • config.json
    715 Bytes
    Training in progress, step 30 over 1 year ago
  • config_sentence_transformers.json
    249 Bytes
    Model save over 1 year ago
  • model.safetensors
    556 MB
    xet
    Model save over 1 year ago
  • modules.json
    349 Bytes
    Model save over 1 year ago
  • sentence_bert_config.json
    53 Bytes
    Model save over 1 year ago
  • sentencepiece.bpe.model
    5.07 MB
    xet
    Training in progress, step 30 over 1 year ago
  • special_tokens_map.json
    964 Bytes
    Training in progress, step 30 over 1 year ago
  • tokenizer.json
    17.1 MB
    xet
    Training in progress, step 30 over 1 year ago
  • tokenizer_config.json
    1.15 kB
    Training in progress, step 30 over 1 year ago
  • training_args.bin
    5.62 kB
    xet
    Training in progress, step 30 over 1 year ago