Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

alina0195
/
ro-retriever

Sentence Similarity
sentence-transformers
Safetensors
bert
feature-extraction
dense
Generated from Trainer
dataset_size:11661069
loss:MatryoshkaLoss
loss:CachedMultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use alina0195/ro-retriever with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use alina0195/ro-retriever with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("alina0195/ro-retriever")
    
    sentences = [
        "Populația orașului Mirabel din Canada",
        "Mustique (pronunțat /mÊCVstiːk/) este o insulă privată mică, care face parte din Sf. Vincent și Grenadinele. Insula este una dintre insulele numite Grenadinele, majoritatea aflate în Sf. Vincent și Grenadinele, în Indiile de Vest. Insula se află în Parohia Grenadinele, o zonă administrativă a țării. Istoria insulei Mustique și a insulelor Grenadine în general datează din secolul al XV-lea, când marinari spanioli au zărit pentru prima oară acest grup de mici insule stâncoase și le-au botezat Los Pajaros (păsări), deoarece semănau cu un mic cârd de păsări care zboară deasupra mării.",
        "La momentul recensământului din 2006, Mirabel avea o populație de 34.626 de locuitori. Populația din Mirabel reprezintă 0,46% din totalul populației Quebec-ului (care număra 7.546,131 de locuitori la acel moment). Cu o populație de 34.626 de locuitori în 2006, cea a Mirabel a crescut cu 26,77% față de recensământul din 2001 (care a numărat 27.315 de locuitori).",
        "Montreal, Quebec, încorporat ca oraș în 1832, are o populație de 1.704.694 (conform recensământului din 2016) și 1.649.519 (conform recensământului din 2011). Montreal este al doilea oraș al Canadei ca mărime și găzduiește aproape jumătate din populația provinciei Quebec. Este metropola provinciei și a fost cel mai populat oraș din Canada timp de un secol și jumătate."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
ro-retriever
580 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 3 commits
alina0195's picture
alina0195
Update README.md
fee451b verified 15 days ago
  • 1_Pooling
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • .gitattributes
    1.52 kB
    initial commit 15 days ago
  • README.md
    39.3 kB
    Update README.md 15 days ago
  • config.json
    2.21 kB
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • config_sentence_transformers.json
    283 Bytes
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • model.safetensors
    577 MB
    xet
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • modules.json
    229 Bytes
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • sentence_bert_config.json
    57 Bytes
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • special_tokens_map.json
    695 Bytes
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • tokenizer.json
    3.1 MB
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago
  • tokenizer_config.json
    1.14 kB
    Add Romanian ModernBERT retriever (checkpoint-8000, lr=8e-5, MSMARCO-ro). 15 days ago