Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

avemio-digital
/
German-RAG_ModernBERT_base_pairs_embedding

Sentence Similarity
sentence-transformers
Safetensors
English
German
modernbert
feature-extraction
Generated from Trainer
dataset_size:933246
loss:MatryoshkaLoss
loss:MultipleNegativesRankingLoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use avemio-digital/German-RAG_ModernBERT_base_pairs_embedding with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use avemio-digital/German-RAG_ModernBERT_base_pairs_embedding with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("avemio-digital/German-RAG_ModernBERT_base_pairs_embedding")
    
    sentences = [
        "Was sind einige bemerkenswerte Ereignisse im Leben von Andrea Sawatzki, die in diesem Textausschnitt erwähnt werden?",
        "Die \"White Galloways\" sind ebenfalls hornlose schottische Rinder, die zur ganzjährigen Freilandhaltung geeignet sind und zu den extensiven, robusten Fleischrinderrassen gehören. Der Hauptanteil ihres Fells ist nahezu weiß, es gibt aber meist schwarze, mitunter auch blonde oder rot-braune Pigmentierung an Ohren, Maul, Füßen und um die Augen.",
        "2003 stand Sawatzki für eine erotische Fotoserie in der April-Ausgabe des \"Playboy\" vor der Kamera. 2007 war sie Patin des Deutschen Kinderpreises. 2011 tanzte sie in der 4. Staffel der RTL-Tanzshow \"Let’s Dance\" mit dem italienischen Profitänzer Stefano Terrazzino und belegte den achten Platz.",
        "Die Elektroejakulation ist eine in der Human- und Veterinärmedizin sowie in der Tierzucht eingesetzte Methode zur Spermiengewinnung, wenn die Gewinnung auf natürlichem Wege aufgrund von besonderen Umständen oder Erkrankungen nicht möglich ist, und unterscheidet sich in der Art der Durchführung sowie in der Wirkungsweise erheblich von der erotischen Elektrostimulation."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
German-RAG_ModernBERT_base_pairs_embedding
600 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 5 commits
avemio-digital's picture
avemio-digital
Update README.md
0273001 verified over 1 year ago
  • 1_Pooling
    Add new SentenceTransformer model over 1 year ago
  • .gitattributes
    1.52 kB
    initial commit over 1 year ago
  • README.md
    51 kB
    Update README.md over 1 year ago
  • config.json
    1.33 kB
    Add new SentenceTransformer model over 1 year ago
  • config_sentence_transformers.json
    205 Bytes
    Add new SentenceTransformer model over 1 year ago
  • model.safetensors
    596 MB
    xet
    Add new SentenceTransformer model over 1 year ago
  • modules.json
    229 Bytes
    Add new SentenceTransformer model over 1 year ago
  • sentence_bert_config.json
    54 Bytes
    Add new SentenceTransformer model over 1 year ago
  • special_tokens_map.json
    694 Bytes
    Add new SentenceTransformer model over 1 year ago
  • tokenizer.json
    3.58 MB
    Add new SentenceTransformer model over 1 year ago
  • tokenizer_config.json
    21 kB
    Add new SentenceTransformer model over 1 year ago