Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup
Paper
•
2101.06983
•
Published
•
1
This is a sentence-transformers model finetuned from PaDaS-Lab/xlm-roberta-base-msmarco. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Was ist eigentlich typisch dänisch?',
'Es gibt viele Dinge, die unser Lieblingsland auszeichnen. Hier findest Du ein paar Beispiele für das, was wunderbar typisch dänisch ist: 1. Hygge ist ein wichtiger Teil der dänischen Lebensweise, 2. In Dänemark wird das Fahrrad häufig dem Auto vorgezogen, 3. Vertrauen ist die dänische Grundeinstellung, 4. Dänemark ist super kinderfreundlich, 5. Auch die Dänen machen gerne Urlaub im eigenen Ferienhaus. Bei Deiner Zeit in Dänemark wirst Du bestimmt selber viele großartig typische Dinge bemerken und Dich rundum wohl fühlen.',
'Die Grundlage eines jeden Wettbonus sind die Bonus- und Umsatzbedingungen, die bestimmen, wie schnell ein 150%-Bonus und mögliche Gewinne ausgezahlt werden können. Achten Sie daher darauf, dass die Umsatzbedingungen Ihres Wettanbieters für den 150%-Bonus vernünftig und nicht zu sehr zeitlich begrenzt sind.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.8050, 0.1170],
# [0.8050, 1.0000, 0.1410],
# [0.1170, 0.1410, 1.0000]])
sentence_0, sentence_1, sentence_2, sentence_3, sentence_4, and sentence_5| sentence_0 | sentence_1 | sentence_2 | sentence_3 | sentence_4 | sentence_5 | |
|---|---|---|---|---|---|---|
| type | string | string | string | string | string | string |
| details |
|
|
|
|
|
|
| sentence_0 | sentence_1 | sentence_2 | sentence_3 | sentence_4 | sentence_5 |
|---|---|---|---|---|---|
Wat is een leuke badplaats voor jongeren? |
Voor jongeren zijn Blanes en Lloret de Mar hele leuke badplaatsen. De steden zijn ingericht op het uitgaansleven. Je vindt hier dus veel clubs en bars. Overdag zijn er veel activiteiten te doen op het strand. |
We beoordelen onze docenten via een intakegesprek op verschillende gebieden. Pedagogisch uiteraard: aanpak, didactische skills, eventuele ervaring. Maar ook de vakkennis huiswerkbegeleiding is belangrijk voor ons. Elke bijlesdocent uit regio Zoutleeuw moet ook een uittreksel uit het strafregister model 596.2 voorleggen, samen met hun diploma('s). We houden de kwaliteit van onze docenten steevast in de gaten. |
Schuurmiddel kan poreuze oppervlakken beschadigen. De korrelige structuur kan ervoor zorgen dat er krassen achterblijven op het oppervlak of er kleine deukjes ontstaan. Lees daarom altijd de instructies op de fles en probeer het middel eerst op een klein en niet-zichtbaar stukje van het oppervlak. |
Spinnen zijn nuttig voor het vangen van andere insecten zoals vliegen en muggen. Bij overlast wil je natuurlijk wel graag af van spinnen. Wanneer er teveel komen is dit niet meer fijn en zal je spinnen moeten bestrijden voordat je hele huis vol zit. |
Wanneer je grond overhoudt na bijvoorbeeld het afgraven van je tuin of terrein of de bouw en verbouwing van je huis heb je in de meeste gevallen een schoongrondverklaring nodig. Daarna is het namelijk pas mogelijk de grond af te laten voeren door een transportbedrijf of milieustraat. Wanneer je gemeente geen schoongrondverklaring voor jouw terrein beschikbaar heeft, moet je hier dus zelf voor zorgen door middel van het laten uitvoeren van bodemonderzoek. |
Kann man in Deutschland amerikanische Häuser bauen? |
Grundsätzlich können Sie auch in unserer Heimat ein amerikanisches Haus bauen, sofern es der örtliche Bebauungsplan zulässt. Abgesehen von der recht üppig verschnörkelten amerikanischen Villa aus den Südstaaten fügen sich die Holzbauten nahtlos in die meisten Wohngegenden ein. Und auch für ein ausgeklügeltes amerikanisches Haus mit Veranda sollten Sie bei entsprechend großem Grundstück eine Baugenehmigung erhalten. Informieren Sie sich am besten zeitnah, um mögliche Änderungen mit Ihrem Baupartner einzuplanen. |
Du bekommst deine erste Rechnung von Polarstern i.d.R. zum selben Zeitpunkt, an dem du bisher deine Rechnung von deinem Energieversorger bekommen hast. Denn nicht der Energieversorger legt den Zeitpunkt der Ablesung des Zählerstandes fest, sondern der zuständige Netzbetreiber. Und dein Netzbetreiber bleibt trotz Versorgerwechsel gleich, folglich bleibt es auch beim gleichen Abrechnungszeitraum. Wenn du einen anderen Abrechnungsturnus wünscht, sprich einfach mit uns, telefonisch unter 089 309 042 914 oder per E-Mail an abrechnung@service.polarstern-energie.de . |
Innerhalb Österreichs berechnen wir für die Warenlieferung pauschal 3,95 € pro Bestellung. Achten Sie auf unsere Sonderangebote, denn wir bieten auch regelmäßig kostenlosen Versand an. |
Dies ist nur dann notwendig, wenn in der Gebrauchsanweisung die Anwendung auf dem Gesicht ausgeschlossen wird, was bei keinem Linola Präparat gegeben ist. Aufgrund der Eigenschaften ergeben sich jedoch bevorzugte Anwendungsregionen. Linola Gesicht ist daher für die Anwendung auf der Gesichtshaut vorgesehen, doch lässt sie sich natürlich auch auf allen anderen Hautstellen anwenden. |
Mit der pdfFiller-Mobil-App für Android können Sie Änderungen an PDF-Dateien wie holen sie sich kostenlos vornehmen. Dokumente können direkt von Ihrem Mobilgerät aus bearbeitet, signiert und gesendet werden. Installieren Sie die App und verwalten Sie Ihre Dokumente von überall aus. |
Como posso jogar a versão demo do Ganesha Gold gratuitamente? |
Para jogar a versão demo grátis do Ganesha Gold, basta acessar um cassino online que ofereça o jogo e selecionar a opção “Demo” ou “Jogar Grátis”. A versão demo permite que você experimente o jogo sem arriscar dinheiro real, perfeito para quem deseja conhecer as funcionalidades antes de apostar. |
Você precisa de seu passaporte, carteira de motorista, carteira de identidade, conta de serviços públicos ou uma combinação de ambos para validar sua conta. |
A queda de cabelo e o cabelo quebrado são comuns na gravidez, mas podem ser minimizados mantendo uma dieta saudável, evitando tração excessiva nos fios (penteados muito apertados, por exemplo), fazendo hidratações recorrentes e utilizando produtos suaves para lavar os fios. |
Nas montanhas, em Les Saisies, este apartamento oferece acesso direto às pistas de esqui e fica a 2 km de Elevador para esqui de Legette, Le Signal em Les Saisies e Informações turísticas de Les Saisies. Elevador para esqui de Chard du Beurre e Elevador para esqui de Bisanne também ficam a 2 km. |
O manjericão sagrado, também conhecido como tulsi, é conhecido pelo seu poder terapêutico, as folhas de tulsi são agora consideradas pela maioria dos países como adaptógenos (agentes anti-stress) e têm sido amplamente utilizadas para promover a saúde em todo o corpo. |
CachedMultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"mini_batch_size": 32,
"gather_across_devices": false
}
per_device_train_batch_size: 128per_device_eval_batch_size: 128num_train_epochs: 1fp16: Truemulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 128per_device_eval_batch_size: 128per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 0.05 | 500 | 1.1958 |
| 0.1 | 1000 | 0.1077 |
| 0.15 | 1500 | 0.084 |
| 0.2 | 2000 | 0.0711 |
| 0.25 | 2500 | 0.0668 |
| 0.3 | 3000 | 0.0601 |
| 0.35 | 3500 | 0.0576 |
| 0.4 | 4000 | 0.0558 |
| 0.45 | 4500 | 0.0536 |
| 0.5 | 5000 | 0.0523 |
| 0.55 | 5500 | 0.0498 |
| 0.6 | 6000 | 0.0511 |
| 0.65 | 6500 | 0.0472 |
| 0.7 | 7000 | 0.046 |
| 0.75 | 7500 | 0.0452 |
| 0.8 | 8000 | 0.0448 |
| 0.85 | 8500 | 0.043 |
| 0.9 | 9000 | 0.0426 |
| 0.95 | 9500 | 0.0441 |
| 1.0 | 10000 | 0.0441 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
Base model
FacebookAI/xlm-roberta-base