Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 14
How to use LAMDEC/gte-pgm-pairs with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("LAMDEC/gte-pgm-pairs", trust_remote_code=True)
sentences = [
"TRIBUNAL DE JUSTIÇA DO ESTADO DO RIO DE JANEIRO\neJUD TJRJ\n15/01/2024 14:44\nEmitido em:\nSECRETARIA DA 7ª CÂMARA DE DIREITO PÚBLICO\nProcesso: 0100621-07.2017.8.19.0001 - APELAÇÃO\nINTIMAÇÃO ELETRÔNICA\nRio de Janeiro, 15 de janeiro de 2024\nFica V. Sª / V. Exª intimado da determinação abaixo:\nApelante: Centro de Estudos Jurídicos da Defensoria Pública Geral do Estado do Rio de Janeiro \nApelado 1: Estado do Rio de Janeiro \nApelado 2: Município do Rio de Janeiro\nRelator: Des. Maria Christina Berardo Rücker\nDECISÃO MONOCRÁTICA\nAPELAÇÃO CÍVEL. DIREITO CONSTITUCIONAL. MEDICAMENTOS. MORTE DO AUTOR. EXTINÇÃO\nSEM APRECIAÇÃO DO MÉRITO. SUCUMBÊNCIA. FALHA DO PODER PÚBLICO NA GARANTIA DO\nDIREITO FUNDAMENTAL À SAÚDE. PRINCÍPIO DA CAUSALIDADE. PEQUENO REPARO NO\nPRONUNCIAMENTO, PARA CONDENAR AMBOS OS RÉUS AO PAGAMENTO DE HONORÁRIOS\nSUCUMBENCIAIS. \n1. Sentença que julgou extinta a ação em que se buscava tratamento médico e exames, diante da morte do autor e\nda ausência de habilitação de herdeiros, condenado o demandante ao pagamento do ônus sucumbencial, observada\na gratuidade de justiça. \n2. O Superior Tribunal de Justiça entende que, nas hipóteses de extinção do processo sem resolução do mérito,\ndecorrente de perda de objeto superveniente ao ajuizamento da ação, a parte que deu causa à instauração do\nprocesso deverá suportar o pagamento dos honorários advocatícios. \n3. Evidente falha do Poder Público no cumprimento de seu dever solidário na garantia do direito fundamental à\nsaúde, expresso no Enunciado nº 65 deste Tribunal de Justiça, o que ensejou a propositura da presente demanda.",
"Poder Judiciário do Estado do Rio de Janeiro \nDécima Primeira Câmara Cível \n \n \n \n \n \n \n \nSecretaria da Décima Primeira Câmara Cível \nRua Dom Manuel nº 37 \nCentro – Rio de Janeiro/RJ \nJr \n \n \nRELATÓRIO \n \n \nTrata-se de Embargos de Declarações opostos por\n Geysa Conceição \nNascimento Laurino e Outros\n , às fls.290/292, e, pelo \nMunicípio do Rio de Janeiro\n \ncontra o v. acórdão de fls. 257/266. \n \nAduzem as primeiras Embargantes que houve omissão no julgado, uma vez \nque não foi apreciado o requerimento de deferimento da gratuidade de Justiça \nformulada no apelo. \n \nRequerem, por final, seja conhecido e provido o recurso para que seja \nsanada a omissão apontada, dando-se efeitos infringentes ao julgado, a fim de que \nseja deferido o requerimento da gratuidade de justiça formulado. \n \nAlega o segundo Embargante que houve omissão e contradição no v. \nacórdão, tendo o julgado contrariado o art. 169, § 1º, I e II da Carta Magna. Que, \ninexiste previsão legal que ampare o pleito autoral. Que o v. acórdão violou texto \nconstitucional, e, por analogia a Súmula 37 do Pretório Excelso. \n \nRequer, por final, seja conhecido e provido os embargos declaratórios, para \nque sejam sanadas as contradições e omissões apontadas, com os efeitos daí \ndecorrentes, notadamente a contrariedade ao art. 169, § 1º, I e II do texto \nconstitucional, além dos arts.1º; 2º; 5º, II; 18 e 37 do Texto Constitucional e por",
"26/05/1994. \nIII. O Tribunal de origem, com base no exame dos \nelementos fáticos dos autos e das cláusulas do \ncontrato \nfirmado \nentre \nas \npartes, \nconcluiu que, \"considerando também a inexistência \nde aditivo contratual posterior que estabeleça a \npossibilidade de atualização monetária -, é de se \nconcluir que a avença deve ser cumprida nos \ntermos pactuados e anuídos pelas partes (neles \nincluídos os valores constantes nas tabelas da \nOrdem \nde \nServiço \nINSS/PG \nn° \n17/1994, \nestipulados de acordo com o novo ambiente de \nestabilização \neconômica)\". \nIV. Assim, nos termos em que a causa fora decidida, \ninfirmaras conclusões do julgado ? de que inexistiria \nprevisão \ncontratual \nde \nreajuste dos serviços advocatícios ? demandaria, \nnecessariamente, \na análise das cláusulas do \nreferido contrato, bem como a incursão no \nconteúdo fático-probatório dos autos, o que é \nvedado, em sede de Recurso Especial, em razão \ndos óbices das Súmulas 5 e 7 do STJ\n, \n328",
"TRIBUNAL DE JUSTIÇA DO ESTADO DO RIO DE JANEIRO\neJUD TJRJ\n15/01/2024 14:44\nEmitido em:\n \n(...) Assim, tendo em vista o falecimento do Autor (certidão de óbito de fl.273), bem como a certidão de inércia de\nmanifestação de possíveis sucessores a se habilitarem no feito às f. 295 e da diligência negativa às f, 281/282, já\ntendo transcorrido anos do óbito sem qualquer habilitação de herdeiros, forçoso reconhecer a falta de pressuposto\nprocessual (existência de parte), de forma que JULGO EXTINTO O PROCESSO, SEM APRECIAÇÃO DO\nMÉRITO, na forma do Art. 485, IV, do CPC. \n \nCustas e honorários de 10% sobre o valor da causa pela autora, com exigibilidade suspensa face a gratuidade de\njustiça deferida. Certificado o trânsito em julgado, diligencie-se como de praxe para fins de baixa e arquivamento.\nP.I. \n Em suas razões, a DEFENSORIA PÚBLICA reitera que os réus deram causa à demanda, de forma que\ndevem ser condenados ao pagamento dos honorários sucumbenciais (índex 326).\n \n Contrarrazões pelo Estado (índex 341).\n \n Sem contrarrazões pelo Município (índex 349). \n \n Parecer da d. Procuradoria de Justiça pelo provimento do recurso (índex 360).\n \n Decisão proferida pela i. relatora originária, em que declinada a competência em favor de uma das Câmaras\nde Direito Público deste Tribunal de Justiça (índex 365).\n \n \n É o relatório. Decido. \n \n Presentes os requisitos intrínsecos e extrínsecos de admissibilidade, conheço da apelação. \n \n As partes controvertem neste recurso tão somente quanto aos honorários sucumbenciais devidos em virtude\nda extinção do feito, em que se buscava tratamento médico e exames, diante da morte do autor e da ausência de"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from Alibaba-NLP/gte-multilingual-base on the parquet dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'NewModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'PROCURADORIA GERAL DO ESTADO DO RIO DE JANEIRO \nPROCURADORIA DE SERVIÇOS DE SAÚDE (PG-16) \n \nEXMO. SR. DR. DES. 3º PRESIDENTE DO TRIBUNAL DE JUSTIÇA DO RIO DE \nJANEIRO \n \n \n \nProcesso 0076107-19.2019.8.19.0001 \n \n \n \nO\n ESTADO DO RIO DE JANEIRO, \npela Procuradoria Geral do Estado, \nnos autos do recurso extraordinário interposto por \nPERCEDINA DOS SANTOS TORRES e \noutro\n,\n \nvem, tempestivamente, apresentar suas \n \n \nCONTRARRAZÕES DE RECURSO EXTRAORDINÁRIO \n \n \npelos fundamentos jurídicos expostos na peça em anexo, esperando, desde já, pelo não \nconhecimento ou pelo desprovimento do recurso, como de Direito. \n \nPede deferimento. \nRio de Janeiro, 26 de janeiro de 2021. \n \n \n \nLETICIA LACROIX DE OLIVEIRA \nP\nROCURADORA DO \nE\nSTADO\n \n \n \n \n \n \n \nTJRJ 202100041683 27/01/2021 00:06:00 GPLI - PETIÇÃO ELETRÔNICA Assinada por LETICIA LACROIX DE OLIVEIRA\n373\nDigitally signed by LETICIA LACROIX DE OLIVEIRA:04296848780\nDate: 2021.01.26 21:23:08 BRST',
'PROCURADORIA GERAL DO ESTADO DO RIO DE JANEIRO \nPROCURADORIA DE SERVIÇOS DE SAÚDE (PG-16) \n \n \n3 \n \n Na prática, pode-se concluir que o acórdão recorrido revogou toda a \njurisprudência sumular dos Tribunais Superiores, entendendo ser aplicável um julgado do STF \nque, numa ação rescisória e em caráter incidental, acredita ser cabível o pagamento de \nhonorários advocatícios à Defensoria Pública pelo mesmo ente federado responsável por seu \nfuncionamento. Situação que, \npermissa venia\n, é inadmissível e viola frontalmente o \nordenamento jurídico vigente. \n \n Uma outra questão jurídica diz respeito à possibilidade de este acórdão do STF, \nque como já se disse, decidiu sobre o tema em caráter incidental e não tem caráter vinculante, \nrevogar a própria Súmula 421 do STJ. Um acórdão que decide um tema de modo incidental \nrevoga automaticamente as Súmulas dos outros Tribunais? \nData venia\n, parece-nos que não. \n \nII - ILEGALIDADE DO PAGAMENTO DE HONORÁRIOS PELO ESTADO EM \nFAVOR DA DEFENSORIA PÚBLICA – OCORRÊNCIA DA CONFUSÃO (ARTIGO \n381 DO CÓDIGO CIVIL) – TEMA PACIFICADO PELO E. STJ\n \n \nRememore-se, por oportuno, que já está pacificado na doutrina e na jurisprudência \no entendimento de que há confusão na condenação do Estado ao pagamento de honorários \nsucumbenciais à Defensoria Pública, nos termos do que estabelece o artigo 381 do Código Civil, \nverbis\n: \n \nArt. 381 – Extingue-se a obrigação desde que na mesma pessoa se \nconfundam as qualidades de credor e devedor. \n \nCom efeito, considerando que tanto a Defensoria Pública, quanto o seu Centro de \nEstudos Jurídicos são órgãos do próprio Estado, mostra-se flagrante que o caso é de confusão',
'Atribuição: Fazenda Pública \nCódigo/Nome Movimento: 1000173/Outras manifestações em 2º grau\n \nrestituição dos valores indevidamente descontados, com atualização e juros, e \napuração em fase de liquidação de sentença. \n \nInconformada, a parte ré interpôs o recurso de apelação do \nitem 000114. \n \nPetição juntada no item 000122 noticiando o falecimento do \nautor e requerendo sua substituição processual por sua filha, Luciana Maria da Silva \nMirandola. \n \nDespacho no item 000140 determinando a intimação da \nProcuradoria Geral do Município do Rio de Janeiro e do Ministério Público sobre o \npedido de habilitação. \n \nCiência do Parquet no item 000148. \n \nManifestação dos réus no item 000150 requerendo a \ndeclaração de nulidade da sentença e dos atos praticados após o óbito do autor, bem \ncomo a rejeição do pedido de habilitação, uma vez que a sucessão processual deveria \nser pelo espólio, na forma do artigo 110 do CPC. \n \nDespacho no item 000155 para manifestação do Ministério \nPúblico. \n \nCiência do Parquet no item 000161. \n \nDespacho no item 000164 para manifestação da parte autora. \n \n221',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.6637, -0.0623],
# [ 0.6637, 1.0000, -0.0069],
# [-0.0623, -0.0069, 1.0000]])
InformationRetrievalEvaluator| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.6545 |
| cosine_accuracy@3 | 0.7925 |
| cosine_accuracy@5 | 0.841 |
| cosine_accuracy@10 | 0.89 |
| cosine_precision@1 | 0.6545 |
| cosine_precision@3 | 0.5032 |
| cosine_precision@5 | 0.4011 |
| cosine_precision@10 | 0.2742 |
| cosine_recall@1 | 0.2385 |
| cosine_recall@3 | 0.4422 |
| cosine_recall@5 | 0.5245 |
| cosine_recall@10 | 0.6212 |
| cosine_ndcg@10 | 0.622 |
| cosine_mrr@10 | 0.7326 |
| cosine_map@100 | 0.5411 |
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Doc. 1 |
3 |
TRIBUNAL DE JUSTIÇA DO RIO DE JANEIRO |
não concorda e deve, por isso, manejar os recursos que entender cabíveis e não insistir na oposição de embargos |
TRIBUNAL DE JUSTIÇA DO ESTADO DO RIO DE JANEIRO |
Requereu a procedência do pedido para a condenação da ré na obrigação de fazer consistente na adequada |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
EXCELENTÍSSIMA. DRA. DESEMBARGADORA-RELATORA DA QUINTA |
Escolar; Dar banho e trocar o vestuário das crianças da |
TRIBUNAL DE JUSTIÇA DO RIO DE JANEIRO |
VEREDA, A PRESTAÇÃO DO SERVIÇO MÉDICO-HOSPITALAR PELO AUTOR DECORREU DA |
Praça Floriano, n. 55, sala 409 – Cinelândia - Centro. Rio de Janeiro – RJ. Brasil. CEP: 20.031-050. |
Praça Floriano, n. 55, sala 409 – Cinelândia - Centro. Rio de Janeiro – RJ. Brasil. CEP: 20.031-050. |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
eval_strategy: stepsper_device_train_batch_size: 64per_device_eval_batch_size: 64gradient_accumulation_steps: 4num_train_epochs: 1warmup_ratio: 0.1bf16: Trueoptim: adamw_8bitgradient_checkpointing: Trueeval_on_start: Truebatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 64per_device_eval_batch_size: 64per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 4eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_8bitoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Truegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Trueuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | Validation Loss | cosine_ndcg@10 |
|---|---|---|---|---|
| 0 | 0 | - | 2.9505 | 0.1959 |
| 0.1011 | 79 | 1.7256 | 0.8699 | 0.4472 |
| 0.2022 | 158 | 0.8044 | 0.6145 | 0.5072 |
| 0.3034 | 237 | 0.6254 | 0.5068 | 0.5353 |
| 0.4045 | 316 | 0.5215 | 0.4230 | 0.5725 |
| 0.5056 | 395 | 0.4507 | 0.3787 | 0.5906 |
| 0.6067 | 474 | 0.4014 | 0.3429 | 0.6014 |
| 0.7078 | 553 | 0.3779 | 0.3279 | 0.6129 |
| 0.8090 | 632 | 0.3463 | 0.3099 | 0.6223 |
| 0.9101 | 711 | 0.3202 | 0.2974 | 0.6220 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
Alibaba-NLP/gte-multilingual-base