Sentence Similarity
sentence-transformers
Safetensors
French
xlm-roberta
legal
french
embeddings
retrieval
text-embeddings-inference
Instructions to use IvanDVonga/LegalEmbed with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use IvanDVonga/LegalEmbed with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("IvanDVonga/LegalEmbed") sentences = [ "C'est une personne heureuse", "C'est un chien heureux", "C'est une personne très heureuse", "Aujourd'hui est une journée ensoleillée" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Add model card
Browse files
README.md
CHANGED
|
@@ -1,731 +1,50 @@
|
|
| 1 |
---
|
|
|
|
|
|
|
|
|
|
| 2 |
tags:
|
| 3 |
-
- sentence-transformers
|
| 4 |
-
-
|
| 5 |
-
-
|
| 6 |
-
-
|
| 7 |
-
-
|
| 8 |
-
- loss:MultipleNegativesRankingLoss
|
| 9 |
base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
|
| 10 |
-
|
| 11 |
-
-
|
| 12 |
-
aux actions des administrateurs judiciaires, commissaires à l''exécution du plan,
|
| 13 |
-
mandataires judiciaires et liquidateurs concernant leur rémunération, à compter
|
| 14 |
-
de la notification prévue ?'
|
| 15 |
-
sentences:
|
| 16 |
-
- 'Texte de loi : Les organismes qui demandent à figurer sur la liste arrêtée par
|
| 17 |
-
le préfet de région établissent leur aptitude à assurer, conformément aux dispositions
|
| 18 |
-
du sous-paragraphe 1, la formation des membres de la délégation du personnel du
|
| 19 |
-
comité social et économique. Ils justifient notamment des capacités de leurs formateurs
|
| 20 |
-
et de l''expérience acquise par ces derniers en matière de prévention des risques
|
| 21 |
-
professionnels et de conditions de travail. Le préfet de région se prononce après
|
| 22 |
-
avis du comité régional de l''emploi, de la formation de l''orientation professionnelles.
|
| 23 |
-
Le silence gardé pendant plus de quatre mois sur une demande d''agrément vaut
|
| 24 |
-
décision de rejet.'
|
| 25 |
-
- 'Texte de loi : Si, après immatriculation d''une société coopérative européenne,
|
| 26 |
-
au moins un tiers des salariés de la société coopérative européenne et de ses
|
| 27 |
-
filiales et établissements, employés dans au moins deux Etats membres, le demandent
|
| 28 |
-
ou si le seuil de cinquante salariés employés dans au moins deux Etats membres
|
| 29 |
-
est atteint ou dépassé, un groupe spécial de négociation est institué et une négociation
|
| 30 |
-
est organisée conformément aux dispositions du chapitre II du présent titre.'
|
| 31 |
-
- 'Texte de loi : Les actions des administrateurs judiciaires, commissaires à l''exécution
|
| 32 |
-
du plan, mandataires judiciaires et liquidateurs, en matière de rémunération,
|
| 33 |
-
se prescrivent par six mois à compter de la notification prévue à l''article R.
|
| 34 |
-
663-38 .'
|
| 35 |
-
- source_sentence: 'Question juridique : Quels sont les critères qui interdisent les
|
| 36 |
-
projets de séries de bénéficier d''une aide, en fonction de l''existence de contrats
|
| 37 |
-
ou de soumissions à des entreprises de production ou à des éditeurs de services
|
| 38 |
-
de télévision ou de médias audiovisuels ?'
|
| 39 |
-
sentences:
|
| 40 |
-
- 'Texte de loi : Ne peuvent siéger dans un conseil de discipline que les militaires
|
| 41 |
-
en position d''activité et non bénéficiaires de l''un des congés prévus à l''article
|
| 42 |
-
L. 4138-2 .'
|
| 43 |
-
- 'Texte de loi : Les projets de séries ne doivent pas faire l''objet d''un contrat
|
| 44 |
-
d''option ou d''un contrat de production audiovisuelle conclu avec une entreprise
|
| 45 |
-
de production au moment du dépôt de la demande d''aide ou au cours de son instruction.
|
| 46 |
-
Les projets ne doivent pas avoir été soumis à un éditeur de services de télévision
|
| 47 |
-
ou de services de médias audiovisuels à la demande et acceptés par ce dernier
|
| 48 |
-
antérieurement au dépôt de la demande. En outre, les projets ne doivent pas être
|
| 49 |
-
soumis à un tel éditeur jusqu''à la décision du président du Centre national du
|
| 50 |
-
cinéma et de l''image animée.'
|
| 51 |
-
- 'Texte de loi : I.-Le renvoi devant le tribunal de commerce spécialisé en application
|
| 52 |
-
du troisième alinéa de l''article L. 662-8 est prononcé d''office par le président
|
| 53 |
-
du tribunal saisi, par ordonnance motivée, après avoir entendu ou dûment appelé
|
| 54 |
-
le débiteur et recueilli l''avis du ministère public. Le greffier du tribunal
|
| 55 |
-
de commerce saisi transmet aussitôt le dossier au président du tribunal de commerce
|
| 56 |
-
spécialisé désigné, avec une copie de l''ordonnance de renvoi. II.-Le renvoi devant
|
| 57 |
-
le tribunal de commerce spécialisé compétent peut également être demandé par requête
|
| 58 |
-
motivée du débiteur, de l''administrateur judiciaire, du mandataire judiciaire
|
| 59 |
-
ou du ministère public près le tribunal de commerce saisi. Le greffier du tribunal
|
| 60 |
-
de commerce saisi notifie la requête aux parties sans délai. Le président du tribunal
|
| 61 |
-
statue sur la demande de renvoi par ordonnance motivée après avoir entendu ou
|
| 62 |
-
dûment appelé le débiteur, le mandataire de justice et recueilli l''avis du ministère
|
| 63 |
-
public. S''il est fait droit à la demande de renvoi, le greffier du tribunal de
|
| 64 |
-
commerce saisi transmet aussitôt le dossier au président du tribunal de commerce
|
| 65 |
-
spécialisé désigné, avec une copie de l''ordonnance de renvoi. III.-Les décisions
|
| 66 |
-
prises en application du présent article sont des mesures d''administration judiciaire
|
| 67 |
-
non susceptibles de recours. Elles s''imposent aux parties et à la juridiction
|
| 68 |
-
de renvoi désignée.'
|
| 69 |
-
- source_sentence: 'Question juridique : Quels sont les modes de convocation et les
|
| 70 |
-
conditions de réunion du conseil d''administration du Centre national du cinéma
|
| 71 |
-
et de l''image animée, notamment en ce qui concerne la fréquence des réunions
|
| 72 |
-
et les décisions de l''ordre du jour ?'
|
| 73 |
-
sentences:
|
| 74 |
-
- 'Texte de loi : Les documents comptables sont établis en euros et en langue française.
|
| 75 |
-
Les documents comptables et les pièces justificatives sont conservés pendant dix
|
| 76 |
-
ans. Les documents comptables relatifs à l''enregistrement des opérations et à
|
| 77 |
-
l''inventaire sont établis et tenus sans blanc ni altération d''aucune sorte,
|
| 78 |
-
dans des conditions fixées par décret en Conseil d''Etat.'
|
| 79 |
-
- 'Texte de loi : Le collège de résolution ainsi que le fonds de garantie des dépôts
|
| 80 |
-
et de résolution peuvent procéder au recouvrement des sommes correspondant au
|
| 81 |
-
montant de toute dépense justifiée exposée pour la mise en œuvre d''une ou plusieurs
|
| 82 |
-
mesures de résolution. Ces dépenses doivent avoir été raisonnables et exposées
|
| 83 |
-
à bon escient. Le recouvrement intervient selon une ou plusieurs des modalités
|
| 84 |
-
suivantes : 1° En déduisant le montant des sommes à recouvrer de toute contrepartie
|
| 85 |
-
payée par un acquéreur à la personne soumise à une procédure de résolution ou,
|
| 86 |
-
le cas échéant, aux détenteurs de titres de capital mentionnés au chapitre II
|
| 87 |
-
du titre Ier du livre II ou d''autres titres de propriété ; 2° En constatant à
|
| 88 |
-
hauteur des sommes en cause une créance bénéficiant du privilège prévu à l'' article
|
| 89 |
-
L. 611-11 du code de commerce à l''égard soit de la personne soumise à une procédure
|
| 90 |
-
de résolution soit, le cas échéant, de l''établissement-relais ou de la structure
|
| 91 |
-
de gestion des actifs.'
|
| 92 |
-
- 'Texte de loi : Le conseil d''administration se réunit au moins deux fois par
|
| 93 |
-
an, sur convocation du président du Centre national du cinéma et de l''image animée
|
| 94 |
-
qui fixe l''ordre du jour. Il est également réuni par le président à la demande
|
| 95 |
-
du ministre chargé de la culture ou à celle de la moitié au moins de ses membres
|
| 96 |
-
qui, dans ce cas, proposent l''ordre du jour de la séance. En cas d''absence ou
|
| 97 |
-
d''empêchement du président du Centre national du cinéma et de l''image animée,
|
| 98 |
-
le conseil d''administration est présidé et, si nécessaire, convoqué par le secrétaire
|
| 99 |
-
général du ministère chargé de la culture.'
|
| 100 |
-
- source_sentence: 'Question juridique : Code de l''action sociale et des familles,
|
| 101 |
-
art. L113-3'
|
| 102 |
-
sentences:
|
| 103 |
-
- 'Texte de loi : I. - Une conférence nationale de l''autonomie est organisée au
|
| 104 |
-
moins tous les trois ans afin de définir les orientations et de débattre des moyens
|
| 105 |
-
de la politique de prévention de la perte d''autonomie. Cette conférence s''appuie
|
| 106 |
-
sur les travaux de la Caisse nationale de solidarité pour l''autonomie et l''expertise
|
| 107 |
-
du centre national de ressources probantes mentionné à l''article L. 223-7-1 du
|
| 108 |
-
code de la sécurité sociale . II. - La conférence nationale de l''autonomie est
|
| 109 |
-
notamment composée de représentants : 1° De l''Etat ; 2° Des conseils départementaux
|
| 110 |
-
; 3° D''organismes de sécurité sociale ; 4° D''organismes gestionnaires des établissements
|
| 111 |
-
ou services sociaux et médico-sociaux accueillant des personnes âgées ; 5° D''associations
|
| 112 |
-
représentatives des personnes âgées ; 6° Des professionnels concernés par la prévention
|
| 113 |
-
et l''accompagnement de la perte d''autonomie. III. - Un décret détermine les
|
| 114 |
-
modalités d''application des I et II du présent article.'
|
| 115 |
-
- 'Texte de loi : Ne peuvent être nommées liquidateurs les personnes auxquelles
|
| 116 |
-
l''exercice des fonctions de directeur général, d''administrateur, de gérant de
|
| 117 |
-
société, de membre du directoire ou du conseil de surveillance est interdit ou
|
| 118 |
-
qui sont déchues du droit d''exercer ces fonctions.'
|
| 119 |
-
- 'Texte de loi : L''infraction prévue à l''article 432-1 est punie de dix ans d''emprisonnement
|
| 120 |
-
et de 150 000 euros d''amende si elle a été suivie d''effet.'
|
| 121 |
-
- source_sentence: 'Question juridique : Code de l''action sociale et des familles,
|
| 122 |
-
art. D312-5'
|
| 123 |
-
sentences:
|
| 124 |
-
- 'Texte de loi : Le conseil d''administration règle par ses délibérations les affaires
|
| 125 |
-
de l''établissement. A ce titre, notamment, il : 1° Adopte le budget annuel et
|
| 126 |
-
ses modifications ; Il fixe dans ce cadre le montant annuel des financements qu''il
|
| 127 |
-
apporte aux opérations et actions prévues à l''article L. 435-1 , dans les conditions
|
| 128 |
-
et selon les modalités qu''il détermine. Il programme annuellement la répartition
|
| 129 |
-
territoriale du montant des nouvelles opérations et actions à engager par l''Etat,
|
| 130 |
-
et les objectifs associés, selon une nomenclature qu''il aura fixée par délibération.
|
| 131 |
-
Un arrêté des ministres chargés du logement, de l''économie et du budget précise
|
| 132 |
-
les règles de gestion financière du Fonds national des aides à la pierre en vue
|
| 133 |
-
d''en garantir la soutenabilité. A ce titre, il encadre la détermination du montant
|
| 134 |
-
annuel de ces nouvelles opérations et actions ainsi que du montant annuel des
|
| 135 |
-
versements effectués par le fonds à l''Etat en tenant compte des prévisions de
|
| 136 |
-
recettes du fonds et de l''exécution des engagements déjà pris par l''Etat ; 2°
|
| 137 |
-
Arrête les comptes annuels, l''affectation des résultats et l''emploi des disponibilités
|
| 138 |
-
et des réserves ; 3° Adopte son règlement intérieur ; 4° Peut créer un comité
|
| 139 |
-
consultatif dédié à l''accomplissement des missions prévues au 2° du II de l''article
|
| 140 |
-
L. 435-1, pouvant comporter des personnalités qualifiées extérieures ; 5° Approuve
|
| 141 |
-
le rapport annuel d''activité de l''établissement ; 6° Autorise les actions en
|
| 142 |
-
justice ainsi que les transactions et approuve les conventions et marchés. Lorsqu''il
|
| 143 |
-
délibère en application du 1° ci-dessus, le conseil d''administration peut autoriser
|
| 144 |
-
le président du conseil d''administration, dans des conditions et limites qu''il
|
| 145 |
-
fixe, à modifier la répartition des dépenses adoptées en application du 1°. Le
|
| 146 |
-
président du conseil d''administration rend compte au conseil d''administration
|
| 147 |
-
de ces modifications à l''occasion du plus prochain conseil d''administration
|
| 148 |
-
et au plus tard lors de la présentation de l''arrêté des comptes annuels.'
|
| 149 |
-
- 'Texte de loi : Chaque mandat, judiciaire ou amiable, reçu par l''administrateur
|
| 150 |
-
judiciaire ou le mandataire judiciaire est inscrit par ordre chronologique d''arrivée
|
| 151 |
-
à l''étude sur un répertoire mentionnant notamment le numéro d''ordre, le nom
|
| 152 |
-
de la juridiction mandante ou la qualité du mandant, la date de la décision de
|
| 153 |
-
désignation, le nom de l''affaire, la nature de la mission, l''identification
|
| 154 |
-
des établissements financiers auprès desquels les fonds sont déposés, la date
|
| 155 |
-
et les modalités de l''achèvement de la mission.'
|
| 156 |
-
- 'Texte de loi : I.-Pour assurer ses missions, le service autonomie à domicile
|
| 157 |
-
recourt, dans des conditions précisées par l''annexe 3-0 : 1° Pour les interventions
|
| 158 |
-
d''aide et d''accompagnement à domicile, à des aides à domicile, notamment des
|
| 159 |
-
accompagnants éducatifs et sociaux ; 2° Le cas échéant, pour les interventions
|
| 160 |
-
de soins à domicile : a) A des infirmiers, des aides-soignants, des accompagnants
|
| 161 |
-
éducatifs et sociaux ; b) En tant que de besoin, à des pédicures-podologues, des
|
| 162 |
-
ergothérapeutes, des psychologues, des masseurs-kinésithérapeutes, des diététiciens,
|
| 163 |
-
des orthophonistes, des psychomotriciens et des intervenants en activité physique
|
| 164 |
-
adaptée mentionnés à l''article D. 1172-2 du code de la santé publique. Lorsqu''il
|
| 165 |
-
relève du 1° de l''article L. 313-1-3, le service autonomie à domicile comprend
|
| 166 |
-
en outre un infirmier coordonnateur pour assurer, dans des conditions précisées
|
| 167 |
-
par l''annexe 3-0, la coordination des interventions réalisées par les personnels
|
| 168 |
-
mentionnés au 2°. II.-Pour la réalisation des interventions de soins à domicile,
|
| 169 |
-
les infirmiers exerçant à titre libéral, les professionnels libéraux mentionnés
|
| 170 |
-
au b du 2° du I et les centres de santé infirmiers prévus à l''article L. 6323-1
|
| 171 |
-
du code de la santé publique peuvent exercer au sein d''un service autonomie à
|
| 172 |
-
domicile à la condition d''avoir conclu une convention avec l''organisme gestionnaire
|
| 173 |
-
de ce service, dont le contenu minimal est prévu dans le cahier des charges mentionné
|
| 174 |
-
à l''article D. 312-1 du présent code. III.-L''intervention conjointe d''un établissement
|
| 175 |
-
d''hospitalisation à domicile et d''un service autonomie à domicile est organisée
|
| 176 |
-
dans les conditions prévues au II de l''article D. 6124-205 du code de la santé
|
| 177 |
-
publique. Dans ce cas, les éventuelles interventions des personnels mentionnés
|
| 178 |
-
au b du 2° du I du présent article sont organisées et coordonnées par l''établissement
|
| 179 |
-
d''hospitalisation à domicile.'
|
| 180 |
pipeline_tag: sentence-similarity
|
| 181 |
-
library_name: sentence-transformers
|
| 182 |
-
metrics:
|
| 183 |
-
- cosine_accuracy@1
|
| 184 |
-
- cosine_accuracy@3
|
| 185 |
-
- cosine_accuracy@5
|
| 186 |
-
- cosine_accuracy@10
|
| 187 |
-
- cosine_precision@1
|
| 188 |
-
- cosine_precision@3
|
| 189 |
-
- cosine_precision@5
|
| 190 |
-
- cosine_precision@10
|
| 191 |
-
- cosine_recall@1
|
| 192 |
-
- cosine_recall@3
|
| 193 |
-
- cosine_recall@5
|
| 194 |
-
- cosine_recall@10
|
| 195 |
-
- cosine_ndcg@10
|
| 196 |
-
- cosine_mrr@10
|
| 197 |
-
- cosine_map@100
|
| 198 |
-
model-index:
|
| 199 |
-
- name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
|
| 200 |
-
results:
|
| 201 |
-
- task:
|
| 202 |
-
type: information-retrieval
|
| 203 |
-
name: Information Retrieval
|
| 204 |
-
dataset:
|
| 205 |
-
name: legalkit val
|
| 206 |
-
type: legalkit-val
|
| 207 |
-
metrics:
|
| 208 |
-
- type: cosine_accuracy@1
|
| 209 |
-
value: 0.589
|
| 210 |
-
name: Cosine Accuracy@1
|
| 211 |
-
- type: cosine_accuracy@3
|
| 212 |
-
value: 0.7135
|
| 213 |
-
name: Cosine Accuracy@3
|
| 214 |
-
- type: cosine_accuracy@5
|
| 215 |
-
value: 0.7665
|
| 216 |
-
name: Cosine Accuracy@5
|
| 217 |
-
- type: cosine_accuracy@10
|
| 218 |
-
value: 0.846
|
| 219 |
-
name: Cosine Accuracy@10
|
| 220 |
-
- type: cosine_precision@1
|
| 221 |
-
value: 0.589
|
| 222 |
-
name: Cosine Precision@1
|
| 223 |
-
- type: cosine_precision@3
|
| 224 |
-
value: 0.2378333333333333
|
| 225 |
-
name: Cosine Precision@3
|
| 226 |
-
- type: cosine_precision@5
|
| 227 |
-
value: 0.15330000000000002
|
| 228 |
-
name: Cosine Precision@5
|
| 229 |
-
- type: cosine_precision@10
|
| 230 |
-
value: 0.08460000000000001
|
| 231 |
-
name: Cosine Precision@10
|
| 232 |
-
- type: cosine_recall@1
|
| 233 |
-
value: 0.589
|
| 234 |
-
name: Cosine Recall@1
|
| 235 |
-
- type: cosine_recall@3
|
| 236 |
-
value: 0.7135
|
| 237 |
-
name: Cosine Recall@3
|
| 238 |
-
- type: cosine_recall@5
|
| 239 |
-
value: 0.7665
|
| 240 |
-
name: Cosine Recall@5
|
| 241 |
-
- type: cosine_recall@10
|
| 242 |
-
value: 0.846
|
| 243 |
-
name: Cosine Recall@10
|
| 244 |
-
- type: cosine_ndcg@10
|
| 245 |
-
value: 0.7095183502138319
|
| 246 |
-
name: Cosine Ndcg@10
|
| 247 |
-
- type: cosine_mrr@10
|
| 248 |
-
value: 0.6668192460317462
|
| 249 |
-
name: Cosine Mrr@10
|
| 250 |
-
- type: cosine_map@100
|
| 251 |
-
value: 0.673834647362433
|
| 252 |
-
name: Cosine Map@100
|
| 253 |
---
|
| 254 |
|
| 255 |
-
#
|
| 256 |
|
| 257 |
-
|
|
|
|
|
|
|
|
|
|
| 258 |
|
| 259 |
-
##
|
| 260 |
|
| 261 |
-
### Model Description
|
| 262 |
-
- **Model Type:** Sentence Transformer
|
| 263 |
-
- **Base model:** [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2) <!-- at revision 4328cf26390c98c5e3c738b4460a05b95f4911f5 -->
|
| 264 |
-
- **Maximum Sequence Length:** 512 tokens
|
| 265 |
-
- **Output Dimensionality:** 768 dimensions
|
| 266 |
-
- **Similarity Function:** Cosine Similarity
|
| 267 |
-
- **Supported Modality:** Text
|
| 268 |
-
- **Training Dataset:**
|
| 269 |
-
- legalkit
|
| 270 |
-
<!-- - **Language:** Unknown -->
|
| 271 |
-
<!-- - **License:** Unknown -->
|
| 272 |
-
|
| 273 |
-
### Model Sources
|
| 274 |
-
|
| 275 |
-
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 276 |
-
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
|
| 277 |
-
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
| 278 |
-
|
| 279 |
-
### Full Model Architecture
|
| 280 |
-
|
| 281 |
-
```
|
| 282 |
-
SentenceTransformer(
|
| 283 |
-
(0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'XLMRobertaModel'})
|
| 284 |
-
(1): Pooling({'embedding_dimension': 768, 'pooling_mode': 'mean', 'include_prompt': True})
|
| 285 |
-
)
|
| 286 |
-
```
|
| 287 |
-
|
| 288 |
-
## Usage
|
| 289 |
-
|
| 290 |
-
### Direct Usage (Sentence Transformers)
|
| 291 |
-
|
| 292 |
-
First install the Sentence Transformers library:
|
| 293 |
-
|
| 294 |
-
```bash
|
| 295 |
-
pip install -U sentence-transformers
|
| 296 |
-
```
|
| 297 |
-
Then you can load this model and run inference.
|
| 298 |
```python
|
| 299 |
from sentence_transformers import SentenceTransformer
|
| 300 |
|
| 301 |
-
# Download from the 🤗 Hub
|
| 302 |
model = SentenceTransformer("IvanDVonga/LegalEmbed")
|
| 303 |
-
# Run inference
|
| 304 |
-
sentences = [
|
| 305 |
-
"Question juridique : Code de l'action sociale et des familles, art. D312-5",
|
| 306 |
-
"Texte de loi : I.-Pour assurer ses missions, le service autonomie à domicile recourt, dans des conditions précisées par l'annexe 3-0 : 1° Pour les interventions d'aide et d'accompagnement à domicile, à des aides à domicile, notamment des accompagnants éducatifs et sociaux ; 2° Le cas échéant, pour les interventions de soins à domicile : a) A des infirmiers, des aides-soignants, des accompagnants éducatifs et sociaux ; b) En tant que de besoin, à des pédicures-podologues, des ergothérapeutes, des psychologues, des masseurs-kinésithérapeutes, des diététiciens, des orthophonistes, des psychomotriciens et des intervenants en activité physique adaptée mentionnés à l'article D. 1172-2 du code de la santé publique. Lorsqu'il relève du 1° de l'article L. 313-1-3, le service autonomie à domicile comprend en outre un infirmier coordonnateur pour assurer, dans des conditions précisées par l'annexe 3-0, la coordination des interventions réalisées par les personnels mentionnés au 2°. II.-Pour la réalisation des interventions de soins à domicile, les infirmiers exerçant à titre libéral, les professionnels libéraux mentionnés au b du 2° du I et les centres de santé infirmiers prévus à l'article L. 6323-1 du code de la santé publique peuvent exercer au sein d'un service autonomie à domicile à la condition d'avoir conclu une convention avec l'organisme gestionnaire de ce service, dont le contenu minimal est prévu dans le cahier des charges mentionné à l'article D. 312-1 du présent code. III.-L'intervention conjointe d'un établissement d'hospitalisation à domicile et d'un service autonomie à domicile est organisée dans les conditions prévues au II de l'article D. 6124-205 du code de la santé publique. Dans ce cas, les éventuelles interventions des personnels mentionnés au b du 2° du I du présent article sont organisées et coordonnées par l'établissement d'hospitalisation à domicile.",
|
| 307 |
-
"Texte de loi : Chaque mandat, judiciaire ou amiable, reçu par l'administrateur judiciaire ou le mandataire judiciaire est inscrit par ordre chronologique d'arrivée à l'étude sur un répertoire mentionnant notamment le numéro d'ordre, le nom de la juridiction mandante ou la qualité du mandant, la date de la décision de désignation, le nom de l'affaire, la nature de la mission, l'identification des établissements financiers auprès desquels les fonds sont déposés, la date et les modalités de l'achèvement de la mission.",
|
| 308 |
-
]
|
| 309 |
-
embeddings = model.encode(sentences)
|
| 310 |
-
print(embeddings.shape)
|
| 311 |
-
# [3, 768]
|
| 312 |
-
|
| 313 |
-
# Get the similarity scores for the embeddings
|
| 314 |
-
similarities = model.similarity(embeddings, embeddings)
|
| 315 |
-
print(similarities)
|
| 316 |
-
# tensor([[ 1.0000, 0.6224, 0.1610],
|
| 317 |
-
# [ 0.6224, 1.0000, -0.0178],
|
| 318 |
-
# [ 0.1610, -0.0178, 1.0000]])
|
| 319 |
-
```
|
| 320 |
-
<!--
|
| 321 |
-
### Direct Usage (Transformers)
|
| 322 |
-
|
| 323 |
-
<details><summary>Click to see the direct usage in Transformers</summary>
|
| 324 |
-
|
| 325 |
-
</details>
|
| 326 |
-
-->
|
| 327 |
-
|
| 328 |
-
<!--
|
| 329 |
-
### Downstream Usage (Sentence Transformers)
|
| 330 |
-
|
| 331 |
-
You can finetune this model on your own dataset.
|
| 332 |
-
|
| 333 |
-
<details><summary>Click to expand</summary>
|
| 334 |
-
|
| 335 |
-
</details>
|
| 336 |
-
-->
|
| 337 |
-
|
| 338 |
-
<!--
|
| 339 |
-
### Out-of-Scope Use
|
| 340 |
-
|
| 341 |
-
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
| 342 |
-
-->
|
| 343 |
-
|
| 344 |
-
## Evaluation
|
| 345 |
-
|
| 346 |
-
### Metrics
|
| 347 |
-
|
| 348 |
-
#### Information Retrieval
|
| 349 |
-
|
| 350 |
-
* Dataset: `legalkit-val`
|
| 351 |
-
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.sentence_transformer.evaluation.InformationRetrievalEvaluator)
|
| 352 |
-
|
| 353 |
-
| Metric | Value |
|
| 354 |
-
|:--------------------|:-----------|
|
| 355 |
-
| cosine_accuracy@1 | 0.589 |
|
| 356 |
-
| cosine_accuracy@3 | 0.7135 |
|
| 357 |
-
| cosine_accuracy@5 | 0.7665 |
|
| 358 |
-
| cosine_accuracy@10 | 0.846 |
|
| 359 |
-
| cosine_precision@1 | 0.589 |
|
| 360 |
-
| cosine_precision@3 | 0.2378 |
|
| 361 |
-
| cosine_precision@5 | 0.1533 |
|
| 362 |
-
| cosine_precision@10 | 0.0846 |
|
| 363 |
-
| cosine_recall@1 | 0.589 |
|
| 364 |
-
| cosine_recall@3 | 0.7135 |
|
| 365 |
-
| cosine_recall@5 | 0.7665 |
|
| 366 |
-
| cosine_recall@10 | 0.846 |
|
| 367 |
-
| **cosine_ndcg@10** | **0.7095** |
|
| 368 |
-
| cosine_mrr@10 | 0.6668 |
|
| 369 |
-
| cosine_map@100 | 0.6738 |
|
| 370 |
|
| 371 |
-
|
| 372 |
-
|
| 373 |
|
| 374 |
-
|
| 375 |
-
|
| 376 |
-
|
| 377 |
-
<!--
|
| 378 |
-
### Recommendations
|
| 379 |
-
|
| 380 |
-
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
| 381 |
-
-->
|
| 382 |
-
|
| 383 |
-
## Training Details
|
| 384 |
-
|
| 385 |
-
### Training Dataset
|
| 386 |
-
|
| 387 |
-
#### legalkit
|
| 388 |
-
|
| 389 |
-
* Dataset: legalkit
|
| 390 |
-
* Size: 100,684 training samples
|
| 391 |
-
* Columns: <code>anchor</code> and <code>positive</code>
|
| 392 |
-
* Approximate statistics based on the first 1000 samples:
|
| 393 |
-
| | anchor | positive |
|
| 394 |
-
|:--------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
| 395 |
-
| type | string | string |
|
| 396 |
-
| details | <ul><li>min: 11 tokens</li><li>mean: 37.95 tokens</li><li>max: 194 tokens</li></ul> | <ul><li>min: 18 tokens</li><li>mean: 152.0 tokens</li><li>max: 512 tokens</li></ul> |
|
| 397 |
-
* Samples:
|
| 398 |
-
| anchor | positive |
|
| 399 |
-
|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 400 |
-
| <code>Question juridique : Quels sont les documents qui sont mentionnés au code de la consommation, notamment le document d'expertise et les pièces justifiant les exigences de l'expert, conformément à l'article L. 313-22, pour justifier l'expertise dans le cadre d'une vente à crédit ?</code> | <code>Texte de loi : Les pièces mentionnées à l' article L. 313-22 du code de la consommation sont : 1° Le document d'expertise et les pièces mentionnées à l'article L. 313-21 ; 2° Les documents justifiant que l'expert satisfait aux exigences prévues à l'article L. 313-20 .</code> |
|
| 401 |
-
| <code>Question juridique : Code de commerce, art. L228-97</code> | <code>Texte de loi : Lors de l'émission de valeurs mobilières représentatives d'un droit de créance sur la société émettrice, y compris celles donnant le droit de souscrire ou d'acquérir une valeur mobilière, il peut être stipulé que ces valeurs mobilières ne seront remboursées qu'après désintéressement des autres créanciers, à l'exclusion ou y compris des titulaires de prêts participatifs et de titres participatifs, nonobstant les dispositions de l'article L. 228-36 du présent code et celles des articles L. 313-13 et suivants du code monétaire et financier. Dans ces catégories de valeurs mobilières, il peut être également stipulé un ordre de priorité des paiements.</code> |
|
| 402 |
-
| <code>Question juridique : Quelles sont les conditions dans lesquelles l'organisme chargé du service assure l'instruction et le service d'une allocation pour le compte du département, ainsi que le financement de la part de l'allocation à sa charge en l'absence de convention ?</code> | <code>Texte de loi : En l'absence de convention : 1° L'organisme chargé du service assure l'instruction et le service de l'allocation pour le compte du département dans les conditions fixées par le présent code et procède au contrôle des bénéficiaires en application des mesures arrêtées dans le cadre du plan national de maîtrise des risques ; 2° Le département assure le financement de la part de l'allocation à sa charge dans les conditions prévues au 1° et au 2° de l'article D. 262-61 . Pour l'application du 2° de l'article D. 262-61, le taux d'intérêt retenu pour le calcul des éventuelles charges financières est le taux moyen pondéré du marché monétaire au jour le jour en euro plus un point. Le remboursement de ces charges est effectué dans le mois qui suit la fin de chaque trimestre civil.</code> |
|
| 403 |
-
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 404 |
-
```json
|
| 405 |
-
{
|
| 406 |
-
"scale": 20.0,
|
| 407 |
-
"similarity_fct": "cos_sim",
|
| 408 |
-
"gather_across_devices": false,
|
| 409 |
-
"directions": [
|
| 410 |
-
"query_to_doc"
|
| 411 |
-
],
|
| 412 |
-
"partition_mode": "joint",
|
| 413 |
-
"hardness_mode": null,
|
| 414 |
-
"hardness_strength": 0.0
|
| 415 |
-
}
|
| 416 |
-
```
|
| 417 |
-
|
| 418 |
-
### Evaluation Dataset
|
| 419 |
-
|
| 420 |
-
#### legalkit
|
| 421 |
-
|
| 422 |
-
* Dataset: legalkit
|
| 423 |
-
* Size: 5,300 evaluation samples
|
| 424 |
-
* Columns: <code>anchor</code> and <code>positive</code>
|
| 425 |
-
* Approximate statistics based on the first 1000 samples:
|
| 426 |
-
| | anchor | positive |
|
| 427 |
-
|:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 428 |
-
| type | string | string |
|
| 429 |
-
| details | <ul><li>min: 11 tokens</li><li>mean: 38.53 tokens</li><li>max: 170 tokens</li></ul> | <ul><li>min: 15 tokens</li><li>mean: 149.89 tokens</li><li>max: 512 tokens</li></ul> |
|
| 430 |
-
* Samples:
|
| 431 |
-
| anchor | positive |
|
| 432 |
-
|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 433 |
-
| <code>Question juridique : Quels sont les modes de délibération et les règles de prise de décision au sein de l'Autorité de la concurrence, notamment en ce qui concerne la composition de la commission permanente, les critères de quorum applicables aux différentes formations de l'autorité, ainsi que la prépondérance de la voix du président en cas de partage égal des voix ?</code> | <code>Texte de loi : L'Autorité de la concurrence peut siéger soit en formation plénière, soit en sections, soit en commission permanente. La commission permanente est composée du président et des quatre vice-présidents. Les formations de l'autorité délibèrent à la majorité des membres présents. Le règlement intérieur de l'autorité détermine les critères de quorum applicables à chacune de ces formations. En cas de partage égal des voix, la voix du président de la formation est prépondérante. Le président, ou un vice-président désigné par lui, peut adopter seul les décisions prévues au III de l'article L. 462-5, à l'article L. 462-8, ainsi que celles prévues aux articles L. 464-2 à L. 464-6 quand elles visent des faits dont l'Autorité de la concurrence a été saisie par le ministre en application de l'avant-dernier alinéa de l'article L. 464-9 . Il peut faire de même s'agissant des décisions prévues à l'article L. 430-5, des décisions de révision des mesures mentionnées aux III et IV de l'arti...</code> |
|
| 434 |
-
| <code>Question juridique : Code de la commande publique, art. R2391-27</code> | <code>Texte de loi : En cas de résiliation d'un marché qui n'a pas prévu de retenue de garantie, lorsqu'un délai est accordé au titulaire dans les conditions prévues à l'article R. 2391-20-2 pour reverser à l'acheteur 80 % du montant de l'éventuel solde créditeur apparu au profit de celui-ci, l'acheteur peut exiger du titulaire que celui-ci fournisse, à sa convenance, soit une garantie à première demande soit une caution personnelle et solidaire.</code> |
|
| 435 |
-
| <code>Question juridique : Code du travail, art. L4621-4</code> | <code>Texte de loi : Le chef de l'entreprise adhérente à un service de prévention et de santé au travail interentreprises peut bénéficier de l'offre de services proposée aux salariés.</code> |
|
| 436 |
-
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 437 |
-
```json
|
| 438 |
-
{
|
| 439 |
-
"scale": 20.0,
|
| 440 |
-
"similarity_fct": "cos_sim",
|
| 441 |
-
"gather_across_devices": false,
|
| 442 |
-
"directions": [
|
| 443 |
-
"query_to_doc"
|
| 444 |
-
],
|
| 445 |
-
"partition_mode": "joint",
|
| 446 |
-
"hardness_mode": null,
|
| 447 |
-
"hardness_strength": 0.0
|
| 448 |
-
}
|
| 449 |
-
```
|
| 450 |
-
|
| 451 |
-
### Training Hyperparameters
|
| 452 |
-
#### Non-Default Hyperparameters
|
| 453 |
-
|
| 454 |
-
- `per_device_train_batch_size`: 16
|
| 455 |
-
- `learning_rate`: 2e-05
|
| 456 |
-
- `warmup_steps`: 944
|
| 457 |
-
- `weight_decay`: 0.01
|
| 458 |
-
- `gradient_accumulation_steps`: 2
|
| 459 |
-
- `fp16`: True
|
| 460 |
-
- `per_device_eval_batch_size`: 16
|
| 461 |
-
- `load_best_model_at_end`: True
|
| 462 |
-
- `dataloader_pin_memory`: False
|
| 463 |
-
- `ddp_find_unused_parameters`: True
|
| 464 |
-
|
| 465 |
-
#### All Hyperparameters
|
| 466 |
-
<details><summary>Click to expand</summary>
|
| 467 |
-
|
| 468 |
-
- `per_device_train_batch_size`: 16
|
| 469 |
-
- `num_train_epochs`: 3
|
| 470 |
-
- `max_steps`: -1
|
| 471 |
-
- `learning_rate`: 2e-05
|
| 472 |
-
- `lr_scheduler_type`: linear
|
| 473 |
-
- `lr_scheduler_kwargs`: None
|
| 474 |
-
- `warmup_steps`: 944
|
| 475 |
-
- `optim`: adamw_torch_fused
|
| 476 |
-
- `optim_args`: None
|
| 477 |
-
- `weight_decay`: 0.01
|
| 478 |
-
- `adam_beta1`: 0.9
|
| 479 |
-
- `adam_beta2`: 0.999
|
| 480 |
-
- `adam_epsilon`: 1e-08
|
| 481 |
-
- `optim_target_modules`: None
|
| 482 |
-
- `gradient_accumulation_steps`: 2
|
| 483 |
-
- `average_tokens_across_devices`: True
|
| 484 |
-
- `max_grad_norm`: 1.0
|
| 485 |
-
- `label_smoothing_factor`: 0.0
|
| 486 |
-
- `bf16`: False
|
| 487 |
-
- `fp16`: True
|
| 488 |
-
- `bf16_full_eval`: False
|
| 489 |
-
- `fp16_full_eval`: False
|
| 490 |
-
- `tf32`: None
|
| 491 |
-
- `gradient_checkpointing`: False
|
| 492 |
-
- `gradient_checkpointing_kwargs`: None
|
| 493 |
-
- `torch_compile`: False
|
| 494 |
-
- `torch_compile_backend`: None
|
| 495 |
-
- `torch_compile_mode`: None
|
| 496 |
-
- `use_liger_kernel`: False
|
| 497 |
-
- `liger_kernel_config`: None
|
| 498 |
-
- `use_cache`: False
|
| 499 |
-
- `neftune_noise_alpha`: None
|
| 500 |
-
- `torch_empty_cache_steps`: None
|
| 501 |
-
- `auto_find_batch_size`: False
|
| 502 |
-
- `log_on_each_node`: True
|
| 503 |
-
- `logging_nan_inf_filter`: True
|
| 504 |
-
- `include_num_input_tokens_seen`: no
|
| 505 |
-
- `log_level`: passive
|
| 506 |
-
- `log_level_replica`: warning
|
| 507 |
-
- `disable_tqdm`: False
|
| 508 |
-
- `project`: huggingface
|
| 509 |
-
- `trackio_space_id`: None
|
| 510 |
-
- `trackio_bucket_id`: None
|
| 511 |
-
- `trackio_static_space_id`: None
|
| 512 |
-
- `per_device_eval_batch_size`: 16
|
| 513 |
-
- `prediction_loss_only`: True
|
| 514 |
-
- `eval_on_start`: False
|
| 515 |
-
- `eval_do_concat_batches`: True
|
| 516 |
-
- `eval_use_gather_object`: False
|
| 517 |
-
- `eval_accumulation_steps`: None
|
| 518 |
-
- `include_for_metrics`: []
|
| 519 |
-
- `batch_eval_metrics`: False
|
| 520 |
-
- `save_only_model`: False
|
| 521 |
-
- `save_on_each_node`: False
|
| 522 |
-
- `enable_jit_checkpoint`: False
|
| 523 |
-
- `push_to_hub`: False
|
| 524 |
-
- `hub_private_repo`: None
|
| 525 |
-
- `hub_model_id`: None
|
| 526 |
-
- `hub_strategy`: every_save
|
| 527 |
-
- `hub_always_push`: False
|
| 528 |
-
- `hub_revision`: None
|
| 529 |
-
- `load_best_model_at_end`: True
|
| 530 |
-
- `ignore_data_skip`: False
|
| 531 |
-
- `restore_callback_states_from_checkpoint`: False
|
| 532 |
-
- `full_determinism`: False
|
| 533 |
-
- `seed`: 42
|
| 534 |
-
- `data_seed`: None
|
| 535 |
-
- `use_cpu`: False
|
| 536 |
-
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 537 |
-
- `parallelism_config`: None
|
| 538 |
-
- `dataloader_drop_last`: True
|
| 539 |
-
- `dataloader_num_workers`: 0
|
| 540 |
-
- `dataloader_pin_memory`: False
|
| 541 |
-
- `dataloader_persistent_workers`: False
|
| 542 |
-
- `dataloader_prefetch_factor`: None
|
| 543 |
-
- `remove_unused_columns`: True
|
| 544 |
-
- `label_names`: None
|
| 545 |
-
- `train_sampling_strategy`: random
|
| 546 |
-
- `length_column_name`: length
|
| 547 |
-
- `ddp_find_unused_parameters`: True
|
| 548 |
-
- `ddp_bucket_cap_mb`: None
|
| 549 |
-
- `ddp_broadcast_buffers`: False
|
| 550 |
-
- `ddp_static_graph`: None
|
| 551 |
-
- `ddp_backend`: None
|
| 552 |
-
- `ddp_timeout`: 1800
|
| 553 |
-
- `fsdp`: []
|
| 554 |
-
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
| 555 |
-
- `deepspeed`: None
|
| 556 |
-
- `debug`: []
|
| 557 |
-
- `skip_memory_metrics`: True
|
| 558 |
-
- `do_predict`: False
|
| 559 |
-
- `resume_from_checkpoint`: None
|
| 560 |
-
- `warmup_ratio`: None
|
| 561 |
-
- `local_rank`: -1
|
| 562 |
-
- `prompts`: None
|
| 563 |
-
- `batch_sampler`: batch_sampler
|
| 564 |
-
- `multi_dataset_batch_sampler`: proportional
|
| 565 |
-
- `router_mapping`: {}
|
| 566 |
-
- `learning_rate_mapping`: {}
|
| 567 |
-
|
| 568 |
-
</details>
|
| 569 |
-
|
| 570 |
-
### Training Logs
|
| 571 |
-
| Epoch | Step | Training Loss | Validation Loss | legalkit-val_cosine_ndcg@10 |
|
| 572 |
-
|:-------:|:--------:|:-------------:|:---------------:|:---------------------------:|
|
| 573 |
-
| 0.0318 | 50 | 1.4414 | - | - |
|
| 574 |
-
| 0.0636 | 100 | 1.0998 | - | - |
|
| 575 |
-
| 0.0954 | 150 | 0.8503 | - | - |
|
| 576 |
-
| 0.1271 | 200 | 0.6942 | 0.6658 | 0.5420 |
|
| 577 |
-
| 0.1589 | 250 | 0.6832 | - | - |
|
| 578 |
-
| 0.1907 | 300 | 0.5978 | - | - |
|
| 579 |
-
| 0.2225 | 350 | 0.5716 | - | - |
|
| 580 |
-
| 0.2543 | 400 | 0.5491 | 0.4817 | 0.5738 |
|
| 581 |
-
| 0.2861 | 450 | 0.4593 | - | - |
|
| 582 |
-
| 0.3179 | 500 | 0.4710 | - | - |
|
| 583 |
-
| 0.3497 | 550 | 0.4533 | - | - |
|
| 584 |
-
| 0.3814 | 600 | 0.4157 | 0.3947 | 0.5860 |
|
| 585 |
-
| 0.4132 | 650 | 0.3967 | - | - |
|
| 586 |
-
| 0.4450 | 700 | 0.4137 | - | - |
|
| 587 |
-
| 0.4768 | 750 | 0.3890 | - | - |
|
| 588 |
-
| 0.5086 | 800 | 0.3867 | 0.3468 | 0.5965 |
|
| 589 |
-
| 0.5404 | 850 | 0.3526 | - | - |
|
| 590 |
-
| 0.5722 | 900 | 0.3441 | - | - |
|
| 591 |
-
| 0.6039 | 950 | 0.3403 | - | - |
|
| 592 |
-
| 0.6357 | 1000 | 0.3270 | 0.3327 | 0.6095 |
|
| 593 |
-
| 0.6675 | 1050 | 0.3433 | - | - |
|
| 594 |
-
| 0.6993 | 1100 | 0.2814 | - | - |
|
| 595 |
-
| 0.7311 | 1150 | 0.2904 | - | - |
|
| 596 |
-
| 0.7629 | 1200 | 0.2931 | 0.2678 | 0.6272 |
|
| 597 |
-
| 0.7947 | 1250 | 0.2787 | - | - |
|
| 598 |
-
| 0.8264 | 1300 | 0.2770 | - | - |
|
| 599 |
-
| 0.8582 | 1350 | 0.2748 | - | - |
|
| 600 |
-
| 0.8900 | 1400 | 0.2724 | 0.2483 | 0.6380 |
|
| 601 |
-
| 0.9218 | 1450 | 0.2369 | - | - |
|
| 602 |
-
| 0.9536 | 1500 | 0.2451 | - | - |
|
| 603 |
-
| 0.9854 | 1550 | 0.2634 | - | - |
|
| 604 |
-
| 1.0172 | 1600 | 0.2017 | 0.2282 | 0.6398 |
|
| 605 |
-
| 1.0490 | 1650 | 0.2171 | - | - |
|
| 606 |
-
| 1.0807 | 1700 | 0.1878 | - | - |
|
| 607 |
-
| 1.1125 | 1750 | 0.2051 | - | - |
|
| 608 |
-
| 1.1443 | 1800 | 0.2021 | 0.2146 | 0.6431 |
|
| 609 |
-
| 1.1761 | 1850 | 0.1943 | - | - |
|
| 610 |
-
| 1.2079 | 1900 | 0.1771 | - | - |
|
| 611 |
-
| 1.2397 | 1950 | 0.1992 | - | - |
|
| 612 |
-
| 1.2715 | 2000 | 0.1873 | 0.2085 | 0.6524 |
|
| 613 |
-
| 1.3032 | 2050 | 0.1945 | - | - |
|
| 614 |
-
| 1.3350 | 2100 | 0.1756 | - | - |
|
| 615 |
-
| 1.3668 | 2150 | 0.1849 | - | - |
|
| 616 |
-
| 1.3986 | 2200 | 0.1686 | 0.1949 | 0.6629 |
|
| 617 |
-
| 1.4304 | 2250 | 0.1745 | - | - |
|
| 618 |
-
| 1.4622 | 2300 | 0.1540 | - | - |
|
| 619 |
-
| 1.4940 | 2350 | 0.1830 | - | - |
|
| 620 |
-
| 1.5257 | 2400 | 0.1833 | 0.1852 | 0.6684 |
|
| 621 |
-
| 1.5575 | 2450 | 0.1705 | - | - |
|
| 622 |
-
| 1.5893 | 2500 | 0.1617 | - | - |
|
| 623 |
-
| 1.6211 | 2550 | 0.1758 | - | - |
|
| 624 |
-
| 1.6529 | 2600 | 0.1573 | 0.1705 | 0.6730 |
|
| 625 |
-
| 1.6847 | 2650 | 0.1725 | - | - |
|
| 626 |
-
| 1.7165 | 2700 | 0.1616 | - | - |
|
| 627 |
-
| 1.7483 | 2750 | 0.1854 | - | - |
|
| 628 |
-
| 1.7800 | 2800 | 0.1533 | 0.1580 | 0.6749 |
|
| 629 |
-
| 1.8118 | 2850 | 0.1541 | - | - |
|
| 630 |
-
| 1.8436 | 2900 | 0.1584 | - | - |
|
| 631 |
-
| 1.8754 | 2950 | 0.1512 | - | - |
|
| 632 |
-
| 1.9072 | 3000 | 0.1557 | 0.1469 | 0.6860 |
|
| 633 |
-
| 1.9390 | 3050 | 0.1654 | - | - |
|
| 634 |
-
| 1.9708 | 3100 | 0.1597 | - | - |
|
| 635 |
-
| 2.0025 | 3150 | 0.1513 | - | - |
|
| 636 |
-
| 2.0343 | 3200 | 0.1134 | 0.1518 | 0.6878 |
|
| 637 |
-
| 2.0661 | 3250 | 0.1213 | - | - |
|
| 638 |
-
| 2.0979 | 3300 | 0.1154 | - | - |
|
| 639 |
-
| 2.1297 | 3350 | 0.1238 | - | - |
|
| 640 |
-
| 2.1615 | 3400 | 0.1175 | 0.1436 | 0.6916 |
|
| 641 |
-
| 2.1933 | 3450 | 0.1240 | - | - |
|
| 642 |
-
| 2.2250 | 3500 | 0.1142 | - | - |
|
| 643 |
-
| 2.2568 | 3550 | 0.1266 | - | - |
|
| 644 |
-
| 2.2886 | 3600 | 0.1215 | 0.1389 | 0.6965 |
|
| 645 |
-
| 2.3204 | 3650 | 0.1076 | - | - |
|
| 646 |
-
| 2.3522 | 3700 | 0.1081 | - | - |
|
| 647 |
-
| 2.3840 | 3750 | 0.1049 | - | - |
|
| 648 |
-
| 2.4158 | 3800 | 0.1149 | 0.1340 | 0.6957 |
|
| 649 |
-
| 2.4476 | 3850 | 0.1067 | - | - |
|
| 650 |
-
| 2.4793 | 3900 | 0.1060 | - | - |
|
| 651 |
-
| 2.5111 | 3950 | 0.1043 | - | - |
|
| 652 |
-
| 2.5429 | 4000 | 0.1101 | 0.1282 | 0.7047 |
|
| 653 |
-
| 2.5747 | 4050 | 0.1071 | - | - |
|
| 654 |
-
| 2.6065 | 4100 | 0.1015 | - | - |
|
| 655 |
-
| 2.6383 | 4150 | 0.1298 | - | - |
|
| 656 |
-
| 2.6701 | 4200 | 0.1023 | 0.1267 | 0.7068 |
|
| 657 |
-
| 2.7018 | 4250 | 0.1009 | - | - |
|
| 658 |
-
| 2.7336 | 4300 | 0.1021 | - | - |
|
| 659 |
-
| 2.7654 | 4350 | 0.0851 | - | - |
|
| 660 |
-
| 2.7972 | 4400 | 0.1005 | 0.1245 | 0.7076 |
|
| 661 |
-
| 2.8290 | 4450 | 0.1090 | - | - |
|
| 662 |
-
| 2.8608 | 4500 | 0.1141 | - | - |
|
| 663 |
-
| 2.8926 | 4550 | 0.1169 | - | - |
|
| 664 |
-
| 2.9243 | 4600 | 0.1012 | 0.1229 | 0.7080 |
|
| 665 |
-
| 2.9561 | 4650 | 0.1047 | - | - |
|
| 666 |
-
| 2.9879 | 4700 | 0.0937 | - | - |
|
| 667 |
-
| **3.0** | **4719** | **-** | **0.1229** | **0.7095** |
|
| 668 |
-
|
| 669 |
-
* The bold row denotes the saved checkpoint.
|
| 670 |
-
|
| 671 |
-
### Training Time
|
| 672 |
-
- **Training**: 1.6 hours
|
| 673 |
-
- **Evaluation**: 12.1 minutes
|
| 674 |
-
- **Total**: 1.8 hours
|
| 675 |
-
|
| 676 |
-
### Framework Versions
|
| 677 |
-
- Python: 3.12.12
|
| 678 |
-
- Sentence Transformers: 5.4.1
|
| 679 |
-
- Transformers: 5.8.0
|
| 680 |
-
- PyTorch: 2.10.0+cu128
|
| 681 |
-
- Accelerate: 1.13.0
|
| 682 |
-
- Datasets: 4.8.5
|
| 683 |
-
- Tokenizers: 0.22.2
|
| 684 |
-
|
| 685 |
-
## Citation
|
| 686 |
-
|
| 687 |
-
### BibTeX
|
| 688 |
-
|
| 689 |
-
#### Sentence Transformers
|
| 690 |
-
```bibtex
|
| 691 |
-
@inproceedings{reimers-2019-sentence-bert,
|
| 692 |
-
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
| 693 |
-
author = "Reimers, Nils and Gurevych, Iryna",
|
| 694 |
-
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
| 695 |
-
month = "11",
|
| 696 |
-
year = "2019",
|
| 697 |
-
publisher = "Association for Computational Linguistics",
|
| 698 |
-
url = "https://arxiv.org/abs/1908.10084",
|
| 699 |
-
}
|
| 700 |
-
```
|
| 701 |
-
|
| 702 |
-
#### MultipleNegativesRankingLoss
|
| 703 |
-
```bibtex
|
| 704 |
-
@misc{oord2019representationlearningcontrastivepredictive,
|
| 705 |
-
title={Representation Learning with Contrastive Predictive Coding},
|
| 706 |
-
author={Aaron van den Oord and Yazhe Li and Oriol Vinyals},
|
| 707 |
-
year={2019},
|
| 708 |
-
eprint={1807.03748},
|
| 709 |
-
archivePrefix={arXiv},
|
| 710 |
-
primaryClass={cs.LG},
|
| 711 |
-
url={https://arxiv.org/abs/1807.03748},
|
| 712 |
-
}
|
| 713 |
```
|
| 714 |
|
| 715 |
-
|
| 716 |
-
## Glossary
|
| 717 |
-
|
| 718 |
-
*Clearly define terms in order to be accessible across audiences.*
|
| 719 |
-
-->
|
| 720 |
-
|
| 721 |
-
<!--
|
| 722 |
-
## Model Card Authors
|
| 723 |
|
| 724 |
-
|
| 725 |
-
--
|
|
|
|
|
|
|
| 726 |
|
| 727 |
-
|
| 728 |
-
## Model Card Contact
|
| 729 |
|
| 730 |
-
*
|
| 731 |
-
-
|
|
|
|
|
|
| 1 |
---
|
| 2 |
+
language:
|
| 3 |
+
- fr
|
| 4 |
+
license: cc-by-4.0
|
| 5 |
tags:
|
| 6 |
+
- sentence-transformers
|
| 7 |
+
- legal
|
| 8 |
+
- french
|
| 9 |
+
- embeddings
|
| 10 |
+
- retrieval
|
|
|
|
| 11 |
base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
|
| 12 |
+
datasets:
|
| 13 |
+
- louisbrulenaudet/legalkit
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 14 |
pipeline_tag: sentence-similarity
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 15 |
---
|
| 16 |
|
| 17 |
+
# LegalEmbed ⚖️
|
| 18 |
|
| 19 |
+
Modèle d'embeddings fine-tuné sur le droit français, à partir de
|
| 20 |
+
[`paraphrase-multilingual-mpnet-base-v2`](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2)
|
| 21 |
+
et du dataset [`louisbrulenaudet/legalkit`](https://huggingface.co/datasets/louisbrulenaudet/legalkit)
|
| 22 |
+
(~53k articles de codes juridiques français).
|
| 23 |
|
| 24 |
+
## Utilisation
|
| 25 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 26 |
```python
|
| 27 |
from sentence_transformers import SentenceTransformer
|
| 28 |
|
|
|
|
| 29 |
model = SentenceTransformer("IvanDVonga/LegalEmbed")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 30 |
|
| 31 |
+
query = "Question juridique : Quelles sont les conditions de validité d'un contrat ?"
|
| 32 |
+
doc = "Texte de loi : Pour qu'un contrat soit valable, il faut le consentement des parties."
|
| 33 |
|
| 34 |
+
embeddings = model.encode([query, doc], normalize_embeddings=True)
|
| 35 |
+
similarity = embeddings[0] @ embeddings[1]
|
| 36 |
+
print(f"Similarité : {similarity:.4f}")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 37 |
```
|
| 38 |
|
| 39 |
+
## Préfixes recommandés
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 40 |
|
| 41 |
+
| Type de texte | Préfixe |
|
| 42 |
+
|---|---|
|
| 43 |
+
| Question / requête | `"Question juridique : "` |
|
| 44 |
+
| Article de loi / document | `"Texte de loi : "` |
|
| 45 |
|
| 46 |
+
## Entraînement
|
|
|
|
| 47 |
|
| 48 |
+
- **Loss** : `MultipleNegativesRankingLoss` (in-batch negatives)
|
| 49 |
+
- **Paires** : (query, article) et (référence, article)
|
| 50 |
+
- **Epochs** : 3 — **LR** : 2e-5 — **Batch** : 32
|