IvanDVonga commited on
Commit
7dee53c
·
verified ·
1 Parent(s): e3c5a12

Add model card

Browse files
Files changed (1) hide show
  1. README.md +30 -711
README.md CHANGED
@@ -1,731 +1,50 @@
1
  ---
 
 
 
2
  tags:
3
- - sentence-transformers
4
- - sentence-similarity
5
- - feature-extraction
6
- - generated_from_trainer
7
- - dataset_size:100684
8
- - loss:MultipleNegativesRankingLoss
9
  base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
10
- widget:
11
- - source_sentence: 'Question juridique : Quel est le délai de prescription applicable
12
- aux actions des administrateurs judiciaires, commissaires à l''exécution du plan,
13
- mandataires judiciaires et liquidateurs concernant leur rémunération, à compter
14
- de la notification prévue ?'
15
- sentences:
16
- - 'Texte de loi : Les organismes qui demandent à figurer sur la liste arrêtée par
17
- le préfet de région établissent leur aptitude à assurer, conformément aux dispositions
18
- du sous-paragraphe 1, la formation des membres de la délégation du personnel du
19
- comité social et économique. Ils justifient notamment des capacités de leurs formateurs
20
- et de l''expérience acquise par ces derniers en matière de prévention des risques
21
- professionnels et de conditions de travail. Le préfet de région se prononce après
22
- avis du comité régional de l''emploi, de la formation de l''orientation professionnelles.
23
- Le silence gardé pendant plus de quatre mois sur une demande d''agrément vaut
24
- décision de rejet.'
25
- - 'Texte de loi : Si, après immatriculation d''une société coopérative européenne,
26
- au moins un tiers des salariés de la société coopérative européenne et de ses
27
- filiales et établissements, employés dans au moins deux Etats membres, le demandent
28
- ou si le seuil de cinquante salariés employés dans au moins deux Etats membres
29
- est atteint ou dépassé, un groupe spécial de négociation est institué et une négociation
30
- est organisée conformément aux dispositions du chapitre II du présent titre.'
31
- - 'Texte de loi : Les actions des administrateurs judiciaires, commissaires à l''exécution
32
- du plan, mandataires judiciaires et liquidateurs, en matière de rémunération,
33
- se prescrivent par six mois à compter de la notification prévue à l''article R.
34
- 663-38 .'
35
- - source_sentence: 'Question juridique : Quels sont les critères qui interdisent les
36
- projets de séries de bénéficier d''une aide, en fonction de l''existence de contrats
37
- ou de soumissions à des entreprises de production ou à des éditeurs de services
38
- de télévision ou de médias audiovisuels ?'
39
- sentences:
40
- - 'Texte de loi : Ne peuvent siéger dans un conseil de discipline que les militaires
41
- en position d''activité et non bénéficiaires de l''un des congés prévus à l''article
42
- L. 4138-2 .'
43
- - 'Texte de loi : Les projets de séries ne doivent pas faire l''objet d''un contrat
44
- d''option ou d''un contrat de production audiovisuelle conclu avec une entreprise
45
- de production au moment du dépôt de la demande d''aide ou au cours de son instruction.
46
- Les projets ne doivent pas avoir été soumis à un éditeur de services de télévision
47
- ou de services de médias audiovisuels à la demande et acceptés par ce dernier
48
- antérieurement au dépôt de la demande. En outre, les projets ne doivent pas être
49
- soumis à un tel éditeur jusqu''à la décision du président du Centre national du
50
- cinéma et de l''image animée.'
51
- - 'Texte de loi : I.-Le renvoi devant le tribunal de commerce spécialisé en application
52
- du troisième alinéa de l''article L. 662-8 est prononcé d''office par le président
53
- du tribunal saisi, par ordonnance motivée, après avoir entendu ou dûment appelé
54
- le débiteur et recueilli l''avis du ministère public. Le greffier du tribunal
55
- de commerce saisi transmet aussitôt le dossier au président du tribunal de commerce
56
- spécialisé désigné, avec une copie de l''ordonnance de renvoi. II.-Le renvoi devant
57
- le tribunal de commerce spécialisé compétent peut également être demandé par requête
58
- motivée du débiteur, de l''administrateur judiciaire, du mandataire judiciaire
59
- ou du ministère public près le tribunal de commerce saisi. Le greffier du tribunal
60
- de commerce saisi notifie la requête aux parties sans délai. Le président du tribunal
61
- statue sur la demande de renvoi par ordonnance motivée après avoir entendu ou
62
- dûment appelé le débiteur, le mandataire de justice et recueilli l''avis du ministère
63
- public. S''il est fait droit à la demande de renvoi, le greffier du tribunal de
64
- commerce saisi transmet aussitôt le dossier au président du tribunal de commerce
65
- spécialisé désigné, avec une copie de l''ordonnance de renvoi. III.-Les décisions
66
- prises en application du présent article sont des mesures d''administration judiciaire
67
- non susceptibles de recours. Elles s''imposent aux parties et à la juridiction
68
- de renvoi désignée.'
69
- - source_sentence: 'Question juridique : Quels sont les modes de convocation et les
70
- conditions de réunion du conseil d''administration du Centre national du cinéma
71
- et de l''image animée, notamment en ce qui concerne la fréquence des réunions
72
- et les décisions de l''ordre du jour ?'
73
- sentences:
74
- - 'Texte de loi : Les documents comptables sont établis en euros et en langue française.
75
- Les documents comptables et les pièces justificatives sont conservés pendant dix
76
- ans. Les documents comptables relatifs à l''enregistrement des opérations et à
77
- l''inventaire sont établis et tenus sans blanc ni altération d''aucune sorte,
78
- dans des conditions fixées par décret en Conseil d''Etat.'
79
- - 'Texte de loi : Le collège de résolution ainsi que le fonds de garantie des dépôts
80
- et de résolution peuvent procéder au recouvrement des sommes correspondant au
81
- montant de toute dépense justifiée exposée pour la mise en œuvre d''une ou plusieurs
82
- mesures de résolution. Ces dépenses doivent avoir été raisonnables et exposées
83
- à bon escient. Le recouvrement intervient selon une ou plusieurs des modalités
84
- suivantes : 1° En déduisant le montant des sommes à recouvrer de toute contrepartie
85
- payée par un acquéreur à la personne soumise à une procédure de résolution ou,
86
- le cas échéant, aux détenteurs de titres de capital mentionnés au chapitre II
87
- du titre Ier du livre II ou d''autres titres de propriété ; 2° En constatant à
88
- hauteur des sommes en cause une créance bénéficiant du privilège prévu à l'' article
89
- L. 611-11 du code de commerce à l''égard soit de la personne soumise à une procédure
90
- de résolution soit, le cas échéant, de l''établissement-relais ou de la structure
91
- de gestion des actifs.'
92
- - 'Texte de loi : Le conseil d''administration se réunit au moins deux fois par
93
- an, sur convocation du président du Centre national du cinéma et de l''image animée
94
- qui fixe l''ordre du jour. Il est également réuni par le président à la demande
95
- du ministre chargé de la culture ou à celle de la moitié au moins de ses membres
96
- qui, dans ce cas, proposent l''ordre du jour de la séance. En cas d''absence ou
97
- d''empêchement du président du Centre national du cinéma et de l''image animée,
98
- le conseil d''administration est présidé et, si nécessaire, convoqué par le secrétaire
99
- général du ministère chargé de la culture.'
100
- - source_sentence: 'Question juridique : Code de l''action sociale et des familles,
101
- art. L113-3'
102
- sentences:
103
- - 'Texte de loi : I. - Une conférence nationale de l''autonomie est organisée au
104
- moins tous les trois ans afin de définir les orientations et de débattre des moyens
105
- de la politique de prévention de la perte d''autonomie. Cette conférence s''appuie
106
- sur les travaux de la Caisse nationale de solidarité pour l''autonomie et l''expertise
107
- du centre national de ressources probantes mentionné à l''article L. 223-7-1 du
108
- code de la sécurité sociale . II. - La conférence nationale de l''autonomie est
109
- notamment composée de représentants : 1° De l''Etat ; 2° Des conseils départementaux
110
- ; 3° D''organismes de sécurité sociale ; 4° D''organismes gestionnaires des établissements
111
- ou services sociaux et médico-sociaux accueillant des personnes âgées ; 5° D''associations
112
- représentatives des personnes âgées ; 6° Des professionnels concernés par la prévention
113
- et l''accompagnement de la perte d''autonomie. III. - Un décret détermine les
114
- modalités d''application des I et II du présent article.'
115
- - 'Texte de loi : Ne peuvent être nommées liquidateurs les personnes auxquelles
116
- l''exercice des fonctions de directeur général, d''administrateur, de gérant de
117
- société, de membre du directoire ou du conseil de surveillance est interdit ou
118
- qui sont déchues du droit d''exercer ces fonctions.'
119
- - 'Texte de loi : L''infraction prévue à l''article 432-1 est punie de dix ans d''emprisonnement
120
- et de 150 000 euros d''amende si elle a été suivie d''effet.'
121
- - source_sentence: 'Question juridique : Code de l''action sociale et des familles,
122
- art. D312-5'
123
- sentences:
124
- - 'Texte de loi : Le conseil d''administration règle par ses délibérations les affaires
125
- de l''établissement. A ce titre, notamment, il : 1° Adopte le budget annuel et
126
- ses modifications ; Il fixe dans ce cadre le montant annuel des financements qu''il
127
- apporte aux opérations et actions prévues à l''article L. 435-1 , dans les conditions
128
- et selon les modalités qu''il détermine. Il programme annuellement la répartition
129
- territoriale du montant des nouvelles opérations et actions à engager par l''Etat,
130
- et les objectifs associés, selon une nomenclature qu''il aura fixée par délibération.
131
- Un arrêté des ministres chargés du logement, de l''économie et du budget précise
132
- les règles de gestion financière du Fonds national des aides à la pierre en vue
133
- d''en garantir la soutenabilité. A ce titre, il encadre la détermination du montant
134
- annuel de ces nouvelles opérations et actions ainsi que du montant annuel des
135
- versements effectués par le fonds à l''Etat en tenant compte des prévisions de
136
- recettes du fonds et de l''exécution des engagements déjà pris par l''Etat ; 2°
137
- Arrête les comptes annuels, l''affectation des résultats et l''emploi des disponibilités
138
- et des réserves ; 3° Adopte son règlement intérieur ; 4° Peut créer un comité
139
- consultatif dédié à l''accomplissement des missions prévues au 2° du II de l''article
140
- L. 435-1, pouvant comporter des personnalités qualifiées extérieures ; 5° Approuve
141
- le rapport annuel d''activité de l''établissement ; 6° Autorise les actions en
142
- justice ainsi que les transactions et approuve les conventions et marchés. Lorsqu''il
143
- délibère en application du 1° ci-dessus, le conseil d''administration peut autoriser
144
- le président du conseil d''administration, dans des conditions et limites qu''il
145
- fixe, à modifier la répartition des dépenses adoptées en application du 1°. Le
146
- président du conseil d''administration rend compte au conseil d''administration
147
- de ces modifications à l''occasion du plus prochain conseil d''administration
148
- et au plus tard lors de la présentation de l''arrêté des comptes annuels.'
149
- - 'Texte de loi : Chaque mandat, judiciaire ou amiable, reçu par l''administrateur
150
- judiciaire ou le mandataire judiciaire est inscrit par ordre chronologique d''arrivée
151
- à l''étude sur un répertoire mentionnant notamment le numéro d''ordre, le nom
152
- de la juridiction mandante ou la qualité du mandant, la date de la décision de
153
- désignation, le nom de l''affaire, la nature de la mission, l''identification
154
- des établissements financiers auprès desquels les fonds sont déposés, la date
155
- et les modalités de l''achèvement de la mission.'
156
- - 'Texte de loi : I.-Pour assurer ses missions, le service autonomie à domicile
157
- recourt, dans des conditions précisées par l''annexe 3-0 : 1° Pour les interventions
158
- d''aide et d''accompagnement à domicile, à des aides à domicile, notamment des
159
- accompagnants éducatifs et sociaux ; 2° Le cas échéant, pour les interventions
160
- de soins à domicile : a) A des infirmiers, des aides-soignants, des accompagnants
161
- éducatifs et sociaux ; b) En tant que de besoin, à des pédicures-podologues, des
162
- ergothérapeutes, des psychologues, des masseurs-kinésithérapeutes, des diététiciens,
163
- des orthophonistes, des psychomotriciens et des intervenants en activité physique
164
- adaptée mentionnés à l''article D. 1172-2 du code de la santé publique. Lorsqu''il
165
- relève du 1° de l''article L. 313-1-3, le service autonomie à domicile comprend
166
- en outre un infirmier coordonnateur pour assurer, dans des conditions précisées
167
- par l''annexe 3-0, la coordination des interventions réalisées par les personnels
168
- mentionnés au 2°. II.-Pour la réalisation des interventions de soins à domicile,
169
- les infirmiers exerçant à titre libéral, les professionnels libéraux mentionnés
170
- au b du 2° du I et les centres de santé infirmiers prévus à l''article L. 6323-1
171
- du code de la santé publique peuvent exercer au sein d''un service autonomie à
172
- domicile à la condition d''avoir conclu une convention avec l''organisme gestionnaire
173
- de ce service, dont le contenu minimal est prévu dans le cahier des charges mentionné
174
- à l''article D. 312-1 du présent code. III.-L''intervention conjointe d''un établissement
175
- d''hospitalisation à domicile et d''un service autonomie à domicile est organisée
176
- dans les conditions prévues au II de l''article D. 6124-205 du code de la santé
177
- publique. Dans ce cas, les éventuelles interventions des personnels mentionnés
178
- au b du 2° du I du présent article sont organisées et coordonnées par l''établissement
179
- d''hospitalisation à domicile.'
180
  pipeline_tag: sentence-similarity
181
- library_name: sentence-transformers
182
- metrics:
183
- - cosine_accuracy@1
184
- - cosine_accuracy@3
185
- - cosine_accuracy@5
186
- - cosine_accuracy@10
187
- - cosine_precision@1
188
- - cosine_precision@3
189
- - cosine_precision@5
190
- - cosine_precision@10
191
- - cosine_recall@1
192
- - cosine_recall@3
193
- - cosine_recall@5
194
- - cosine_recall@10
195
- - cosine_ndcg@10
196
- - cosine_mrr@10
197
- - cosine_map@100
198
- model-index:
199
- - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
200
- results:
201
- - task:
202
- type: information-retrieval
203
- name: Information Retrieval
204
- dataset:
205
- name: legalkit val
206
- type: legalkit-val
207
- metrics:
208
- - type: cosine_accuracy@1
209
- value: 0.589
210
- name: Cosine Accuracy@1
211
- - type: cosine_accuracy@3
212
- value: 0.7135
213
- name: Cosine Accuracy@3
214
- - type: cosine_accuracy@5
215
- value: 0.7665
216
- name: Cosine Accuracy@5
217
- - type: cosine_accuracy@10
218
- value: 0.846
219
- name: Cosine Accuracy@10
220
- - type: cosine_precision@1
221
- value: 0.589
222
- name: Cosine Precision@1
223
- - type: cosine_precision@3
224
- value: 0.2378333333333333
225
- name: Cosine Precision@3
226
- - type: cosine_precision@5
227
- value: 0.15330000000000002
228
- name: Cosine Precision@5
229
- - type: cosine_precision@10
230
- value: 0.08460000000000001
231
- name: Cosine Precision@10
232
- - type: cosine_recall@1
233
- value: 0.589
234
- name: Cosine Recall@1
235
- - type: cosine_recall@3
236
- value: 0.7135
237
- name: Cosine Recall@3
238
- - type: cosine_recall@5
239
- value: 0.7665
240
- name: Cosine Recall@5
241
- - type: cosine_recall@10
242
- value: 0.846
243
- name: Cosine Recall@10
244
- - type: cosine_ndcg@10
245
- value: 0.7095183502138319
246
- name: Cosine Ndcg@10
247
- - type: cosine_mrr@10
248
- value: 0.6668192460317462
249
- name: Cosine Mrr@10
250
- - type: cosine_map@100
251
- value: 0.673834647362433
252
- name: Cosine Map@100
253
  ---
254
 
255
- # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-mpnet-base-v2
256
 
257
- This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2) on the legalkit dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for retrieval.
 
 
 
258
 
259
- ## Model Details
260
 
261
- ### Model Description
262
- - **Model Type:** Sentence Transformer
263
- - **Base model:** [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2) <!-- at revision 4328cf26390c98c5e3c738b4460a05b95f4911f5 -->
264
- - **Maximum Sequence Length:** 512 tokens
265
- - **Output Dimensionality:** 768 dimensions
266
- - **Similarity Function:** Cosine Similarity
267
- - **Supported Modality:** Text
268
- - **Training Dataset:**
269
- - legalkit
270
- <!-- - **Language:** Unknown -->
271
- <!-- - **License:** Unknown -->
272
-
273
- ### Model Sources
274
-
275
- - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
276
- - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
277
- - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
278
-
279
- ### Full Model Architecture
280
-
281
- ```
282
- SentenceTransformer(
283
- (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'XLMRobertaModel'})
284
- (1): Pooling({'embedding_dimension': 768, 'pooling_mode': 'mean', 'include_prompt': True})
285
- )
286
- ```
287
-
288
- ## Usage
289
-
290
- ### Direct Usage (Sentence Transformers)
291
-
292
- First install the Sentence Transformers library:
293
-
294
- ```bash
295
- pip install -U sentence-transformers
296
- ```
297
- Then you can load this model and run inference.
298
  ```python
299
  from sentence_transformers import SentenceTransformer
300
 
301
- # Download from the 🤗 Hub
302
  model = SentenceTransformer("IvanDVonga/LegalEmbed")
303
- # Run inference
304
- sentences = [
305
- "Question juridique : Code de l'action sociale et des familles, art. D312-5",
306
- "Texte de loi : I.-Pour assurer ses missions, le service autonomie à domicile recourt, dans des conditions précisées par l'annexe 3-0 : 1° Pour les interventions d'aide et d'accompagnement à domicile, à des aides à domicile, notamment des accompagnants éducatifs et sociaux ; 2° Le cas échéant, pour les interventions de soins à domicile : a) A des infirmiers, des aides-soignants, des accompagnants éducatifs et sociaux ; b) En tant que de besoin, à des pédicures-podologues, des ergothérapeutes, des psychologues, des masseurs-kinésithérapeutes, des diététiciens, des orthophonistes, des psychomotriciens et des intervenants en activité physique adaptée mentionnés à l'article D. 1172-2 du code de la santé publique. Lorsqu'il relève du 1° de l'article L. 313-1-3, le service autonomie à domicile comprend en outre un infirmier coordonnateur pour assurer, dans des conditions précisées par l'annexe 3-0, la coordination des interventions réalisées par les personnels mentionnés au 2°. II.-Pour la réalisation des interventions de soins à domicile, les infirmiers exerçant à titre libéral, les professionnels libéraux mentionnés au b du 2° du I et les centres de santé infirmiers prévus à l'article L. 6323-1 du code de la santé publique peuvent exercer au sein d'un service autonomie à domicile à la condition d'avoir conclu une convention avec l'organisme gestionnaire de ce service, dont le contenu minimal est prévu dans le cahier des charges mentionné à l'article D. 312-1 du présent code. III.-L'intervention conjointe d'un établissement d'hospitalisation à domicile et d'un service autonomie à domicile est organisée dans les conditions prévues au II de l'article D. 6124-205 du code de la santé publique. Dans ce cas, les éventuelles interventions des personnels mentionnés au b du 2° du I du présent article sont organisées et coordonnées par l'établissement d'hospitalisation à domicile.",
307
- "Texte de loi : Chaque mandat, judiciaire ou amiable, reçu par l'administrateur judiciaire ou le mandataire judiciaire est inscrit par ordre chronologique d'arrivée à l'étude sur un répertoire mentionnant notamment le numéro d'ordre, le nom de la juridiction mandante ou la qualité du mandant, la date de la décision de désignation, le nom de l'affaire, la nature de la mission, l'identification des établissements financiers auprès desquels les fonds sont déposés, la date et les modalités de l'achèvement de la mission.",
308
- ]
309
- embeddings = model.encode(sentences)
310
- print(embeddings.shape)
311
- # [3, 768]
312
-
313
- # Get the similarity scores for the embeddings
314
- similarities = model.similarity(embeddings, embeddings)
315
- print(similarities)
316
- # tensor([[ 1.0000, 0.6224, 0.1610],
317
- # [ 0.6224, 1.0000, -0.0178],
318
- # [ 0.1610, -0.0178, 1.0000]])
319
- ```
320
- <!--
321
- ### Direct Usage (Transformers)
322
-
323
- <details><summary>Click to see the direct usage in Transformers</summary>
324
-
325
- </details>
326
- -->
327
-
328
- <!--
329
- ### Downstream Usage (Sentence Transformers)
330
-
331
- You can finetune this model on your own dataset.
332
-
333
- <details><summary>Click to expand</summary>
334
-
335
- </details>
336
- -->
337
-
338
- <!--
339
- ### Out-of-Scope Use
340
-
341
- *List how the model may foreseeably be misused and address what users ought not to do with the model.*
342
- -->
343
-
344
- ## Evaluation
345
-
346
- ### Metrics
347
-
348
- #### Information Retrieval
349
-
350
- * Dataset: `legalkit-val`
351
- * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.sentence_transformer.evaluation.InformationRetrievalEvaluator)
352
-
353
- | Metric | Value |
354
- |:--------------------|:-----------|
355
- | cosine_accuracy@1 | 0.589 |
356
- | cosine_accuracy@3 | 0.7135 |
357
- | cosine_accuracy@5 | 0.7665 |
358
- | cosine_accuracy@10 | 0.846 |
359
- | cosine_precision@1 | 0.589 |
360
- | cosine_precision@3 | 0.2378 |
361
- | cosine_precision@5 | 0.1533 |
362
- | cosine_precision@10 | 0.0846 |
363
- | cosine_recall@1 | 0.589 |
364
- | cosine_recall@3 | 0.7135 |
365
- | cosine_recall@5 | 0.7665 |
366
- | cosine_recall@10 | 0.846 |
367
- | **cosine_ndcg@10** | **0.7095** |
368
- | cosine_mrr@10 | 0.6668 |
369
- | cosine_map@100 | 0.6738 |
370
 
371
- <!--
372
- ## Bias, Risks and Limitations
373
 
374
- *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
375
- -->
376
-
377
- <!--
378
- ### Recommendations
379
-
380
- *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
381
- -->
382
-
383
- ## Training Details
384
-
385
- ### Training Dataset
386
-
387
- #### legalkit
388
-
389
- * Dataset: legalkit
390
- * Size: 100,684 training samples
391
- * Columns: <code>anchor</code> and <code>positive</code>
392
- * Approximate statistics based on the first 1000 samples:
393
- | | anchor | positive |
394
- |:--------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
395
- | type | string | string |
396
- | details | <ul><li>min: 11 tokens</li><li>mean: 37.95 tokens</li><li>max: 194 tokens</li></ul> | <ul><li>min: 18 tokens</li><li>mean: 152.0 tokens</li><li>max: 512 tokens</li></ul> |
397
- * Samples:
398
- | anchor | positive |
399
- |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
400
- | <code>Question juridique : Quels sont les documents qui sont mentionnés au code de la consommation, notamment le document d'expertise et les pièces justifiant les exigences de l'expert, conformément à l'article L. 313-22, pour justifier l'expertise dans le cadre d'une vente à crédit ?</code> | <code>Texte de loi : Les pièces mentionnées à l' article L. 313-22 du code de la consommation sont : 1° Le document d'expertise et les pièces mentionnées à l'article L. 313-21 ; 2° Les documents justifiant que l'expert satisfait aux exigences prévues à l'article L. 313-20 .</code> |
401
- | <code>Question juridique : Code de commerce, art. L228-97</code> | <code>Texte de loi : Lors de l'émission de valeurs mobilières représentatives d'un droit de créance sur la société émettrice, y compris celles donnant le droit de souscrire ou d'acquérir une valeur mobilière, il peut être stipulé que ces valeurs mobilières ne seront remboursées qu'après désintéressement des autres créanciers, à l'exclusion ou y compris des titulaires de prêts participatifs et de titres participatifs, nonobstant les dispositions de l'article L. 228-36 du présent code et celles des articles L. 313-13 et suivants du code monétaire et financier. Dans ces catégories de valeurs mobilières, il peut être également stipulé un ordre de priorité des paiements.</code> |
402
- | <code>Question juridique : Quelles sont les conditions dans lesquelles l'organisme chargé du service assure l'instruction et le service d'une allocation pour le compte du département, ainsi que le financement de la part de l'allocation à sa charge en l'absence de convention ?</code> | <code>Texte de loi : En l'absence de convention : 1° L'organisme chargé du service assure l'instruction et le service de l'allocation pour le compte du département dans les conditions fixées par le présent code et procède au contrôle des bénéficiaires en application des mesures arrêtées dans le cadre du plan national de maîtrise des risques ; 2° Le département assure le financement de la part de l'allocation à sa charge dans les conditions prévues au 1° et au 2° de l'article D. 262-61 . Pour l'application du 2° de l'article D. 262-61, le taux d'intérêt retenu pour le calcul des éventuelles charges financières est le taux moyen pondéré du marché monétaire au jour le jour en euro plus un point. Le remboursement de ces charges est effectué dans le mois qui suit la fin de chaque trimestre civil.</code> |
403
- * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
404
- ```json
405
- {
406
- "scale": 20.0,
407
- "similarity_fct": "cos_sim",
408
- "gather_across_devices": false,
409
- "directions": [
410
- "query_to_doc"
411
- ],
412
- "partition_mode": "joint",
413
- "hardness_mode": null,
414
- "hardness_strength": 0.0
415
- }
416
- ```
417
-
418
- ### Evaluation Dataset
419
-
420
- #### legalkit
421
-
422
- * Dataset: legalkit
423
- * Size: 5,300 evaluation samples
424
- * Columns: <code>anchor</code> and <code>positive</code>
425
- * Approximate statistics based on the first 1000 samples:
426
- | | anchor | positive |
427
- |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
428
- | type | string | string |
429
- | details | <ul><li>min: 11 tokens</li><li>mean: 38.53 tokens</li><li>max: 170 tokens</li></ul> | <ul><li>min: 15 tokens</li><li>mean: 149.89 tokens</li><li>max: 512 tokens</li></ul> |
430
- * Samples:
431
- | anchor | positive |
432
- |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
433
- | <code>Question juridique : Quels sont les modes de délibération et les règles de prise de décision au sein de l'Autorité de la concurrence, notamment en ce qui concerne la composition de la commission permanente, les critères de quorum applicables aux différentes formations de l'autorité, ainsi que la prépondérance de la voix du président en cas de partage égal des voix ?</code> | <code>Texte de loi : L'Autorité de la concurrence peut siéger soit en formation plénière, soit en sections, soit en commission permanente. La commission permanente est composée du président et des quatre vice-présidents. Les formations de l'autorité délibèrent à la majorité des membres présents. Le règlement intérieur de l'autorité détermine les critères de quorum applicables à chacune de ces formations. En cas de partage égal des voix, la voix du président de la formation est prépondérante. Le président, ou un vice-président désigné par lui, peut adopter seul les décisions prévues au III de l'article L. 462-5, à l'article L. 462-8, ainsi que celles prévues aux articles L. 464-2 à L. 464-6 quand elles visent des faits dont l'Autorité de la concurrence a été saisie par le ministre en application de l'avant-dernier alinéa de l'article L. 464-9 . Il peut faire de même s'agissant des décisions prévues à l'article L. 430-5, des décisions de révision des mesures mentionnées aux III et IV de l'arti...</code> |
434
- | <code>Question juridique : Code de la commande publique, art. R2391-27</code> | <code>Texte de loi : En cas de résiliation d'un marché qui n'a pas prévu de retenue de garantie, lorsqu'un délai est accordé au titulaire dans les conditions prévues à l'article R. 2391-20-2 pour reverser à l'acheteur 80 % du montant de l'éventuel solde créditeur apparu au profit de celui-ci, l'acheteur peut exiger du titulaire que celui-ci fournisse, à sa convenance, soit une garantie à première demande soit une caution personnelle et solidaire.</code> |
435
- | <code>Question juridique : Code du travail, art. L4621-4</code> | <code>Texte de loi : Le chef de l'entreprise adhérente à un service de prévention et de santé au travail interentreprises peut bénéficier de l'offre de services proposée aux salariés.</code> |
436
- * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
437
- ```json
438
- {
439
- "scale": 20.0,
440
- "similarity_fct": "cos_sim",
441
- "gather_across_devices": false,
442
- "directions": [
443
- "query_to_doc"
444
- ],
445
- "partition_mode": "joint",
446
- "hardness_mode": null,
447
- "hardness_strength": 0.0
448
- }
449
- ```
450
-
451
- ### Training Hyperparameters
452
- #### Non-Default Hyperparameters
453
-
454
- - `per_device_train_batch_size`: 16
455
- - `learning_rate`: 2e-05
456
- - `warmup_steps`: 944
457
- - `weight_decay`: 0.01
458
- - `gradient_accumulation_steps`: 2
459
- - `fp16`: True
460
- - `per_device_eval_batch_size`: 16
461
- - `load_best_model_at_end`: True
462
- - `dataloader_pin_memory`: False
463
- - `ddp_find_unused_parameters`: True
464
-
465
- #### All Hyperparameters
466
- <details><summary>Click to expand</summary>
467
-
468
- - `per_device_train_batch_size`: 16
469
- - `num_train_epochs`: 3
470
- - `max_steps`: -1
471
- - `learning_rate`: 2e-05
472
- - `lr_scheduler_type`: linear
473
- - `lr_scheduler_kwargs`: None
474
- - `warmup_steps`: 944
475
- - `optim`: adamw_torch_fused
476
- - `optim_args`: None
477
- - `weight_decay`: 0.01
478
- - `adam_beta1`: 0.9
479
- - `adam_beta2`: 0.999
480
- - `adam_epsilon`: 1e-08
481
- - `optim_target_modules`: None
482
- - `gradient_accumulation_steps`: 2
483
- - `average_tokens_across_devices`: True
484
- - `max_grad_norm`: 1.0
485
- - `label_smoothing_factor`: 0.0
486
- - `bf16`: False
487
- - `fp16`: True
488
- - `bf16_full_eval`: False
489
- - `fp16_full_eval`: False
490
- - `tf32`: None
491
- - `gradient_checkpointing`: False
492
- - `gradient_checkpointing_kwargs`: None
493
- - `torch_compile`: False
494
- - `torch_compile_backend`: None
495
- - `torch_compile_mode`: None
496
- - `use_liger_kernel`: False
497
- - `liger_kernel_config`: None
498
- - `use_cache`: False
499
- - `neftune_noise_alpha`: None
500
- - `torch_empty_cache_steps`: None
501
- - `auto_find_batch_size`: False
502
- - `log_on_each_node`: True
503
- - `logging_nan_inf_filter`: True
504
- - `include_num_input_tokens_seen`: no
505
- - `log_level`: passive
506
- - `log_level_replica`: warning
507
- - `disable_tqdm`: False
508
- - `project`: huggingface
509
- - `trackio_space_id`: None
510
- - `trackio_bucket_id`: None
511
- - `trackio_static_space_id`: None
512
- - `per_device_eval_batch_size`: 16
513
- - `prediction_loss_only`: True
514
- - `eval_on_start`: False
515
- - `eval_do_concat_batches`: True
516
- - `eval_use_gather_object`: False
517
- - `eval_accumulation_steps`: None
518
- - `include_for_metrics`: []
519
- - `batch_eval_metrics`: False
520
- - `save_only_model`: False
521
- - `save_on_each_node`: False
522
- - `enable_jit_checkpoint`: False
523
- - `push_to_hub`: False
524
- - `hub_private_repo`: None
525
- - `hub_model_id`: None
526
- - `hub_strategy`: every_save
527
- - `hub_always_push`: False
528
- - `hub_revision`: None
529
- - `load_best_model_at_end`: True
530
- - `ignore_data_skip`: False
531
- - `restore_callback_states_from_checkpoint`: False
532
- - `full_determinism`: False
533
- - `seed`: 42
534
- - `data_seed`: None
535
- - `use_cpu`: False
536
- - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
537
- - `parallelism_config`: None
538
- - `dataloader_drop_last`: True
539
- - `dataloader_num_workers`: 0
540
- - `dataloader_pin_memory`: False
541
- - `dataloader_persistent_workers`: False
542
- - `dataloader_prefetch_factor`: None
543
- - `remove_unused_columns`: True
544
- - `label_names`: None
545
- - `train_sampling_strategy`: random
546
- - `length_column_name`: length
547
- - `ddp_find_unused_parameters`: True
548
- - `ddp_bucket_cap_mb`: None
549
- - `ddp_broadcast_buffers`: False
550
- - `ddp_static_graph`: None
551
- - `ddp_backend`: None
552
- - `ddp_timeout`: 1800
553
- - `fsdp`: []
554
- - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
555
- - `deepspeed`: None
556
- - `debug`: []
557
- - `skip_memory_metrics`: True
558
- - `do_predict`: False
559
- - `resume_from_checkpoint`: None
560
- - `warmup_ratio`: None
561
- - `local_rank`: -1
562
- - `prompts`: None
563
- - `batch_sampler`: batch_sampler
564
- - `multi_dataset_batch_sampler`: proportional
565
- - `router_mapping`: {}
566
- - `learning_rate_mapping`: {}
567
-
568
- </details>
569
-
570
- ### Training Logs
571
- | Epoch | Step | Training Loss | Validation Loss | legalkit-val_cosine_ndcg@10 |
572
- |:-------:|:--------:|:-------------:|:---------------:|:---------------------------:|
573
- | 0.0318 | 50 | 1.4414 | - | - |
574
- | 0.0636 | 100 | 1.0998 | - | - |
575
- | 0.0954 | 150 | 0.8503 | - | - |
576
- | 0.1271 | 200 | 0.6942 | 0.6658 | 0.5420 |
577
- | 0.1589 | 250 | 0.6832 | - | - |
578
- | 0.1907 | 300 | 0.5978 | - | - |
579
- | 0.2225 | 350 | 0.5716 | - | - |
580
- | 0.2543 | 400 | 0.5491 | 0.4817 | 0.5738 |
581
- | 0.2861 | 450 | 0.4593 | - | - |
582
- | 0.3179 | 500 | 0.4710 | - | - |
583
- | 0.3497 | 550 | 0.4533 | - | - |
584
- | 0.3814 | 600 | 0.4157 | 0.3947 | 0.5860 |
585
- | 0.4132 | 650 | 0.3967 | - | - |
586
- | 0.4450 | 700 | 0.4137 | - | - |
587
- | 0.4768 | 750 | 0.3890 | - | - |
588
- | 0.5086 | 800 | 0.3867 | 0.3468 | 0.5965 |
589
- | 0.5404 | 850 | 0.3526 | - | - |
590
- | 0.5722 | 900 | 0.3441 | - | - |
591
- | 0.6039 | 950 | 0.3403 | - | - |
592
- | 0.6357 | 1000 | 0.3270 | 0.3327 | 0.6095 |
593
- | 0.6675 | 1050 | 0.3433 | - | - |
594
- | 0.6993 | 1100 | 0.2814 | - | - |
595
- | 0.7311 | 1150 | 0.2904 | - | - |
596
- | 0.7629 | 1200 | 0.2931 | 0.2678 | 0.6272 |
597
- | 0.7947 | 1250 | 0.2787 | - | - |
598
- | 0.8264 | 1300 | 0.2770 | - | - |
599
- | 0.8582 | 1350 | 0.2748 | - | - |
600
- | 0.8900 | 1400 | 0.2724 | 0.2483 | 0.6380 |
601
- | 0.9218 | 1450 | 0.2369 | - | - |
602
- | 0.9536 | 1500 | 0.2451 | - | - |
603
- | 0.9854 | 1550 | 0.2634 | - | - |
604
- | 1.0172 | 1600 | 0.2017 | 0.2282 | 0.6398 |
605
- | 1.0490 | 1650 | 0.2171 | - | - |
606
- | 1.0807 | 1700 | 0.1878 | - | - |
607
- | 1.1125 | 1750 | 0.2051 | - | - |
608
- | 1.1443 | 1800 | 0.2021 | 0.2146 | 0.6431 |
609
- | 1.1761 | 1850 | 0.1943 | - | - |
610
- | 1.2079 | 1900 | 0.1771 | - | - |
611
- | 1.2397 | 1950 | 0.1992 | - | - |
612
- | 1.2715 | 2000 | 0.1873 | 0.2085 | 0.6524 |
613
- | 1.3032 | 2050 | 0.1945 | - | - |
614
- | 1.3350 | 2100 | 0.1756 | - | - |
615
- | 1.3668 | 2150 | 0.1849 | - | - |
616
- | 1.3986 | 2200 | 0.1686 | 0.1949 | 0.6629 |
617
- | 1.4304 | 2250 | 0.1745 | - | - |
618
- | 1.4622 | 2300 | 0.1540 | - | - |
619
- | 1.4940 | 2350 | 0.1830 | - | - |
620
- | 1.5257 | 2400 | 0.1833 | 0.1852 | 0.6684 |
621
- | 1.5575 | 2450 | 0.1705 | - | - |
622
- | 1.5893 | 2500 | 0.1617 | - | - |
623
- | 1.6211 | 2550 | 0.1758 | - | - |
624
- | 1.6529 | 2600 | 0.1573 | 0.1705 | 0.6730 |
625
- | 1.6847 | 2650 | 0.1725 | - | - |
626
- | 1.7165 | 2700 | 0.1616 | - | - |
627
- | 1.7483 | 2750 | 0.1854 | - | - |
628
- | 1.7800 | 2800 | 0.1533 | 0.1580 | 0.6749 |
629
- | 1.8118 | 2850 | 0.1541 | - | - |
630
- | 1.8436 | 2900 | 0.1584 | - | - |
631
- | 1.8754 | 2950 | 0.1512 | - | - |
632
- | 1.9072 | 3000 | 0.1557 | 0.1469 | 0.6860 |
633
- | 1.9390 | 3050 | 0.1654 | - | - |
634
- | 1.9708 | 3100 | 0.1597 | - | - |
635
- | 2.0025 | 3150 | 0.1513 | - | - |
636
- | 2.0343 | 3200 | 0.1134 | 0.1518 | 0.6878 |
637
- | 2.0661 | 3250 | 0.1213 | - | - |
638
- | 2.0979 | 3300 | 0.1154 | - | - |
639
- | 2.1297 | 3350 | 0.1238 | - | - |
640
- | 2.1615 | 3400 | 0.1175 | 0.1436 | 0.6916 |
641
- | 2.1933 | 3450 | 0.1240 | - | - |
642
- | 2.2250 | 3500 | 0.1142 | - | - |
643
- | 2.2568 | 3550 | 0.1266 | - | - |
644
- | 2.2886 | 3600 | 0.1215 | 0.1389 | 0.6965 |
645
- | 2.3204 | 3650 | 0.1076 | - | - |
646
- | 2.3522 | 3700 | 0.1081 | - | - |
647
- | 2.3840 | 3750 | 0.1049 | - | - |
648
- | 2.4158 | 3800 | 0.1149 | 0.1340 | 0.6957 |
649
- | 2.4476 | 3850 | 0.1067 | - | - |
650
- | 2.4793 | 3900 | 0.1060 | - | - |
651
- | 2.5111 | 3950 | 0.1043 | - | - |
652
- | 2.5429 | 4000 | 0.1101 | 0.1282 | 0.7047 |
653
- | 2.5747 | 4050 | 0.1071 | - | - |
654
- | 2.6065 | 4100 | 0.1015 | - | - |
655
- | 2.6383 | 4150 | 0.1298 | - | - |
656
- | 2.6701 | 4200 | 0.1023 | 0.1267 | 0.7068 |
657
- | 2.7018 | 4250 | 0.1009 | - | - |
658
- | 2.7336 | 4300 | 0.1021 | - | - |
659
- | 2.7654 | 4350 | 0.0851 | - | - |
660
- | 2.7972 | 4400 | 0.1005 | 0.1245 | 0.7076 |
661
- | 2.8290 | 4450 | 0.1090 | - | - |
662
- | 2.8608 | 4500 | 0.1141 | - | - |
663
- | 2.8926 | 4550 | 0.1169 | - | - |
664
- | 2.9243 | 4600 | 0.1012 | 0.1229 | 0.7080 |
665
- | 2.9561 | 4650 | 0.1047 | - | - |
666
- | 2.9879 | 4700 | 0.0937 | - | - |
667
- | **3.0** | **4719** | **-** | **0.1229** | **0.7095** |
668
-
669
- * The bold row denotes the saved checkpoint.
670
-
671
- ### Training Time
672
- - **Training**: 1.6 hours
673
- - **Evaluation**: 12.1 minutes
674
- - **Total**: 1.8 hours
675
-
676
- ### Framework Versions
677
- - Python: 3.12.12
678
- - Sentence Transformers: 5.4.1
679
- - Transformers: 5.8.0
680
- - PyTorch: 2.10.0+cu128
681
- - Accelerate: 1.13.0
682
- - Datasets: 4.8.5
683
- - Tokenizers: 0.22.2
684
-
685
- ## Citation
686
-
687
- ### BibTeX
688
-
689
- #### Sentence Transformers
690
- ```bibtex
691
- @inproceedings{reimers-2019-sentence-bert,
692
- title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
693
- author = "Reimers, Nils and Gurevych, Iryna",
694
- booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
695
- month = "11",
696
- year = "2019",
697
- publisher = "Association for Computational Linguistics",
698
- url = "https://arxiv.org/abs/1908.10084",
699
- }
700
- ```
701
-
702
- #### MultipleNegativesRankingLoss
703
- ```bibtex
704
- @misc{oord2019representationlearningcontrastivepredictive,
705
- title={Representation Learning with Contrastive Predictive Coding},
706
- author={Aaron van den Oord and Yazhe Li and Oriol Vinyals},
707
- year={2019},
708
- eprint={1807.03748},
709
- archivePrefix={arXiv},
710
- primaryClass={cs.LG},
711
- url={https://arxiv.org/abs/1807.03748},
712
- }
713
  ```
714
 
715
- <!--
716
- ## Glossary
717
-
718
- *Clearly define terms in order to be accessible across audiences.*
719
- -->
720
-
721
- <!--
722
- ## Model Card Authors
723
 
724
- *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
725
- -->
 
 
726
 
727
- <!--
728
- ## Model Card Contact
729
 
730
- *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
731
- -->
 
 
1
  ---
2
+ language:
3
+ - fr
4
+ license: cc-by-4.0
5
  tags:
6
+ - sentence-transformers
7
+ - legal
8
+ - french
9
+ - embeddings
10
+ - retrieval
 
11
  base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
12
+ datasets:
13
+ - louisbrulenaudet/legalkit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
14
  pipeline_tag: sentence-similarity
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
15
  ---
16
 
17
+ # LegalEmbed ⚖️
18
 
19
+ Modèle d'embeddings fine-tuné sur le droit français, à partir de
20
+ [`paraphrase-multilingual-mpnet-base-v2`](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2)
21
+ et du dataset [`louisbrulenaudet/legalkit`](https://huggingface.co/datasets/louisbrulenaudet/legalkit)
22
+ (~53k articles de codes juridiques français).
23
 
24
+ ## Utilisation
25
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
26
  ```python
27
  from sentence_transformers import SentenceTransformer
28
 
 
29
  model = SentenceTransformer("IvanDVonga/LegalEmbed")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
30
 
31
+ query = "Question juridique : Quelles sont les conditions de validité d'un contrat ?"
32
+ doc = "Texte de loi : Pour qu'un contrat soit valable, il faut le consentement des parties."
33
 
34
+ embeddings = model.encode([query, doc], normalize_embeddings=True)
35
+ similarity = embeddings[0] @ embeddings[1]
36
+ print(f"Similarité : {similarity:.4f}")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
37
  ```
38
 
39
+ ## Préfixes recommandés
 
 
 
 
 
 
 
40
 
41
+ | Type de texte | Préfixe |
42
+ |---|---|
43
+ | Question / requête | `"Question juridique : "` |
44
+ | Article de loi / document | `"Texte de loi : "` |
45
 
46
+ ## Entraînement
 
47
 
48
+ - **Loss** : `MultipleNegativesRankingLoss` (in-batch negatives)
49
+ - **Paires** : (query, article) et (référence, article)
50
+ - **Epochs** : 3 — **LR** : 2e-5 — **Batch** : 32