fabskill commited on
Commit
9591180
·
verified ·
1 Parent(s): 41d21b0

End of training

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1423 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
3
+ datasets: []
4
+ language: []
5
+ library_name: sentence-transformers
6
+ metrics:
7
+ - cosine_accuracy
8
+ - cosine_accuracy_threshold
9
+ - cosine_f1
10
+ - cosine_f1_threshold
11
+ - cosine_precision
12
+ - cosine_recall
13
+ - cosine_ap
14
+ - dot_accuracy
15
+ - dot_accuracy_threshold
16
+ - dot_f1
17
+ - dot_f1_threshold
18
+ - dot_precision
19
+ - dot_recall
20
+ - dot_ap
21
+ - manhattan_accuracy
22
+ - manhattan_accuracy_threshold
23
+ - manhattan_f1
24
+ - manhattan_f1_threshold
25
+ - manhattan_precision
26
+ - manhattan_recall
27
+ - manhattan_ap
28
+ - euclidean_accuracy
29
+ - euclidean_accuracy_threshold
30
+ - euclidean_f1
31
+ - euclidean_f1_threshold
32
+ - euclidean_precision
33
+ - euclidean_recall
34
+ - euclidean_ap
35
+ - max_accuracy
36
+ - max_accuracy_threshold
37
+ - max_f1
38
+ - max_f1_threshold
39
+ - max_precision
40
+ - max_recall
41
+ - max_ap
42
+ pipeline_tag: sentence-similarity
43
+ tags:
44
+ - sentence-transformers
45
+ - sentence-similarity
46
+ - feature-extraction
47
+ - generated_from_trainer
48
+ - dataset_size:285122
49
+ - loss:SoftmaxLoss
50
+ - dataset_size:13912
51
+ - dataset_size:42735
52
+ widget:
53
+ - source_sentence: Chef de file figuration
54
+ sentences:
55
+ - des données massives gérer une base de données numériques créer une documentation
56
+ technique relation clientrecueillir et analyser les besoins client identifier
57
+ les besoins en logiciel apporter une assistance technique aux équipes assurer
58
+ un rôle de support avant-vente développement commercialprésenter et valoriser
59
+ un produit ou un service répondre à un appel d'offre stratégie de développementpiloter
60
+ une activité concevoir et gérer un projet managementanimer, coordonner une équipe
61
+ allouer et organiser les ressources d'un projet selon les besoins et contraintes
62
+ conseil, transmissionconseiller une organisation, une structure accompagner l'appropriation
63
+ d'un outil
64
+ - • accès à l'emploi ce métier est accessible avec un diplôme de niveau cap à bac
65
+ (bac professionnel, brevet de compagnon,...) en sellerie, en confection de chaussures,
66
+ en maroquinerie,... compétences savoir-faire production, fabricationréaliser la
67
+ préparation de pièces par parage sélectionner les matières premières à mobiliser
68
+ réaliser les opérations de coupe de matériaux (positionnement de gabarit,...)
69
+ manuellement ou à l'aide d'une machine assembler (collage, couture) les pièces
70
+ de l'article (tige, soufflet) manuellement ou à
71
+ - ec responsable marketing définition définit et met en oeuvre la stratégie marketing
72
+ (tarifs, promotion, communication, gammes de produits, supports techniques,...)
73
+ pour l'ensemble des produits de l'entreprise. • peut diriger un service ou coordonner
74
+ l'activité d'une équipe. • accès à l'emploi ce métier est accessible à partir
75
+ d'un master (m1, master professionnel, diplôme d'école de commerce,...) dans un
76
+ secteur technique ou commercial, complété par une expérience professionnelle en
77
+ tant que chef de produit ou chef de groupe. la pratique d'une langue étrangère
78
+ - source_sentence: Rayonneur / Rayonneuse de roue
79
+ sentences:
80
+ - si coach en développement personnel transition démographique définition met en
81
+ place des actions de développement personnel, selon la méthode utilisée, afin
82
+ de favoriser le bien-être de la personne. • peut mettre en place des actions de
83
+ conseil, coaching. • peut diriger une entreprise. • accès à l'emploi ce métier
84
+ est accessible sans diplôme particulier. des formations spécifiques peuvent en
85
+ faciliter l'exercice. l'enseignement de ces pratiques ne donne pas systématiquement
86
+ lieu à des diplômes nationaux. ces diplômes, à eux seuls, ne donnent pas droit
87
+ à l'exercice d'une profession de santé. pour
88
+ - d'un produit opérer des choix techniques, esthétiques, économiques pour un produit
89
+ créer, élaborer et identifier des concepts innovants dessiner des avant-projets
90
+ (roughs, croquis) à partir du concept, des thèmes définis maîtriser la pensée
91
+ additive en plus de la pensée soustractive conception élaborer des processus et
92
+ des modes opératoires techniques production, fabricationsélectionner des matériaux
93
+ ou matières pour un projet réaliser les travaux de montage, d'assemblage intégrer
94
+ le jumeau numérique aux processus industriels prévention des risques
95
+ - routière peut en faciliter l'accès. les permis d, d1, d1e, de (précédemment d
96
+ et ed) pour la conduite de véhicules transport en commun de plus de 9 places complétés
97
+ par la formation initiale minimum obligatoire -fimo- option « voyageurs » sont
98
+ exigés. un renouvellement périodique de la fimo par la formation continue obligatoire
99
+ -fco- est exigé. une carte chronotachygraphe est obligatoire pour la conduite
100
+ de véhicules de transport de voyageurs de plus de 9 places. des permis ou habilita
101
+ - source_sentence: Ingénieur / Ingénieure d'études BTP en génie climatique et énergétique
102
+ sentences:
103
+ - apporter une assistance technique aux équipes développement commercial établir
104
+ un devis management animer, coordonner une équipe conseil, transmission transmettre
105
+ une technique, un savoir-faire organisationrespecter les règles de qualité, hygiène,
106
+ sécurité, santé et environnement (qhsse) alerter, demander un appui ou un arbitrage
107
+ adapter et optimiser sa pratique au contexte et aux risques professionnels (gestes,
108
+ postures, ergonomie) communication communiquer à l'oral en milieu professionnel
109
+ savoir-être professionnels travailler en équipe faire preuve d'autonomie faire
110
+ preuve de rigueur et de précision savoirs domaines d'expertise travaux
111
+ - gestion de l'exploitation agricole • bp responsable d'exploitation agricole (bp
112
+ rea) • bts techniques et services en matériels agricoles • but spécialité génie
113
+ biologique parcours agronomie • compétences savoir-faire production, fabricationpréparer
114
+ le matériel, les matériaux et les outillages monter et régler une installation,
115
+ une machine régler un équipement d'irrigation et d'arrosage adapter, ajuster un
116
+ article ou une production en fonction du besoin entretenir un arbre, une plantation
117
+ identifier une maladie, un parasite ou une carence sur un végétal,
118
+ - dans leurs démarches renseigner les clients sur les services de l'établissement
119
+ et offres touristiques réaliser des courses à la demande d'un client ou pour les
120
+ besoins de l'établissement développement commercial développer et fidéliser la
121
+ relation client stratégie de développementsuperviser le service de la bagagerie,
122
+ le stationnement des véhicules et organiser le transport des bagages management
123
+ organiser le travail d'une équipe gestion des ressources humaines recruter et
124
+ intégrer une personne conseil, transmission transmettre une technique, un savoir-faire
125
+ fiche emploi - juin 2024 maintenance, réparation surveiller un espace, un local,
126
+ un lieu
127
+ - source_sentence: Détective privé
128
+ sentences:
129
+ - sécurité, santé et environnement (qhsse) réaliser la mise en conformité de fonctionnement
130
+ (état de référence, sécurité, environnement,...) gestion des stockscontrôler l'état
131
+ des stocks définir des besoins en approvisionnement communication, multimédiamener
132
+ un entretien, une interview, une audition rédiger un cahier des charges, des spécifications
133
+ techniques recherche, innovationobserver des faits, des évènements, des comportements
134
+ procéder à des tests, expérimentations management valoriser et partager les bonnes
135
+ pratiques gestion des ressources humaines cartographier et classifier les emploi
136
+ - 'outils et matièresutilisation d''équipements de télésurveillance utilisation
137
+ d''outils connectés techniques professionnelles techniques pédagogiques 3 / 4
138
+ - fiche emploi - juin 2024 contextes de travail conditions de travail et risques
139
+ professionnelsau domicile d''un particulier déplacements professionnels en environnement
140
+ bruyant en environnement climatique difficile en extérieur en flux tendu en milieu
141
+ nucléaire port d''équipement de protection individuel (epi) : gants, chaussures,
142
+ casque, protections auditives port de tenue professionnelle ou d''uniforme position
143
+ pénible sans lumière naturelle station debout prolongée travail répétitif'
144
+ - juin 2024 compétences savoir-faire production, fabricationmettre en oeuvre les
145
+ processus et les modes opératoires techniques réaliser une intervention nécessitant
146
+ une habilitation monter et régler une installation, une machine appliquer un traitement,
147
+ un produit réaliser des opérations de traitement thermique fabriquer, façonner
148
+ des produits utiliser un outil, une machine, un équipement, une installation maintenance,
149
+ réparationentretenir un équipement, une machine, une installation contrôler la
150
+ conformité d'un équipement, d'une machine, d'une installation réaliser un diagnostic
151
+ technique réaliser la maintenance d'un équipement
152
+ - source_sentence: Responsable d'élevage en production ovine
153
+ sentences:
154
+ - 'de travail et risques professionnelsau domicile d''un particulier déplacements
155
+ professionnels port d''équipement de protection individuel (epi) : gants, chaussures,
156
+ casque, protections auditives horaires et durée du travailtravail en astreinte
157
+ travail le week-end publics spécifiques particuliers secteurs d''activité • bâtiment
158
+ et travaux publics (btp) 4 / 4 -'
159
+ - 'des fibres synthétiques caractéristiques des fils caractéristiques des textiles
160
+ maille 3 / 4 - fiche emploi - juin 2024 techniques professionnellescadrage horizontal
161
+ (positionnement tissu, tension...) cadrage vertical (positionnement tissu, tension...)
162
+ maniement de crochet techniques de nouage techniques de remaillage techniques
163
+ de tricotage à maille cueillie techniques de tricotage à maille jetée contextes
164
+ de travail conditions de travail et risques professionnelsmanipulation de produits
165
+ à risques port d''équipement de protection individuel (epi) : gants, chaussures,
166
+ casque, protections audi'
167
+ - de gestion immobilière estimer la valeur d'un bien, d'un produit droit, contentieux
168
+ et négociationappliquer un cadre juridique ou réglementaire réaliser le suivi
169
+ des décisions prises en assemblées de copropriété traiter des dossiers de contentieux
170
+ réaliser la gestion administrative des contrats management animer, coordonner
171
+ une équipe gestion des ressources humaines gérer les ressources humaines conseil,
172
+ transmission assurer une médiation constructionétablir l'état d'avancement de
173
+ travaux piloter la préparation de travaux planifier des travaux de rénovation
174
+ définir les besoins en rénovation du patrimoine immobilier
175
+ model-index:
176
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
177
+ results:
178
+ - task:
179
+ type: binary-classification
180
+ name: Binary Classification
181
+ dataset:
182
+ name: Unknown
183
+ type: unknown
184
+ metrics:
185
+ - type: cosine_accuracy
186
+ value: 0.9819417605117612
187
+ name: Cosine Accuracy
188
+ - type: cosine_accuracy_threshold
189
+ value: 0.679751992225647
190
+ name: Cosine Accuracy Threshold
191
+ - type: cosine_f1
192
+ value: 0.973428767526228
193
+ name: Cosine F1
194
+ - type: cosine_f1_threshold
195
+ value: 0.6781774163246155
196
+ name: Cosine F1 Threshold
197
+ - type: cosine_precision
198
+ value: 0.9712385051848953
199
+ name: Cosine Precision
200
+ - type: cosine_recall
201
+ value: 0.97562893081761
202
+ name: Cosine Recall
203
+ - type: cosine_ap
204
+ value: 0.9777667558930684
205
+ name: Cosine Ap
206
+ - type: dot_accuracy
207
+ value: 0.9798760578396748
208
+ name: Dot Accuracy
209
+ - type: dot_accuracy_threshold
210
+ value: 169.48760986328125
211
+ name: Dot Accuracy Threshold
212
+ - type: dot_f1
213
+ value: 0.9705653021442495
214
+ name: Dot F1
215
+ - type: dot_f1_threshold
216
+ value: 169.48760986328125
217
+ name: Dot F1 Threshold
218
+ - type: dot_precision
219
+ value: 0.9626836813611755
220
+ name: Dot Precision
221
+ - type: dot_recall
222
+ value: 0.9785770440251572
223
+ name: Dot Recall
224
+ - type: dot_ap
225
+ value: 0.9774347462977395
226
+ name: Dot Ap
227
+ - type: manhattan_accuracy
228
+ value: 0.9756113813553675
229
+ name: Manhattan Accuracy
230
+ - type: manhattan_accuracy_threshold
231
+ value: 160.50274658203125
232
+ name: Manhattan Accuracy Threshold
233
+ - type: manhattan_f1
234
+ value: 0.9638031364039846
235
+ name: Manhattan F1
236
+ - type: manhattan_f1_threshold
237
+ value: 165.2382354736328
238
+ name: Manhattan F1 Threshold
239
+ - type: manhattan_precision
240
+ value: 0.9673332013462681
241
+ name: Manhattan Precision
242
+ - type: manhattan_recall
243
+ value: 0.9602987421383647
244
+ name: Manhattan Recall
245
+ - type: manhattan_ap
246
+ value: 0.9781788393145018
247
+ name: Manhattan Ap
248
+ - type: euclidean_accuracy
249
+ value: 0.9826747517825015
250
+ name: Euclidean Accuracy
251
+ - type: euclidean_accuracy_threshold
252
+ value: 12.798349380493164
253
+ name: Euclidean Accuracy Threshold
254
+ - type: euclidean_f1
255
+ value: 0.9744797801334903
256
+ name: Euclidean F1
257
+ - type: euclidean_f1_threshold
258
+ value: 12.857450485229492
259
+ name: Euclidean F1 Threshold
260
+ - type: euclidean_precision
261
+ value: 0.9733333333333334
262
+ name: Euclidean Precision
263
+ - type: euclidean_recall
264
+ value: 0.97562893081761
265
+ name: Euclidean Recall
266
+ - type: euclidean_ap
267
+ value: 0.9783322008283785
268
+ name: Euclidean Ap
269
+ - type: max_accuracy
270
+ value: 0.9826747517825015
271
+ name: Max Accuracy
272
+ - type: max_accuracy_threshold
273
+ value: 169.48760986328125
274
+ name: Max Accuracy Threshold
275
+ - type: max_f1
276
+ value: 0.9744797801334903
277
+ name: Max F1
278
+ - type: max_f1_threshold
279
+ value: 169.48760986328125
280
+ name: Max F1 Threshold
281
+ - type: max_precision
282
+ value: 0.9733333333333334
283
+ name: Max Precision
284
+ - type: max_recall
285
+ value: 0.9785770440251572
286
+ name: Max Recall
287
+ - type: max_ap
288
+ value: 0.9783322008283785
289
+ name: Max Ap
290
+ - type: cosine_accuracy
291
+ value: 0.834924965893588
292
+ name: Cosine Accuracy
293
+ - type: cosine_accuracy_threshold
294
+ value: 0.9927449226379395
295
+ name: Cosine Accuracy Threshold
296
+ - type: cosine_f1
297
+ value: 0.5193370165745856
298
+ name: Cosine F1
299
+ - type: cosine_f1_threshold
300
+ value: 0.7801194190979004
301
+ name: Cosine F1 Threshold
302
+ - type: cosine_precision
303
+ value: 0.4292237442922374
304
+ name: Cosine Precision
305
+ - type: cosine_recall
306
+ value: 0.6573426573426573
307
+ name: Cosine Recall
308
+ - type: cosine_ap
309
+ value: 0.543556418876974
310
+ name: Cosine Ap
311
+ - type: dot_accuracy
312
+ value: 0.8376534788540245
313
+ name: Dot Accuracy
314
+ - type: dot_accuracy_threshold
315
+ value: 247.44024658203125
316
+ name: Dot Accuracy Threshold
317
+ - type: dot_f1
318
+ value: 0.5101010101010102
319
+ name: Dot F1
320
+ - type: dot_f1_threshold
321
+ value: 180.7263641357422
322
+ name: Dot F1 Threshold
323
+ - type: dot_precision
324
+ value: 0.39920948616600793
325
+ name: Dot Precision
326
+ - type: dot_recall
327
+ value: 0.7062937062937062
328
+ name: Dot Recall
329
+ - type: dot_ap
330
+ value: 0.53020619109288
331
+ name: Dot Ap
332
+ - type: manhattan_accuracy
333
+ value: 0.8362892223738063
334
+ name: Manhattan Accuracy
335
+ - type: manhattan_accuracy_threshold
336
+ value: 24.471851348876953
337
+ name: Manhattan Accuracy Threshold
338
+ - type: manhattan_f1
339
+ value: 0.5027027027027028
340
+ name: Manhattan F1
341
+ - type: manhattan_f1_threshold
342
+ value: 122.65769958496094
343
+ name: Manhattan F1 Threshold
344
+ - type: manhattan_precision
345
+ value: 0.40969162995594716
346
+ name: Manhattan Precision
347
+ - type: manhattan_recall
348
+ value: 0.6503496503496503
349
+ name: Manhattan Recall
350
+ - type: manhattan_ap
351
+ value: 0.5317396236146636
352
+ name: Manhattan Ap
353
+ - type: euclidean_accuracy
354
+ value: 0.8362892223738063
355
+ name: Euclidean Accuracy
356
+ - type: euclidean_accuracy_threshold
357
+ value: 1.9895026683807373
358
+ name: Euclidean Accuracy Threshold
359
+ - type: euclidean_f1
360
+ value: 0.5251396648044693
361
+ name: Euclidean F1
362
+ - type: euclidean_f1_threshold
363
+ value: 10.453689575195312
364
+ name: Euclidean F1 Threshold
365
+ - type: euclidean_precision
366
+ value: 0.4372093023255814
367
+ name: Euclidean Precision
368
+ - type: euclidean_recall
369
+ value: 0.6573426573426573
370
+ name: Euclidean Recall
371
+ - type: euclidean_ap
372
+ value: 0.5439869162730425
373
+ name: Euclidean Ap
374
+ - type: max_accuracy
375
+ value: 0.8376534788540245
376
+ name: Max Accuracy
377
+ - type: max_accuracy_threshold
378
+ value: 247.44024658203125
379
+ name: Max Accuracy Threshold
380
+ - type: max_f1
381
+ value: 0.5251396648044693
382
+ name: Max F1
383
+ - type: max_f1_threshold
384
+ value: 180.7263641357422
385
+ name: Max F1 Threshold
386
+ - type: max_precision
387
+ value: 0.4372093023255814
388
+ name: Max Precision
389
+ - type: max_recall
390
+ value: 0.7062937062937062
391
+ name: Max Recall
392
+ - type: max_ap
393
+ value: 0.5439869162730425
394
+ name: Max Ap
395
+ - type: cosine_accuracy
396
+ value: 0.9099590723055935
397
+ name: Cosine Accuracy
398
+ - type: cosine_accuracy_threshold
399
+ value: 0.8935878872871399
400
+ name: Cosine Accuracy Threshold
401
+ - type: cosine_f1
402
+ value: 0.7555555555555556
403
+ name: Cosine F1
404
+ - type: cosine_f1_threshold
405
+ value: 0.7638504505157471
406
+ name: Cosine F1 Threshold
407
+ - type: cosine_precision
408
+ value: 0.8031496062992126
409
+ name: Cosine Precision
410
+ - type: cosine_recall
411
+ value: 0.7132867132867133
412
+ name: Cosine Recall
413
+ - type: cosine_ap
414
+ value: 0.7999057173309585
415
+ name: Cosine Ap
416
+ - type: dot_accuracy
417
+ value: 0.91268758526603
418
+ name: Dot Accuracy
419
+ - type: dot_accuracy_threshold
420
+ value: 227.50296020507812
421
+ name: Dot Accuracy Threshold
422
+ - type: dot_f1
423
+ value: 0.7575757575757576
424
+ name: Dot F1
425
+ - type: dot_f1_threshold
426
+ value: 227.50296020507812
427
+ name: Dot F1 Threshold
428
+ - type: dot_precision
429
+ value: 0.8264462809917356
430
+ name: Dot Precision
431
+ - type: dot_recall
432
+ value: 0.6993006993006993
433
+ name: Dot Recall
434
+ - type: dot_ap
435
+ value: 0.7880743512191776
436
+ name: Dot Ap
437
+ - type: manhattan_accuracy
438
+ value: 0.9113233287858117
439
+ name: Manhattan Accuracy
440
+ - type: manhattan_accuracy_threshold
441
+ value: 109.26994323730469
442
+ name: Manhattan Accuracy Threshold
443
+ - type: manhattan_f1
444
+ value: 0.7555555555555556
445
+ name: Manhattan F1
446
+ - type: manhattan_f1_threshold
447
+ value: 121.61300659179688
448
+ name: Manhattan F1 Threshold
449
+ - type: manhattan_precision
450
+ value: 0.8031496062992126
451
+ name: Manhattan Precision
452
+ - type: manhattan_recall
453
+ value: 0.7132867132867133
454
+ name: Manhattan Recall
455
+ - type: manhattan_ap
456
+ value: 0.7968619528822352
457
+ name: Manhattan Ap
458
+ - type: euclidean_accuracy
459
+ value: 0.9099590723055935
460
+ name: Euclidean Accuracy
461
+ - type: euclidean_accuracy_threshold
462
+ value: 7.680914402008057
463
+ name: Euclidean Accuracy Threshold
464
+ - type: euclidean_f1
465
+ value: 0.7555555555555556
466
+ name: Euclidean F1
467
+ - type: euclidean_f1_threshold
468
+ value: 11.580322265625
469
+ name: Euclidean F1 Threshold
470
+ - type: euclidean_precision
471
+ value: 0.8031496062992126
472
+ name: Euclidean Precision
473
+ - type: euclidean_recall
474
+ value: 0.7132867132867133
475
+ name: Euclidean Recall
476
+ - type: euclidean_ap
477
+ value: 0.8007213057530033
478
+ name: Euclidean Ap
479
+ - type: max_accuracy
480
+ value: 0.91268758526603
481
+ name: Max Accuracy
482
+ - type: max_accuracy_threshold
483
+ value: 227.50296020507812
484
+ name: Max Accuracy Threshold
485
+ - type: max_f1
486
+ value: 0.7575757575757576
487
+ name: Max F1
488
+ - type: max_f1_threshold
489
+ value: 227.50296020507812
490
+ name: Max F1 Threshold
491
+ - type: max_precision
492
+ value: 0.8264462809917356
493
+ name: Max Precision
494
+ - type: max_recall
495
+ value: 0.7132867132867133
496
+ name: Max Recall
497
+ - type: max_ap
498
+ value: 0.8007213057530033
499
+ name: Max Ap
500
+ - type: cosine_accuracy
501
+ value: 0.8808888888888889
502
+ name: Cosine Accuracy
503
+ - type: cosine_accuracy_threshold
504
+ value: 0.7635923624038696
505
+ name: Cosine Accuracy Threshold
506
+ - type: cosine_f1
507
+ value: 0.7021494370522007
508
+ name: Cosine F1
509
+ - type: cosine_f1_threshold
510
+ value: 0.5529835224151611
511
+ name: Cosine F1 Threshold
512
+ - type: cosine_precision
513
+ value: 0.6819085487077535
514
+ name: Cosine Precision
515
+ - type: cosine_recall
516
+ value: 0.7236286919831224
517
+ name: Cosine Recall
518
+ - type: cosine_ap
519
+ value: 0.7361317958466017
520
+ name: Cosine Ap
521
+ - type: dot_accuracy
522
+ value: 0.8786666666666667
523
+ name: Dot Accuracy
524
+ - type: dot_accuracy_threshold
525
+ value: 217.53868103027344
526
+ name: Dot Accuracy Threshold
527
+ - type: dot_f1
528
+ value: 0.70042194092827
529
+ name: Dot F1
530
+ - type: dot_f1_threshold
531
+ value: 164.10406494140625
532
+ name: Dot F1 Threshold
533
+ - type: dot_precision
534
+ value: 0.70042194092827
535
+ name: Dot Precision
536
+ - type: dot_recall
537
+ value: 0.70042194092827
538
+ name: Dot Recall
539
+ - type: dot_ap
540
+ value: 0.7299140356412122
541
+ name: Dot Ap
542
+ - type: manhattan_accuracy
543
+ value: 0.8782222222222222
544
+ name: Manhattan Accuracy
545
+ - type: manhattan_accuracy_threshold
546
+ value: 146.0133056640625
547
+ name: Manhattan Accuracy Threshold
548
+ - type: manhattan_f1
549
+ value: 0.7016460905349794
550
+ name: Manhattan F1
551
+ - type: manhattan_f1_threshold
552
+ value: 180.20339965820312
553
+ name: Manhattan F1 Threshold
554
+ - type: manhattan_precision
555
+ value: 0.6847389558232931
556
+ name: Manhattan Precision
557
+ - type: manhattan_recall
558
+ value: 0.7194092827004219
559
+ name: Manhattan Recall
560
+ - type: manhattan_ap
561
+ value: 0.7262306820321688
562
+ name: Manhattan Ap
563
+ - type: euclidean_accuracy
564
+ value: 0.8804444444444445
565
+ name: Euclidean Accuracy
566
+ - type: euclidean_accuracy_threshold
567
+ value: 13.764719009399414
568
+ name: Euclidean Accuracy Threshold
569
+ - type: euclidean_f1
570
+ value: 0.7046413502109705
571
+ name: Euclidean F1
572
+ - type: euclidean_f1_threshold
573
+ value: 15.242857933044434
574
+ name: Euclidean F1 Threshold
575
+ - type: euclidean_precision
576
+ value: 0.7046413502109705
577
+ name: Euclidean Precision
578
+ - type: euclidean_recall
579
+ value: 0.7046413502109705
580
+ name: Euclidean Recall
581
+ - type: euclidean_ap
582
+ value: 0.7390591372297478
583
+ name: Euclidean Ap
584
+ - type: max_accuracy
585
+ value: 0.8808888888888889
586
+ name: Max Accuracy
587
+ - type: max_accuracy_threshold
588
+ value: 217.53868103027344
589
+ name: Max Accuracy Threshold
590
+ - type: max_f1
591
+ value: 0.7046413502109705
592
+ name: Max F1
593
+ - type: max_f1_threshold
594
+ value: 180.20339965820312
595
+ name: Max F1 Threshold
596
+ - type: max_precision
597
+ value: 0.7046413502109705
598
+ name: Max Precision
599
+ - type: max_recall
600
+ value: 0.7236286919831224
601
+ name: Max Recall
602
+ - type: max_ap
603
+ value: 0.7390591372297478
604
+ name: Max Ap
605
+ - type: cosine_accuracy
606
+ value: 0.9315555555555556
607
+ name: Cosine Accuracy
608
+ - type: cosine_accuracy_threshold
609
+ value: 0.6300285458564758
610
+ name: Cosine Accuracy Threshold
611
+ - type: cosine_f1
612
+ value: 0.8316008316008316
613
+ name: Cosine F1
614
+ - type: cosine_f1_threshold
615
+ value: 0.5284727811813354
616
+ name: Cosine F1 Threshold
617
+ - type: cosine_precision
618
+ value: 0.7843137254901961
619
+ name: Cosine Precision
620
+ - type: cosine_recall
621
+ value: 0.8849557522123894
622
+ name: Cosine Recall
623
+ - type: cosine_ap
624
+ value: 0.8866647506496831
625
+ name: Cosine Ap
626
+ - type: dot_accuracy
627
+ value: 0.9293333333333333
628
+ name: Dot Accuracy
629
+ - type: dot_accuracy_threshold
630
+ value: 199.23004150390625
631
+ name: Dot Accuracy Threshold
632
+ - type: dot_f1
633
+ value: 0.8273684210526315
634
+ name: Dot F1
635
+ - type: dot_f1_threshold
636
+ value: 165.896240234375
637
+ name: Dot F1 Threshold
638
+ - type: dot_precision
639
+ value: 0.7891566265060241
640
+ name: Dot Precision
641
+ - type: dot_recall
642
+ value: 0.8694690265486725
643
+ name: Dot Recall
644
+ - type: dot_ap
645
+ value: 0.8866771855777393
646
+ name: Dot Ap
647
+ - type: manhattan_accuracy
648
+ value: 0.9288888888888889
649
+ name: Manhattan Accuracy
650
+ - type: manhattan_accuracy_threshold
651
+ value: 176.44253540039062
652
+ name: Manhattan Accuracy Threshold
653
+ - type: manhattan_f1
654
+ value: 0.8210290827740493
655
+ name: Manhattan F1
656
+ - type: manhattan_f1_threshold
657
+ value: 176.44253540039062
658
+ name: Manhattan F1 Threshold
659
+ - type: manhattan_precision
660
+ value: 0.830316742081448
661
+ name: Manhattan Precision
662
+ - type: manhattan_recall
663
+ value: 0.8119469026548672
664
+ name: Manhattan Recall
665
+ - type: manhattan_ap
666
+ value: 0.8726245245116421
667
+ name: Manhattan Ap
668
+ - type: euclidean_accuracy
669
+ value: 0.932
670
+ name: Euclidean Accuracy
671
+ - type: euclidean_accuracy_threshold
672
+ value: 14.744226455688477
673
+ name: Euclidean Accuracy Threshold
674
+ - type: euclidean_f1
675
+ value: 0.8336842105263158
676
+ name: Euclidean F1
677
+ - type: euclidean_f1_threshold
678
+ value: 16.632638931274414
679
+ name: Euclidean F1 Threshold
680
+ - type: euclidean_precision
681
+ value: 0.7951807228915663
682
+ name: Euclidean Precision
683
+ - type: euclidean_recall
684
+ value: 0.8761061946902655
685
+ name: Euclidean Recall
686
+ - type: euclidean_ap
687
+ value: 0.8886002371862958
688
+ name: Euclidean Ap
689
+ - type: max_accuracy
690
+ value: 0.932
691
+ name: Max Accuracy
692
+ - type: max_accuracy_threshold
693
+ value: 199.23004150390625
694
+ name: Max Accuracy Threshold
695
+ - type: max_f1
696
+ value: 0.8336842105263158
697
+ name: Max F1
698
+ - type: max_f1_threshold
699
+ value: 176.44253540039062
700
+ name: Max F1 Threshold
701
+ - type: max_precision
702
+ value: 0.830316742081448
703
+ name: Max Precision
704
+ - type: max_recall
705
+ value: 0.8849557522123894
706
+ name: Max Recall
707
+ - type: max_ap
708
+ value: 0.8886002371862958
709
+ name: Max Ap
710
+ ---
711
+
712
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
713
+
714
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
715
+
716
+ ## Model Details
717
+
718
+ ### Model Description
719
+ - **Model Type:** Sentence Transformer
720
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision bf3bf13ab40c3157080a7ab344c831b9ad18b5eb -->
721
+ - **Maximum Sequence Length:** 128 tokens
722
+ - **Output Dimensionality:** 384 tokens
723
+ - **Similarity Function:** Cosine Similarity
724
+ <!-- - **Training Dataset:** Unknown -->
725
+ <!-- - **Language:** Unknown -->
726
+ <!-- - **License:** Unknown -->
727
+
728
+ ### Model Sources
729
+
730
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
731
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
732
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
733
+
734
+ ### Full Model Architecture
735
+
736
+ ```
737
+ SentenceTransformer(
738
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
739
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
740
+ )
741
+ ```
742
+
743
+ ## Usage
744
+
745
+ ### Direct Usage (Sentence Transformers)
746
+
747
+ First install the Sentence Transformers library:
748
+
749
+ ```bash
750
+ pip install -U sentence-transformers
751
+ ```
752
+
753
+ Then you can load this model and run inference.
754
+ ```python
755
+ from sentence_transformers import SentenceTransformer
756
+
757
+ # Download from the 🤗 Hub
758
+ model = SentenceTransformer("training_job_matching_sentence-transformers-paraphrase-multilingual-MiniLM-L12-v2-2024-09-03_13-14-25")
759
+ # Run inference
760
+ sentences = [
761
+ "Responsable d'élevage en production ovine",
762
+ "de gestion immobilière estimer la valeur d'un bien, d'un produit droit, contentieux et négociationappliquer un cadre juridique ou réglementaire réaliser le suivi des décisions prises en assemblées de copropriété traiter des dossiers de contentieux réaliser la gestion administrative des contrats management animer, coordonner une équipe gestion des ressources humaines gérer les ressources humaines conseil, transmission assurer une médiation constructionétablir l'état d'avancement de travaux piloter la préparation de travaux planifier des travaux de rénovation définir les besoins en rénovation du patrimoine immobilier",
763
+ "de travail et risques professionnelsau domicile d'un particulier déplacements professionnels port d'équipement de protection individuel (epi) : gants, chaussures, casque, protections auditives horaires et durée du travailtravail en astreinte travail le week-end publics spécifiques particuliers secteurs d'activité • bâtiment et travaux publics (btp) 4 / 4 -",
764
+ ]
765
+ embeddings = model.encode(sentences)
766
+ print(embeddings.shape)
767
+ # [3, 384]
768
+
769
+ # Get the similarity scores for the embeddings
770
+ similarities = model.similarity(embeddings, embeddings)
771
+ print(similarities.shape)
772
+ # [3, 3]
773
+ ```
774
+
775
+ <!--
776
+ ### Direct Usage (Transformers)
777
+
778
+ <details><summary>Click to see the direct usage in Transformers</summary>
779
+
780
+ </details>
781
+ -->
782
+
783
+ <!--
784
+ ### Downstream Usage (Sentence Transformers)
785
+
786
+ You can finetune this model on your own dataset.
787
+
788
+ <details><summary>Click to expand</summary>
789
+
790
+ </details>
791
+ -->
792
+
793
+ <!--
794
+ ### Out-of-Scope Use
795
+
796
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
797
+ -->
798
+
799
+ ## Evaluation
800
+
801
+ ### Metrics
802
+
803
+ #### Binary Classification
804
+
805
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
806
+
807
+ | Metric | Value |
808
+ |:-----------------------------|:-----------|
809
+ | cosine_accuracy | 0.9819 |
810
+ | cosine_accuracy_threshold | 0.6798 |
811
+ | cosine_f1 | 0.9734 |
812
+ | cosine_f1_threshold | 0.6782 |
813
+ | cosine_precision | 0.9712 |
814
+ | cosine_recall | 0.9756 |
815
+ | cosine_ap | 0.9778 |
816
+ | dot_accuracy | 0.9799 |
817
+ | dot_accuracy_threshold | 169.4876 |
818
+ | dot_f1 | 0.9706 |
819
+ | dot_f1_threshold | 169.4876 |
820
+ | dot_precision | 0.9627 |
821
+ | dot_recall | 0.9786 |
822
+ | dot_ap | 0.9774 |
823
+ | manhattan_accuracy | 0.9756 |
824
+ | manhattan_accuracy_threshold | 160.5027 |
825
+ | manhattan_f1 | 0.9638 |
826
+ | manhattan_f1_threshold | 165.2382 |
827
+ | manhattan_precision | 0.9673 |
828
+ | manhattan_recall | 0.9603 |
829
+ | manhattan_ap | 0.9782 |
830
+ | euclidean_accuracy | 0.9827 |
831
+ | euclidean_accuracy_threshold | 12.7983 |
832
+ | euclidean_f1 | 0.9745 |
833
+ | euclidean_f1_threshold | 12.8575 |
834
+ | euclidean_precision | 0.9733 |
835
+ | euclidean_recall | 0.9756 |
836
+ | euclidean_ap | 0.9783 |
837
+ | max_accuracy | 0.9827 |
838
+ | max_accuracy_threshold | 169.4876 |
839
+ | max_f1 | 0.9745 |
840
+ | max_f1_threshold | 169.4876 |
841
+ | max_precision | 0.9733 |
842
+ | max_recall | 0.9786 |
843
+ | **max_ap** | **0.9783** |
844
+
845
+ #### Binary Classification
846
+
847
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
848
+
849
+ | Metric | Value |
850
+ |:-----------------------------|:----------|
851
+ | cosine_accuracy | 0.8349 |
852
+ | cosine_accuracy_threshold | 0.9927 |
853
+ | cosine_f1 | 0.5193 |
854
+ | cosine_f1_threshold | 0.7801 |
855
+ | cosine_precision | 0.4292 |
856
+ | cosine_recall | 0.6573 |
857
+ | cosine_ap | 0.5436 |
858
+ | dot_accuracy | 0.8377 |
859
+ | dot_accuracy_threshold | 247.4402 |
860
+ | dot_f1 | 0.5101 |
861
+ | dot_f1_threshold | 180.7264 |
862
+ | dot_precision | 0.3992 |
863
+ | dot_recall | 0.7063 |
864
+ | dot_ap | 0.5302 |
865
+ | manhattan_accuracy | 0.8363 |
866
+ | manhattan_accuracy_threshold | 24.4719 |
867
+ | manhattan_f1 | 0.5027 |
868
+ | manhattan_f1_threshold | 122.6577 |
869
+ | manhattan_precision | 0.4097 |
870
+ | manhattan_recall | 0.6503 |
871
+ | manhattan_ap | 0.5317 |
872
+ | euclidean_accuracy | 0.8363 |
873
+ | euclidean_accuracy_threshold | 1.9895 |
874
+ | euclidean_f1 | 0.5251 |
875
+ | euclidean_f1_threshold | 10.4537 |
876
+ | euclidean_precision | 0.4372 |
877
+ | euclidean_recall | 0.6573 |
878
+ | euclidean_ap | 0.544 |
879
+ | max_accuracy | 0.8377 |
880
+ | max_accuracy_threshold | 247.4402 |
881
+ | max_f1 | 0.5251 |
882
+ | max_f1_threshold | 180.7264 |
883
+ | max_precision | 0.4372 |
884
+ | max_recall | 0.7063 |
885
+ | **max_ap** | **0.544** |
886
+
887
+ #### Binary Classification
888
+
889
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
890
+
891
+ | Metric | Value |
892
+ |:-----------------------------|:-----------|
893
+ | cosine_accuracy | 0.91 |
894
+ | cosine_accuracy_threshold | 0.8936 |
895
+ | cosine_f1 | 0.7556 |
896
+ | cosine_f1_threshold | 0.7639 |
897
+ | cosine_precision | 0.8031 |
898
+ | cosine_recall | 0.7133 |
899
+ | cosine_ap | 0.7999 |
900
+ | dot_accuracy | 0.9127 |
901
+ | dot_accuracy_threshold | 227.503 |
902
+ | dot_f1 | 0.7576 |
903
+ | dot_f1_threshold | 227.503 |
904
+ | dot_precision | 0.8264 |
905
+ | dot_recall | 0.6993 |
906
+ | dot_ap | 0.7881 |
907
+ | manhattan_accuracy | 0.9113 |
908
+ | manhattan_accuracy_threshold | 109.2699 |
909
+ | manhattan_f1 | 0.7556 |
910
+ | manhattan_f1_threshold | 121.613 |
911
+ | manhattan_precision | 0.8031 |
912
+ | manhattan_recall | 0.7133 |
913
+ | manhattan_ap | 0.7969 |
914
+ | euclidean_accuracy | 0.91 |
915
+ | euclidean_accuracy_threshold | 7.6809 |
916
+ | euclidean_f1 | 0.7556 |
917
+ | euclidean_f1_threshold | 11.5803 |
918
+ | euclidean_precision | 0.8031 |
919
+ | euclidean_recall | 0.7133 |
920
+ | euclidean_ap | 0.8007 |
921
+ | max_accuracy | 0.9127 |
922
+ | max_accuracy_threshold | 227.503 |
923
+ | max_f1 | 0.7576 |
924
+ | max_f1_threshold | 227.503 |
925
+ | max_precision | 0.8264 |
926
+ | max_recall | 0.7133 |
927
+ | **max_ap** | **0.8007** |
928
+
929
+ #### Binary Classification
930
+
931
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
932
+
933
+ | Metric | Value |
934
+ |:-----------------------------|:-----------|
935
+ | cosine_accuracy | 0.8809 |
936
+ | cosine_accuracy_threshold | 0.7636 |
937
+ | cosine_f1 | 0.7021 |
938
+ | cosine_f1_threshold | 0.553 |
939
+ | cosine_precision | 0.6819 |
940
+ | cosine_recall | 0.7236 |
941
+ | cosine_ap | 0.7361 |
942
+ | dot_accuracy | 0.8787 |
943
+ | dot_accuracy_threshold | 217.5387 |
944
+ | dot_f1 | 0.7004 |
945
+ | dot_f1_threshold | 164.1041 |
946
+ | dot_precision | 0.7004 |
947
+ | dot_recall | 0.7004 |
948
+ | dot_ap | 0.7299 |
949
+ | manhattan_accuracy | 0.8782 |
950
+ | manhattan_accuracy_threshold | 146.0133 |
951
+ | manhattan_f1 | 0.7016 |
952
+ | manhattan_f1_threshold | 180.2034 |
953
+ | manhattan_precision | 0.6847 |
954
+ | manhattan_recall | 0.7194 |
955
+ | manhattan_ap | 0.7262 |
956
+ | euclidean_accuracy | 0.8804 |
957
+ | euclidean_accuracy_threshold | 13.7647 |
958
+ | euclidean_f1 | 0.7046 |
959
+ | euclidean_f1_threshold | 15.2429 |
960
+ | euclidean_precision | 0.7046 |
961
+ | euclidean_recall | 0.7046 |
962
+ | euclidean_ap | 0.7391 |
963
+ | max_accuracy | 0.8809 |
964
+ | max_accuracy_threshold | 217.5387 |
965
+ | max_f1 | 0.7046 |
966
+ | max_f1_threshold | 180.2034 |
967
+ | max_precision | 0.7046 |
968
+ | max_recall | 0.7236 |
969
+ | **max_ap** | **0.7391** |
970
+
971
+ #### Binary Classification
972
+
973
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
974
+
975
+ | Metric | Value |
976
+ |:-----------------------------|:-----------|
977
+ | cosine_accuracy | 0.9316 |
978
+ | cosine_accuracy_threshold | 0.63 |
979
+ | cosine_f1 | 0.8316 |
980
+ | cosine_f1_threshold | 0.5285 |
981
+ | cosine_precision | 0.7843 |
982
+ | cosine_recall | 0.885 |
983
+ | cosine_ap | 0.8867 |
984
+ | dot_accuracy | 0.9293 |
985
+ | dot_accuracy_threshold | 199.23 |
986
+ | dot_f1 | 0.8274 |
987
+ | dot_f1_threshold | 165.8962 |
988
+ | dot_precision | 0.7892 |
989
+ | dot_recall | 0.8695 |
990
+ | dot_ap | 0.8867 |
991
+ | manhattan_accuracy | 0.9289 |
992
+ | manhattan_accuracy_threshold | 176.4425 |
993
+ | manhattan_f1 | 0.821 |
994
+ | manhattan_f1_threshold | 176.4425 |
995
+ | manhattan_precision | 0.8303 |
996
+ | manhattan_recall | 0.8119 |
997
+ | manhattan_ap | 0.8726 |
998
+ | euclidean_accuracy | 0.932 |
999
+ | euclidean_accuracy_threshold | 14.7442 |
1000
+ | euclidean_f1 | 0.8337 |
1001
+ | euclidean_f1_threshold | 16.6326 |
1002
+ | euclidean_precision | 0.7952 |
1003
+ | euclidean_recall | 0.8761 |
1004
+ | euclidean_ap | 0.8886 |
1005
+ | max_accuracy | 0.932 |
1006
+ | max_accuracy_threshold | 199.23 |
1007
+ | max_f1 | 0.8337 |
1008
+ | max_f1_threshold | 176.4425 |
1009
+ | max_precision | 0.8303 |
1010
+ | max_recall | 0.885 |
1011
+ | **max_ap** | **0.8886** |
1012
+
1013
+ <!--
1014
+ ## Bias, Risks and Limitations
1015
+
1016
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
1017
+ -->
1018
+
1019
+ <!--
1020
+ ### Recommendations
1021
+
1022
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
1023
+ -->
1024
+
1025
+ ## Training Details
1026
+
1027
+ ### Training Dataset
1028
+
1029
+ #### Unnamed Dataset
1030
+
1031
+
1032
+ * Size: 42,735 training samples
1033
+ * Columns: <code>name</code>, <code>fiche</code>, and <code>label</code>
1034
+ * Approximate statistics based on the first 1000 samples:
1035
+ | | name | fiche | label |
1036
+ |:--------|:---------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------|
1037
+ | type | string | string | int |
1038
+ | details | <ul><li>min: 3 tokens</li><li>mean: 9.44 tokens</li><li>max: 44 tokens</li></ul> | <ul><li>min: 4 tokens</li><li>mean: 107.63 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>0: ~78.20%</li><li>1: ~21.80%</li></ul> |
1039
+ * Samples:
1040
+ | name | fiche | label |
1041
+ |:---------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
1042
+ | <code>Front End Angular Developer</code> | <code>communication WCF is used. The layer concept enables the reduction of dependencies (dependency injection) of the different tasks (separation of concerns). The entities are exchanged with the database via object-relational mapping (ORM) and processed using the CRUD methods. Through the consistent use of the MVVM pattern, we avoid code-behind. The user interface of the application is realized using the PRISM framework as a "Composite Application UI".Main tasks Software developerIn cooperation with a team located in Germany and respecting the software development guidelines and customers</code> | <code>0</code> |
1043
+ | <code>SCM : Administrateur des ventes</code> | <code>CHEF DE PROJET CONFIRME MAÎTRISANT ANGULAR 4.SON RÔLE SERA L'ENCADREMENT D'UNE EQUIPE ET LA GESTION TOTALE DU DÉVELOPPEMENT D'UNE APPLICATION MOBILE ANDROID.ESPRIT D'ÉQUIPE OBLIGATOIRE.</code> | <code>0</code> |
1044
+ | <code>Talent Acquisition Junior</code> | <code>Pilotage et suivi de toutes les activités du call center (commandes clients et interactions bénéficiaires de la carte).Assurer le calcul et le suivi des Kpi’s du call center.Veiller à la conformité des process et des procédures pour le call center.Contrôle de la prise en charge et la saisie des demandes et réclamations.Pilotage et suivi des projets de la direction clientèle.Assurer toutes demandes ou actions émanant de la Direction Clientèle.Assurer le maintien d’une bonne qualité de service.Augmenter la satisfaction</code> | <code>0</code> |
1045
+ * Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
1046
+
1047
+ ### Evaluation Dataset
1048
+
1049
+ #### Unnamed Dataset
1050
+
1051
+
1052
+ * Size: 2,250 evaluation samples
1053
+ * Columns: <code>name</code>, <code>fiche</code>, and <code>label</code>
1054
+ * Approximate statistics based on the first 1000 samples:
1055
+ | | name | fiche | label |
1056
+ |:--------|:---------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------|
1057
+ | type | string | string | int |
1058
+ | details | <ul><li>min: 3 tokens</li><li>mean: 9.31 tokens</li><li>max: 36 tokens</li></ul> | <ul><li>min: 3 tokens</li><li>mean: 109.04 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>0: ~80.30%</li><li>1: ~19.70%</li></ul> |
1059
+ * Samples:
1060
+ | name | fiche | label |
1061
+ |:---------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
1062
+ | <code>1way com</code> | <code>Nous somme a la recherche de Profils en Telco avec connaissance en Produit! 😃Vous avez une connaissances dans la télécommunication? Emission ou réception (orange, sfr, boygues, free..)Vous voulez travailler dans un environnement stable, accueillant et sans pression?Vous êtes passionnés? Postulez maintenant et profitez d'un salaire motivant et pleins d'avantages:- Salaire 1100 a 1300 (selon le profil)- Primes et challenges- Tickets repas- Transport assuré- Samedi dimanche off- Titularisation- Convention</code> | <code>1</code> |
1063
+ | <code>Senior Front end Web Developer</code> | <code>As part of our growth in Tunis, we are looking to hire a Sénior Front-End Web Developer, who is passionate by Web Development and would like to have a career in an international company, in the Private Banking sector, within an exciting work environment.You will take part, throughout the software development life cycle (SDLC), to the requirement analysis, development and the support of different applications for private banks.You will perform AngularJS frontend development.You will integrate a highly motivated development team working on providing solutions for the private banking sector in which you will integrate the existing global</code> | <code>1</code> |
1064
+ | <code>DÉVELOPPEUR FULLSTACK RUBY ET ANGULAR</code> | <code>professionnel et d'évolution de carrière.- Projets stimulants et variés.- Esprit d'équipe et culture d'entreprise positive.- Salaire compétitif et avantages sociaux attractifs.Rejoignez MCOM et contribuez à révolutionner le commerce mobile avec nous!</code> | <code>0</code> |
1065
+ * Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
1066
+
1067
+ ### Training Hyperparameters
1068
+ #### Non-Default Hyperparameters
1069
+
1070
+ - `eval_strategy`: steps
1071
+ - `per_device_train_batch_size`: 64
1072
+ - `per_device_eval_batch_size`: 32
1073
+ - `num_train_epochs`: 5
1074
+ - `warmup_ratio`: 0.1
1075
+ - `bf16`: True
1076
+
1077
+ #### All Hyperparameters
1078
+ <details><summary>Click to expand</summary>
1079
+
1080
+ - `overwrite_output_dir`: False
1081
+ - `do_predict`: False
1082
+ - `eval_strategy`: steps
1083
+ - `prediction_loss_only`: True
1084
+ - `per_device_train_batch_size`: 64
1085
+ - `per_device_eval_batch_size`: 32
1086
+ - `per_gpu_train_batch_size`: None
1087
+ - `per_gpu_eval_batch_size`: None
1088
+ - `gradient_accumulation_steps`: 1
1089
+ - `eval_accumulation_steps`: None
1090
+ - `learning_rate`: 5e-05
1091
+ - `weight_decay`: 0.0
1092
+ - `adam_beta1`: 0.9
1093
+ - `adam_beta2`: 0.999
1094
+ - `adam_epsilon`: 1e-08
1095
+ - `max_grad_norm`: 1.0
1096
+ - `num_train_epochs`: 5
1097
+ - `max_steps`: -1
1098
+ - `lr_scheduler_type`: linear
1099
+ - `lr_scheduler_kwargs`: {}
1100
+ - `warmup_ratio`: 0.1
1101
+ - `warmup_steps`: 0
1102
+ - `log_level`: passive
1103
+ - `log_level_replica`: warning
1104
+ - `log_on_each_node`: True
1105
+ - `logging_nan_inf_filter`: True
1106
+ - `save_safetensors`: True
1107
+ - `save_on_each_node`: False
1108
+ - `save_only_model`: False
1109
+ - `restore_callback_states_from_checkpoint`: False
1110
+ - `no_cuda`: False
1111
+ - `use_cpu`: False
1112
+ - `use_mps_device`: False
1113
+ - `seed`: 42
1114
+ - `data_seed`: None
1115
+ - `jit_mode_eval`: False
1116
+ - `use_ipex`: False
1117
+ - `bf16`: True
1118
+ - `fp16`: False
1119
+ - `fp16_opt_level`: O1
1120
+ - `half_precision_backend`: auto
1121
+ - `bf16_full_eval`: False
1122
+ - `fp16_full_eval`: False
1123
+ - `tf32`: None
1124
+ - `local_rank`: 0
1125
+ - `ddp_backend`: None
1126
+ - `tpu_num_cores`: None
1127
+ - `tpu_metrics_debug`: False
1128
+ - `debug`: []
1129
+ - `dataloader_drop_last`: False
1130
+ - `dataloader_num_workers`: 0
1131
+ - `dataloader_prefetch_factor`: None
1132
+ - `past_index`: -1
1133
+ - `disable_tqdm`: False
1134
+ - `remove_unused_columns`: True
1135
+ - `label_names`: None
1136
+ - `load_best_model_at_end`: False
1137
+ - `ignore_data_skip`: False
1138
+ - `fsdp`: []
1139
+ - `fsdp_min_num_params`: 0
1140
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
1141
+ - `fsdp_transformer_layer_cls_to_wrap`: None
1142
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
1143
+ - `deepspeed`: None
1144
+ - `label_smoothing_factor`: 0.0
1145
+ - `optim`: adamw_torch
1146
+ - `optim_args`: None
1147
+ - `adafactor`: False
1148
+ - `group_by_length`: False
1149
+ - `length_column_name`: length
1150
+ - `ddp_find_unused_parameters`: None
1151
+ - `ddp_bucket_cap_mb`: None
1152
+ - `ddp_broadcast_buffers`: False
1153
+ - `dataloader_pin_memory`: True
1154
+ - `dataloader_persistent_workers`: False
1155
+ - `skip_memory_metrics`: True
1156
+ - `use_legacy_prediction_loop`: False
1157
+ - `push_to_hub`: False
1158
+ - `resume_from_checkpoint`: None
1159
+ - `hub_model_id`: None
1160
+ - `hub_strategy`: every_save
1161
+ - `hub_private_repo`: False
1162
+ - `hub_always_push`: False
1163
+ - `gradient_checkpointing`: False
1164
+ - `gradient_checkpointing_kwargs`: None
1165
+ - `include_inputs_for_metrics`: False
1166
+ - `eval_do_concat_batches`: True
1167
+ - `fp16_backend`: auto
1168
+ - `push_to_hub_model_id`: None
1169
+ - `push_to_hub_organization`: None
1170
+ - `mp_parameters`:
1171
+ - `auto_find_batch_size`: False
1172
+ - `full_determinism`: False
1173
+ - `torchdynamo`: None
1174
+ - `ray_scope`: last
1175
+ - `ddp_timeout`: 1800
1176
+ - `torch_compile`: False
1177
+ - `torch_compile_backend`: None
1178
+ - `torch_compile_mode`: None
1179
+ - `dispatch_batches`: None
1180
+ - `split_batches`: None
1181
+ - `include_tokens_per_second`: False
1182
+ - `include_num_input_tokens_seen`: False
1183
+ - `neftune_noise_alpha`: None
1184
+ - `optim_target_modules`: None
1185
+ - `batch_eval_metrics`: False
1186
+ - `eval_on_start`: False
1187
+ - `batch_sampler`: batch_sampler
1188
+ - `multi_dataset_batch_sampler`: proportional
1189
+
1190
+ </details>
1191
+
1192
+ ### Training Logs
1193
+ <details><summary>Click to expand</summary>
1194
+
1195
+ | Epoch | Step | Training Loss | loss | max_ap |
1196
+ |:------:|:-----:|:-------------:|:------:|:------:|
1197
+ | 0 | 0 | - | - | 0.6610 |
1198
+ | 0.0673 | 300 | 0.638 | - | - |
1199
+ | 0.1346 | 600 | 0.5642 | - | - |
1200
+ | 0.2020 | 900 | 0.4942 | - | - |
1201
+ | 0.2244 | 1000 | - | 0.4283 | 0.7756 |
1202
+ | 0.2693 | 1200 | 0.4323 | - | - |
1203
+ | 0.3366 | 1500 | 0.3986 | - | - |
1204
+ | 0.4039 | 1800 | 0.3798 | - | - |
1205
+ | 0.4488 | 2000 | - | 0.3481 | 0.8517 |
1206
+ | 0.4713 | 2100 | 0.3532 | - | - |
1207
+ | 0.5386 | 2400 | 0.3407 | - | - |
1208
+ | 0.6059 | 2700 | 0.323 | - | - |
1209
+ | 0.6732 | 3000 | 0.3022 | 0.2953 | 0.8899 |
1210
+ | 0.7406 | 3300 | 0.2945 | - | - |
1211
+ | 0.8079 | 3600 | 0.2864 | - | - |
1212
+ | 0.8752 | 3900 | 0.2656 | - | - |
1213
+ | 0.8977 | 4000 | - | 0.2434 | 0.9199 |
1214
+ | 0.9425 | 4200 | 0.2581 | - | - |
1215
+ | 1.0099 | 4500 | 0.2486 | - | - |
1216
+ | 1.0772 | 4800 | 0.2282 | - | - |
1217
+ | 1.1221 | 5000 | - | 0.2160 | 0.9248 |
1218
+ | 1.1445 | 5100 | 0.2191 | - | - |
1219
+ | 1.2118 | 5400 | 0.2113 | - | - |
1220
+ | 1.2792 | 5700 | 0.2111 | - | - |
1221
+ | 1.3465 | 6000 | 0.2011 | 0.1882 | 0.9339 |
1222
+ | 1.4138 | 6300 | 0.1894 | - | - |
1223
+ | 1.4811 | 6600 | 0.1814 | - | - |
1224
+ | 1.5485 | 6900 | 0.1772 | - | - |
1225
+ | 1.5709 | 7000 | - | 0.1697 | 0.9409 |
1226
+ | 1.6158 | 7200 | 0.1731 | - | - |
1227
+ | 1.6831 | 7500 | 0.1707 | - | - |
1228
+ | 1.7504 | 7800 | 0.163 | - | - |
1229
+ | 1.7953 | 8000 | - | 0.1497 | 0.9411 |
1230
+ | 1.8178 | 8100 | 0.1576 | - | - |
1231
+ | 1.8851 | 8400 | 0.1518 | - | - |
1232
+ | 1.9524 | 8700 | 0.1447 | - | - |
1233
+ | 2.0197 | 9000 | 0.142 | 0.1355 | 0.9483 |
1234
+ | 2.0871 | 9300 | 0.1277 | - | - |
1235
+ | 2.1544 | 9600 | 0.1278 | - | - |
1236
+ | 2.2217 | 9900 | 0.1243 | - | - |
1237
+ | 2.2442 | 10000 | - | 0.1225 | 0.9526 |
1238
+ | 2.2890 | 10200 | 0.1228 | - | - |
1239
+ | 2.3564 | 10500 | 0.1214 | - | - |
1240
+ | 2.4237 | 10800 | 0.1173 | - | - |
1241
+ | 2.4686 | 11000 | - | 0.1082 | 0.9606 |
1242
+ | 2.4910 | 11100 | 0.1154 | - | - |
1243
+ | 2.5583 | 11400 | 0.1098 | - | - |
1244
+ | 2.6257 | 11700 | 0.1074 | - | - |
1245
+ | 2.6930 | 12000 | 0.105 | 0.1005 | 0.9656 |
1246
+ | 2.7603 | 12300 | 0.1042 | - | - |
1247
+ | 2.8276 | 12600 | 0.0998 | - | - |
1248
+ | 2.8950 | 12900 | 0.0967 | - | - |
1249
+ | 2.9174 | 13000 | - | 0.0911 | 0.9645 |
1250
+ | 2.9623 | 13200 | 0.0977 | - | - |
1251
+ | 3.0296 | 13500 | 0.0896 | - | - |
1252
+ | 3.0969 | 13800 | 0.0854 | - | - |
1253
+ | 3.1418 | 14000 | - | 0.0843 | 0.9686 |
1254
+ | 3.1643 | 14100 | 0.0848 | - | - |
1255
+ | 3.2316 | 14400 | 0.0841 | - | - |
1256
+ | 3.2989 | 14700 | 0.082 | - | - |
1257
+ | 3.3662 | 15000 | 0.0815 | 0.0790 | 0.9711 |
1258
+ | 3.4336 | 15300 | 0.0812 | - | - |
1259
+ | 3.5009 | 15600 | 0.0799 | - | - |
1260
+ | 3.5682 | 15900 | 0.0753 | - | - |
1261
+ | 3.5907 | 16000 | - | 0.0751 | 0.9725 |
1262
+ | 3.6355 | 16200 | 0.0756 | - | - |
1263
+ | 3.7029 | 16500 | 0.0737 | - | - |
1264
+ | 3.7702 | 16800 | 0.0742 | - | - |
1265
+ | 3.8151 | 17000 | - | 0.0713 | 0.9750 |
1266
+ | 3.8375 | 17100 | 0.0725 | - | - |
1267
+ | 3.9048 | 17400 | 0.0721 | - | - |
1268
+ | 3.9722 | 17700 | 0.0696 | - | - |
1269
+ | 4.0395 | 18000 | 0.0665 | 0.0664 | 0.9746 |
1270
+ | 4.1068 | 18300 | 0.0648 | - | - |
1271
+ | 4.1741 | 18600 | 0.0636 | - | - |
1272
+ | 4.2415 | 18900 | 0.0617 | - | - |
1273
+ | 4.2639 | 19000 | - | 0.0637 | 0.9757 |
1274
+ | 4.3088 | 19200 | 0.0624 | - | - |
1275
+ | 4.3761 | 19500 | 0.062 | - | - |
1276
+ | 4.4434 | 19800 | 0.0609 | - | - |
1277
+ | 4.4883 | 20000 | - | 0.0608 | 0.9774 |
1278
+ | 4.5108 | 20100 | 0.0607 | - | - |
1279
+ | 4.5781 | 20400 | 0.061 | - | - |
1280
+ | 4.6454 | 20700 | 0.0612 | - | - |
1281
+ | 4.7127 | 21000 | 0.0598 | 0.0591 | 0.9777 |
1282
+ | 4.7801 | 21300 | 0.0613 | - | - |
1283
+ | 4.8474 | 21600 | 0.0599 | - | - |
1284
+ | 4.9147 | 21900 | 0.0575 | - | - |
1285
+ | 4.9372 | 22000 | - | 0.0582 | 0.9783 |
1286
+ | 4.9820 | 22200 | 0.0593 | - | - |
1287
+ | 5.0 | 22280 | - | - | 0.5440 |
1288
+ | 0.8303 | 181 | - | - | 0.7148 |
1289
+ | 0.4587 | 100 | - | 0.2849 | 0.7360 |
1290
+ | 0.9174 | 200 | - | 0.3019 | 0.7230 |
1291
+ | 1.3761 | 300 | 0.2712 | 0.2813 | 0.7697 |
1292
+ | 1.8349 | 400 | - | 0.2667 | 0.8033 |
1293
+ | 2.2936 | 500 | - | 0.2673 | 0.7936 |
1294
+ | 2.7523 | 600 | 0.2268 | 0.2518 | 0.8078 |
1295
+ | 3.2110 | 700 | - | 0.2539 | 0.8103 |
1296
+ | 3.6697 | 800 | - | 0.2662 | 0.8118 |
1297
+ | 4.1284 | 900 | 0.1845 | 0.2688 | 0.8003 |
1298
+ | 4.5872 | 1000 | - | 0.2632 | 0.8081 |
1299
+ | 0.4587 | 100 | - | 0.2642 | 0.8101 |
1300
+ | 0.9174 | 200 | - | 0.2741 | 0.7995 |
1301
+ | 1.3761 | 300 | 0.1742 | 0.2818 | 0.7861 |
1302
+ | 1.8349 | 400 | - | 0.2595 | 0.8146 |
1303
+ | 2.2936 | 500 | - | 0.2716 | 0.8021 |
1304
+ | 2.7523 | 600 | 0.1572 | 0.2622 | 0.8013 |
1305
+ | 3.2110 | 700 | - | 0.2660 | 0.7985 |
1306
+ | 3.6697 | 800 | - | 0.2716 | 0.7986 |
1307
+ | 4.1284 | 900 | 0.1327 | 0.2724 | 0.7942 |
1308
+ | 4.5872 | 1000 | - | 0.2670 | 0.8007 |
1309
+ | 5.0 | 1090 | - | - | 0.5292 |
1310
+ | 0.1497 | 100 | - | 0.4254 | 0.5464 |
1311
+ | 0.2994 | 200 | - | 0.3918 | 0.5718 |
1312
+ | 0.4491 | 300 | 0.3988 | 0.3853 | 0.5670 |
1313
+ | 0.5988 | 400 | - | 0.3670 | 0.5780 |
1314
+ | 0.7485 | 500 | - | 0.3630 | 0.5954 |
1315
+ | 0.8982 | 600 | 0.3577 | 0.3551 | 0.6197 |
1316
+ | 1.0479 | 700 | - | 0.3463 | 0.6320 |
1317
+ | 1.1976 | 800 | - | 0.3362 | 0.6455 |
1318
+ | 1.3473 | 900 | 0.3092 | 0.3547 | 0.6496 |
1319
+ | 1.4970 | 1000 | - | 0.3403 | 0.6502 |
1320
+ | 1.6467 | 1100 | - | 0.3418 | 0.6614 |
1321
+ | 1.7964 | 1200 | 0.2901 | 0.3367 | 0.6781 |
1322
+ | 1.9461 | 1300 | - | 0.3283 | 0.6939 |
1323
+ | 2.0958 | 1400 | - | 0.3266 | 0.7053 |
1324
+ | 2.2455 | 1500 | 0.2627 | 0.3275 | 0.7074 |
1325
+ | 2.3952 | 1600 | - | 0.3174 | 0.6976 |
1326
+ | 2.5449 | 1700 | - | 0.3275 | 0.7037 |
1327
+ | 2.6946 | 1800 | 0.2319 | 0.3094 | 0.7086 |
1328
+ | 2.8443 | 1900 | - | 0.3184 | 0.7118 |
1329
+ | 2.9940 | 2000 | - | 0.3195 | 0.7076 |
1330
+ | 3.1437 | 2100 | 0.2222 | 0.3225 | 0.7178 |
1331
+ | 3.2934 | 2200 | - | 0.3214 | 0.7184 |
1332
+ | 3.4431 | 2300 | - | 0.3170 | 0.7270 |
1333
+ | 3.5928 | 2400 | 0.188 | 0.3236 | 0.7269 |
1334
+ | 3.7425 | 2500 | - | 0.3174 | 0.7345 |
1335
+ | 3.8922 | 2600 | - | 0.3196 | 0.7365 |
1336
+ | 4.0419 | 2700 | 0.1877 | 0.3174 | 0.7394 |
1337
+ | 4.1916 | 2800 | - | 0.3195 | 0.7355 |
1338
+ | 4.3413 | 2900 | - | 0.3207 | 0.7373 |
1339
+ | 4.4910 | 3000 | 0.1582 | 0.3274 | 0.7349 |
1340
+ | 4.6407 | 3100 | - | 0.3252 | 0.7350 |
1341
+ | 4.7904 | 3200 | - | 0.3210 | 0.7393 |
1342
+ | 4.9401 | 3300 | 0.1612 | 0.3205 | 0.7386 |
1343
+ | 5.0 | 3340 | - | - | 0.8142 |
1344
+ | 0.1497 | 100 | - | 0.2197 | 0.8248 |
1345
+ | 0.2994 | 200 | - | 0.2117 | 0.8303 |
1346
+ | 0.4491 | 300 | 0.2456 | 0.2299 | 0.8156 |
1347
+ | 0.5988 | 400 | - | 0.2219 | 0.8113 |
1348
+ | 0.7485 | 500 | - | 0.2149 | 0.8231 |
1349
+ | 0.8982 | 600 | 0.2397 | 0.2110 | 0.8354 |
1350
+ | 1.0479 | 700 | - | 0.2069 | 0.8479 |
1351
+ | 1.1976 | 800 | - | 0.2070 | 0.8465 |
1352
+ | 1.3473 | 900 | 0.1956 | 0.2046 | 0.8445 |
1353
+ | 1.4970 | 1000 | - | 0.2070 | 0.8412 |
1354
+ | 1.6467 | 1100 | - | 0.2001 | 0.8453 |
1355
+ | 1.7964 | 1200 | 0.185 | 0.1970 | 0.8473 |
1356
+ | 1.9461 | 1300 | - | 0.1904 | 0.8491 |
1357
+ | 2.0958 | 1400 | - | 0.1864 | 0.8691 |
1358
+ | 2.2455 | 1500 | 0.1537 | 0.1916 | 0.8570 |
1359
+ | 2.3952 | 1600 | - | 0.1886 | 0.8740 |
1360
+ | 2.5449 | 1700 | - | 0.1827 | 0.8770 |
1361
+ | 2.6946 | 1800 | 0.1363 | 0.1771 | 0.8798 |
1362
+ | 2.8443 | 1900 | - | 0.1768 | 0.8862 |
1363
+ | 2.9940 | 2000 | - | 0.1799 | 0.8912 |
1364
+ | 3.1437 | 2100 | 0.1276 | 0.1785 | 0.8838 |
1365
+ | 3.2934 | 2200 | - | 0.1772 | 0.8803 |
1366
+ | 3.4431 | 2300 | - | 0.1819 | 0.8801 |
1367
+ | 3.5928 | 2400 | 0.1048 | 0.1763 | 0.8820 |
1368
+ | 3.7425 | 2500 | - | 0.1782 | 0.8880 |
1369
+ | 3.8922 | 2600 | - | 0.1784 | 0.8833 |
1370
+ | 4.0419 | 2700 | 0.1017 | 0.1777 | 0.8885 |
1371
+ | 4.1916 | 2800 | - | 0.1805 | 0.8901 |
1372
+ | 4.3413 | 2900 | - | 0.1756 | 0.8911 |
1373
+ | 4.4910 | 3000 | 0.0853 | 0.1781 | 0.8895 |
1374
+ | 4.6407 | 3100 | - | 0.1784 | 0.8869 |
1375
+ | 4.7904 | 3200 | - | 0.1775 | 0.8879 |
1376
+ | 4.9401 | 3300 | 0.0854 | 0.1766 | 0.8883 |
1377
+ | 5.0 | 3340 | - | - | 0.8886 |
1378
+
1379
+ </details>
1380
+
1381
+ ### Framework Versions
1382
+ - Python: 3.10.12
1383
+ - Sentence Transformers: 3.0.1
1384
+ - Transformers: 4.42.4
1385
+ - PyTorch: 2.3.1+cu121
1386
+ - Accelerate: 0.32.1
1387
+ - Datasets: 2.21.0
1388
+ - Tokenizers: 0.19.1
1389
+
1390
+ ## Citation
1391
+
1392
+ ### BibTeX
1393
+
1394
+ #### Sentence Transformers and SoftmaxLoss
1395
+ ```bibtex
1396
+ @inproceedings{reimers-2019-sentence-bert,
1397
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1398
+ author = "Reimers, Nils and Gurevych, Iryna",
1399
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1400
+ month = "11",
1401
+ year = "2019",
1402
+ publisher = "Association for Computational Linguistics",
1403
+ url = "https://arxiv.org/abs/1908.10084",
1404
+ }
1405
+ ```
1406
+
1407
+ <!--
1408
+ ## Glossary
1409
+
1410
+ *Clearly define terms in order to be accessible across audiences.*
1411
+ -->
1412
+
1413
+ <!--
1414
+ ## Model Card Authors
1415
+
1416
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1417
+ -->
1418
+
1419
+ <!--
1420
+ ## Model Card Contact
1421
+
1422
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1423
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.42.4",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 250037
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.42.4",
5
+ "pytorch": "2.3.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8530c796f322036a36ca149387ca547499f65a24358b486906cbd4e62c167000
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
runs/Sep03_13-14-29_1b070c43baca/events.out.tfevents.1725369276.1b070c43baca.7074.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d6bf9c35f5564a57dcf90a2c3320cf793cb0025f22fd7fa4ce36ef06300e1b1b
3
+ size 72174
runs/Sep03_15-20-08_1b070c43baca/events.out.tfevents.1725376809.1b070c43baca.7074.2 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f73f0822dd7891fca6fc95ab3458200cd45bc332e21baea1768df701a5f16c81
3
+ size 4378
runs/Sep03_15-20-30_1b070c43baca/events.out.tfevents.1725376831.1b070c43baca.7074.3 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fffac1be3c5547d2737a65d1f0ef32721dfbdc016d364690df50616ca2311835
3
+ size 28734
runs/Sep03_15-20-30_1b070c43baca/events.out.tfevents.1725376968.1b070c43baca.7074.4 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9da5db292b0c1de0a1401ab60a7ac110ffe0975986e90d7e0d10f723101e0b55
3
+ size 28734
runs/Sep03_15-47-55_1b070c43baca/events.out.tfevents.1725378477.1b070c43baca.7074.5 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6990fe90cde49c83aa927092578439ad6d7796e66b099ac68862d5ee750383b1
3
+ size 84265
runs/Sep03_15-59-29_1b070c43baca/events.out.tfevents.1725379171.1b070c43baca.7074.6 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cd823319f002eca890f01b3aa7030b407bacde1a2e6ea1d13e6dfdee49391e33
3
+ size 84265
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,64 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "mask_token": "<mask>",
50
+ "max_length": 128,
51
+ "model_max_length": 128,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "strip_accents": null,
59
+ "tokenize_chinese_chars": true,
60
+ "tokenizer_class": "BertTokenizer",
61
+ "truncation_side": "right",
62
+ "truncation_strategy": "longest_first",
63
+ "unk_token": "<unk>"
64
+ }
training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:38185a65ed6da1e33192bf3f86236947a2700b34e505e13db74ee4dc9eb902eb
3
+ size 5560
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260