alina0195 commited on
Commit
5a59ec3
·
verified ·
1 Parent(s): 679d593

Add Romanian RoBERT retriever (checkpoint-9000, lr=8e-5, MSMARCO-ro).

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,622 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:11661069
9
+ - loss:MatryoshkaLoss
10
+ - loss:CachedMultipleNegativesRankingLoss
11
+ base_model: readerbench/RoBERT-large
12
+ widget:
13
+ - source_sentence: Populația orașului Mirabel din Canada
14
+ sentences:
15
+ - "Mustique (pronunțat /mÊCVstiË\x90k/) este o insulă privată mică, care face parte\
16
+ \ din Sf. Vincent și Grenadinele. Insula este una dintre insulele numite Grenadinele,\
17
+ \ majoritatea aflate în Sf. Vincent și Grenadinele, în Indiile de Vest. Insula\
18
+ \ se află în Parohia Grenadinele, o zonă administrativă a țării. Istoria insulei\
19
+ \ Mustique și a insulelor Grenadine în general datează din secolul al XV-lea,\
20
+ \ când marinari spanioli au zărit pentru prima oară acest grup de mici insule\
21
+ \ stâncoase și le-au botezat Los Pajaros (păsări), deoarece semănau cu un mic\
22
+ \ cârd de păsări care zboară deasupra mării."
23
+ - La momentul recensământului din 2006, Mirabel avea o populație de 34.626 de locuitori.
24
+ Populația din Mirabel reprezintă 0,46% din totalul populației Quebec-ului (care
25
+ număra 7.546,131 de locuitori la acel moment). Cu o populație de 34.626 de locuitori
26
+ în 2006, cea a Mirabel a crescut cu 26,77% față de recensământul din 2001 (care
27
+ a numărat 27.315 de locuitori).
28
+ - Montreal, Quebec, încorporat ca oraș în 1832, are o populație de 1.704.694 (conform
29
+ recensământului din 2016) și 1.649.519 (conform recensământului din 2011). Montreal
30
+ este al doilea oraș al Canadei ca mărime și găzduiește aproape jumătate din populația
31
+ provinciei Quebec. Este metropola provinciei și a fost cel mai populat oraș din
32
+ Canada timp de un secol și jumătate.
33
+ - source_sentence: Ce este vaccinul Havrix?
34
+ sentences:
35
+ - HAVRIX este un vaccin indicat pentru imunizarea activă împotriva bolilor cauzate
36
+ de virusul hepatitei A (HAV). HAVRIX este aprobat pentru utilizare la persoanele
37
+ cu vârste de 12 luni și peste. Imunizarea primară trebuie administrată cu cel
38
+ puțin 2 săptămâni înainte de expunerea preconizată la HAV. (1)
39
+ - Vezi toate rezultatele pentru ceasul inteligent Garmin. 1 Garmin vivoactive Black.
40
+ 2 Garmin Vivoactive HR GPS Smart Watch, potrivire obișnuită - Negru (Certificat
41
+ recondiționat) de Garmin. 3 Garmin Fenix 3 HR, Gri. Amazon's Choice recomandă
42
+ produse de înaltă calitate și la prețuri accesibile, disponibile spre livrare
43
+ imediată. Garmin vivoactive HR GPS Smart Watch, potrivire obișnuită - Negru.
44
+ - Vaccinul se administrează sub formă de injecție în mușchiul deltoid al brațului.
45
+ Atât vaccinul Havrix, cât și cel Vaqta oferă o protecție eficientă împotriva hepatitei
46
+ A. Există și un vaccin combinat, numit vaccinul hepatita B-hepatita A (Twinrix),
47
+ care protejează atât împotriva hepatitei A, cât și a celei B.
48
+ - source_sentence: Orele de funcționare ale Rockwall
49
+ sentences:
50
+ - Rockwall County Helping Hands este principalul furnizor de servicii sociale pentru
51
+ locuitorii comitatului Rockwall. De peste 40 de ani, agenția a adus o schimbare
52
+ în viețile locuitorilor comitatului Rockwall. Citește mai mult.
53
+ - 'Magazinul din apropiere: 1 Best Buy - Rockwall Program de lucru: 10:00 - 22:00
54
+ (la 0,5 mile distanță) 2 Walmart - Interstate 30 Program de lucru: 24 de ore (la
55
+ 1,4 mile distanță) 3 RadioShack - Rockwall Rockwall Village Program de lucru:
56
+ 10:00 - 21:00 (la 1,7 mile distanță) 4 Lowe''s - Rockwall Program de lucru: 06:00
57
+ - 22:00 (la 1,8 mile distanță) 5 Kroger - Rockwall Program de lucru: 06:00 - 01:00
58
+ (la 2,0 mile distanță)'
59
+ - 'Definiția pe care o dă studentul pentru CURS. [număr] 1. : o discuție sau un
60
+ discurs adresat unui grup de oameni cu scopul de a-i învăța despre un anumit subiect.
61
+ o prelegere despre/privind politica. Ea plănuiește să susțină o serie de prelegeri
62
+ despre artă modernă. Se așteaptă ca câteva sute de persoane să participe la prelegere.'
63
+ - source_sentence: Unde este centrul de imagistică UCSD?
64
+ sentences:
65
+ - Centrul de imagistică avansată din La Jolla. Pe 3 februarie 2008, Departamentul
66
+ de Radiologie al UC San Diego a deschis un nou centru de imagistică prin rezonanță
67
+ magnetică (IRM) în La Jolla. Noul centru, botezat UCSD Imaging Center at La Jolla,
68
+ este deschis publicului și oferă acces la corpul profesoral de radioterapie de
69
+ renume mondial al universității.
70
+ - DK este o grosime a firelor din Marea Britanie (și poate Australia, dar nu sunt
71
+ sigur de asta)... Grosimea DK sau cea a firelor duble este mai groasă decât cea
72
+ a firelor sport și mai subțire decât cea a firelor grobiene. Iată intervalele
73
+ de grosime pentru o mostră de 4 ochiuri pe rând. Numărul de ochiuri reprezintă
74
+ numărul de ochiuri pe o lungime de 4 inci.
75
+ - Baptist M&S Imaging deschide un nou centru în Schertz. Baptist M&S Imaging va
76
+ deschide al zecelea centru în decembrie, în Schertz. Centrul va oferi medicilor
77
+ și rezidenților o gamă completă de servicii medicale radiologice în partea de
78
+ nord-est a orașului, inclusiv tehnologie de imagistică care nu se poate găsi în
79
+ niciun alt loc din San Antonio.
80
+ - source_sentence: La ce folosește testarea genotipică a microsateliților?
81
+ sentences:
82
+ - Creare pe desktop. 1 Faceți clic pe Registru în partea superioară a oricărei pagini
83
+ Walmart.com. 2 Faceți clic pe Creați sub Registru pentru bebeluși sau Registru
84
+ pentru nuntă. 3 Introduceți informațiile solicitate și faceți clic pe Continuare.
85
+ 4 Dacă vi se solicită, conectați-vă sau creați un cont. 5 Ați terminat! 6 După
86
+ ce găsiți un articol pe care doriți să-l adăugați, faceți clic pe Adăugați la
87
+ registru și articolul va fi adăugat.
88
+ - Microsateliții sunt adesea numiți repetiții tandem scurte (STR) de către geneticații
89
+ medico-legiști sau repetiții de secvență simple (SSR) de către geneticații de
90
+ plante. Aceștia sunt folosiți pe scară largă pentru profilarea ADN-ului în analiza
91
+ de rudenie și identificarea medico-legală. Microsatelitul este o secvență de ADN
92
+ repetitiv în care anumite motive de ADN (cu o lungime cuprinsă între 2 și 5 perechi
93
+ de baze) sunt repetate de obicei de 5-50 de ori.
94
+ - Genotiparea micro-satelitilor se referă la genotiparea repetitiilor tandem, precum
95
+ repetitiile scurte în tandem (STR) sau repetitiile nucleotidice variabile în tandem
96
+ (VNTR), care sunt loci de ADN polimorfice prezente pe tot genomul. Genotiparea
97
+ micro-satelitilor este un instrument larg acceptat pentru o varietate de aplicații,
98
+ inclusiv studii de cartografiere a legaturilor, studii de asociere și identificarea
99
+ organismelor. Chimia cu cinci coloranți a companiei Applied Biosystems crește
100
+ numărul de markeri micro-satelit pe care îi poate procesa un singur capilar, permițând
101
+ o productivitate sporită. Figura 1 prezintă un exemplu de 18 loci micro-satelit
102
+ co-electroforezați într-un singur capilar. Chimia cu cinci coloranți a companiei
103
+ Applied Biosystems crește numărul de markeri micro-satelit pe care îi poate procesa
104
+ un singur capilar, permițând o productivitate sporită. Figura 1 prezintă un exemplu
105
+ de 18 loci micro-satelit co-electroforezați într-un singur capilar.
106
+ pipeline_tag: sentence-similarity
107
+ library_name: sentence-transformers
108
+ metrics:
109
+ - cosine_accuracy
110
+ model-index:
111
+ - name: SentenceTransformer based on readerbench/RoBERT-large
112
+ results:
113
+ - task:
114
+ type: triplet
115
+ name: Triplet
116
+ dataset:
117
+ name: msmarco ro dev
118
+ type: msmarco-ro-dev
119
+ metrics:
120
+ - type: cosine_accuracy
121
+ value: 0.9919999837875366
122
+ name: Cosine Accuracy
123
+ ---
124
+
125
+ # SentenceTransformer based on readerbench/RoBERT-large
126
+
127
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [readerbench/RoBERT-large](https://huggingface.co/readerbench/RoBERT-large). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
128
+
129
+ ## Model Details
130
+
131
+ ### Model Description
132
+ - **Model Type:** Sentence Transformer
133
+ - **Base model:** [readerbench/RoBERT-large](https://huggingface.co/readerbench/RoBERT-large) <!-- at revision 9f2fc51ef80ff16fbf03ce3e940364be87f0e9a2 -->
134
+ - **Maximum Sequence Length:** 512 tokens
135
+ - **Output Dimensionality:** 1024 dimensions
136
+ - **Similarity Function:** Cosine Similarity
137
+ <!-- - **Training Dataset:** Unknown -->
138
+ <!-- - **Language:** Unknown -->
139
+ <!-- - **License:** Unknown -->
140
+
141
+ ### Model Sources
142
+
143
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
144
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
145
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
146
+
147
+ ### Full Model Architecture
148
+
149
+ ```
150
+ SentenceTransformer(
151
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'BertModel'})
152
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
153
+ )
154
+ ```
155
+
156
+ ## Usage
157
+
158
+ ### Direct Usage (Sentence Transformers)
159
+
160
+ First install the Sentence Transformers library:
161
+
162
+ ```bash
163
+ pip install -U sentence-transformers
164
+ ```
165
+
166
+ Then you can load this model and run inference.
167
+ ```python
168
+ from sentence_transformers import SentenceTransformer
169
+
170
+ # Download from the 🤗 Hub
171
+ model = SentenceTransformer("alina0195/robert-retriever")
172
+ # Run inference
173
+ sentences = [
174
+ 'La ce folosește testarea genotipică a microsateliților?',
175
+ 'Genotiparea micro-satelitilor se referă la genotiparea repetitiilor tandem, precum repetitiile scurte în tandem (STR) sau repetitiile nucleotidice variabile în tandem (VNTR), care sunt loci de ADN polimorfice prezente pe tot genomul. Genotiparea micro-satelitilor este un instrument larg acceptat pentru o varietate de aplicații, inclusiv studii de cartografiere a legaturilor, studii de asociere și identificarea organismelor. Chimia cu cinci coloranți a companiei Applied Biosystems crește numărul de markeri micro-satelit pe care îi poate procesa un singur capilar, permițând o productivitate sporită. Figura 1 prezintă un exemplu de 18 loci micro-satelit co-electroforezați într-un singur capilar. Chimia cu cinci coloranți a companiei Applied Biosystems crește numărul de markeri micro-satelit pe care îi poate procesa un singur capilar, permițând o productivitate sporită. Figura 1 prezintă un exemplu de 18 loci micro-satelit co-electroforezați într-un singur capilar.',
176
+ 'Microsateliții sunt adesea numiți repetiții tandem scurte (STR) de către geneticații medico-legiști sau repetiții de secvență simple (SSR) de către geneticații de plante. Aceștia sunt folosiți pe scară largă pentru profilarea ADN-ului în analiza de rudenie și identificarea medico-legală. Microsatelitul este o secvență de ADN repetitiv în care anumite motive de ADN (cu o lungime cuprinsă între 2 și 5 perechi de baze) sunt repetate de obicei de 5-50 de ori.',
177
+ ]
178
+ embeddings = model.encode(sentences)
179
+ print(embeddings.shape)
180
+ # [3, 1024]
181
+
182
+ # Get the similarity scores for the embeddings
183
+ similarities = model.similarity(embeddings, embeddings)
184
+ print(similarities)
185
+ # tensor([[1.0000, 0.7074, 0.6925],
186
+ # [0.7074, 1.0000, 0.6709],
187
+ # [0.6925, 0.6709, 1.0000]])
188
+ ```
189
+
190
+ <!--
191
+ ### Direct Usage (Transformers)
192
+
193
+ <details><summary>Click to see the direct usage in Transformers</summary>
194
+
195
+ </details>
196
+ -->
197
+
198
+ <!--
199
+ ### Downstream Usage (Sentence Transformers)
200
+
201
+ You can finetune this model on your own dataset.
202
+
203
+ <details><summary>Click to expand</summary>
204
+
205
+ </details>
206
+ -->
207
+
208
+ <!--
209
+ ### Out-of-Scope Use
210
+
211
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
212
+ -->
213
+
214
+ ## Evaluation
215
+
216
+ ### Metrics
217
+
218
+ #### Triplet
219
+
220
+ * Dataset: `msmarco-ro-dev`
221
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
222
+
223
+ | Metric | Value |
224
+ |:--------------------|:----------|
225
+ | **cosine_accuracy** | **0.992** |
226
+
227
+ <!--
228
+ ## Bias, Risks and Limitations
229
+
230
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
231
+ -->
232
+
233
+ <!--
234
+ ### Recommendations
235
+
236
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
237
+ -->
238
+
239
+ ## Training Details
240
+
241
+ ### Training Dataset
242
+
243
+ #### Unnamed Dataset
244
+
245
+ * Size: 11,661,069 training samples
246
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
247
+ * Approximate statistics based on the first 1000 samples:
248
+ | | anchor | positive | negative |
249
+ |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
250
+ | type | string | string | string |
251
+ | details | <ul><li>min: 5 tokens</li><li>mean: 12.14 tokens</li><li>max: 68 tokens</li></ul> | <ul><li>min: 20 tokens</li><li>mean: 96.27 tokens</li><li>max: 489 tokens</li></ul> | <ul><li>min: 25 tokens</li><li>mean: 97.06 tokens</li><li>max: 249 tokens</li></ul> |
252
+ * Samples:
253
+ | anchor | positive | negative |
254
+ |:----------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
255
+ | <code>Adresa ipotecii bancare americane</code> | <code>US BANK HOME MORTGAGE se află în comitatul Daviess, la adresa 4801 Frederica St., Owensboro, KY 42301-7441. Ne puteți contacta la numărul de telefon (270) 689-7000.</code> | <code>Sucursala Pueblo a U.S. Bank este una dintre cele 3086 de sucursale ale băncii și deservește nevoile financiare ale clienților din Pueblo, comitatul Pueblo, Colorado de peste 45 de ani. Sucursala Pueblo se află la adresa 3330 North Elizabeth Street, Pueblo. De asemenea, puteți contacta banca sunând la numărul de telefon al sucursalei, care este 719-543-6257. Sucursala Pueblo a U.S. Bank operează ca un birou cu servicii complete. Pentru programul de lucru al biroului, programul de servicii drive-through și serviciile bancare online, vă rugăm să vizitați site-ul oficial al ...</code> |
256
+ | <code>Ce sunt benzile de respirație Colgate?</code> | <code>Ingrijire dentară. Sunteți în căutarea unui plus de albire a dinților? Pasta de dinți Colgate MaxWhite cu Mini-Bright Strips este o pastă de dinți pe care ar fi bine să o luați în considerare dacă vreți să vă albiți zâmbetul prin îndepărtarea petelor de cafea, ceai, tutun sau alți factori de pătare externi.</code> | <code>Colgate are o nouă pastă de dinți spumantă. Pun pariu că are o concentrație mare de SLS pentru a produce spumă. Am folosit-o și acum am o rană persistentă pe vârful limbii. Am crezut că mănânc prea multe dulciuri, dar voi încerca să elimin această nouă pastă de dinți.</code> |
257
+ | <code>Definiția grupului Michelin</code> | <code>Michelin, liderul în producția de anvelope, se dedică sporirii mobilității clienților în mod sustenabil; proiectarea și distribuirea anvelopelor, serviciilor și soluțiilor cele mai potrivite pentru nevoile clienților; furnizarea de servicii digitale, hărți și ghiduri care să contribuie la îmbogățirea excursiilor și a călătoriei, transformându-le în experiențe unice; dezvoltarea de materiale de înaltă tehnologie, care să deserbească industria mobilității.</code> | <code>Aceste stele sunt râvnite, deoarece marea majoritate a restaurantelor nu primesc nicio stea. De exemplu, ghidul Michelin pentru Chicago pe 2014 include aproape 500 de restaurante. Un singur restaurant a primit trei stele, patru restaurante au primit două stele, iar 20 de restaurante au primit o stea. Michelin nu folosește recenzii ale clienților pentru a determina clasamentul restaurantelor. Stelele Michelin sunt acordate de la 0 la 3 stele, în funcție de recenzii anonime. Recenzorii se concentrează pe calitate, măiestrie tehnică, personalitate și consecvență în ceea ce privește mâncarea.</code> |
258
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
259
+ ```json
260
+ {
261
+ "loss": "CachedMultipleNegativesRankingLoss",
262
+ "matryoshka_dims": [
263
+ 768,
264
+ 512,
265
+ 256,
266
+ 128,
267
+ 64
268
+ ],
269
+ "matryoshka_weights": [
270
+ 1,
271
+ 1,
272
+ 1,
273
+ 1,
274
+ 1
275
+ ],
276
+ "n_dims_per_step": -1
277
+ }
278
+ ```
279
+
280
+ ### Evaluation Dataset
281
+
282
+ #### Unnamed Dataset
283
+
284
+ * Size: 1,000 evaluation samples
285
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
286
+ * Approximate statistics based on the first 1000 samples:
287
+ | | anchor | positive | negative |
288
+ |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
289
+ | type | string | string | string |
290
+ | details | <ul><li>min: 4 tokens</li><li>mean: 11.91 tokens</li><li>max: 33 tokens</li></ul> | <ul><li>min: 17 tokens</li><li>mean: 96.57 tokens</li><li>max: 258 tokens</li></ul> | <ul><li>min: 21 tokens</li><li>mean: 94.78 tokens</li><li>max: 371 tokens</li></ul> |
291
+ * Samples:
292
+ | anchor | positive | negative |
293
+ |:--------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
294
+ | <code>Cine a scris cântecul „Remember When” de Alan Jackson?</code> | <code>„Remember When (cântecul lui Alan Jackson)” este o melodie compusă și înregistrată de artistul american de muzică country Alan Jackson. Lansată în octombrie 2003 ca al doilea și ultimul single de pe albumul său de compilații, Greatest Hits Volume II, a petrecut două săptămâni pe locul 1 în topul Billboard Hot Country Songs din SUA în februarie 2004 și a atins apogeul la locul 29 în topul Billboard Hot 100.</code> | <code>Cântecul a fost compus de Bill Mack. Mack a compus cântecul 30 de ani mai devreme pentru a fi înregistrat de Patsy Cline, însă aceasta a decedat într-un accident de avion înainte să înregistreze cântecul.</code> |
295
+ | <code>sinonim simultan al concurentului</code> | <code>concomitent (adjectiv) co-activ, coincident, combinat, concert, cooperant, sincron, sinergic, unit. simultan (adjectiv) însoțitor, coeval, concomitent, contemporan, simultan. Alte sinonime: accesoriu, accidental, accidental,</code> | <code>care au loc concomitent; care coincid în timp; contemporane; simultane. 2. care se desfășoară cu aceeași viteză și exact împreună; care se repetă împreună. 3. Fizică, electricitate. care au aceeași frecvență și o diferență de fază nulă.</code> |
296
+ | <code>Comisioanele pentru cardurile de debit Visa NatWest în străinătate</code> | <code>Consulteți ghidul nostru de cheltuire în străinătate pentru a afla care sunt cele mai bune opțiuni. Începând cu 1 iunie, clienții care folosesc cardurile de debit NatWest sau RBS în străinătate vor plăti 2,75% din valoarea tranzacției sau 1%, oricare dintre acestea este mai mare. În prezent, clienții plătesc o taxă de 1,25%, plus 2,75% din valoarea tranzacției de fiecare dată când fac plăți în străinătate.</code> | <code>1 Taxa de autorizare - Dacă cererea dumneavoastră este aprobată și primiți autorizația de a călători în Statele Unite în cadrul Programului de renunțare la viză, o taxă suplimentară de 10,00 USD va fi percepută pe cardul dumneavoastră de credit.</code> |
297
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
298
+ ```json
299
+ {
300
+ "loss": "CachedMultipleNegativesRankingLoss",
301
+ "matryoshka_dims": [
302
+ 768,
303
+ 512,
304
+ 256,
305
+ 128,
306
+ 64
307
+ ],
308
+ "matryoshka_weights": [
309
+ 1,
310
+ 1,
311
+ 1,
312
+ 1,
313
+ 1
314
+ ],
315
+ "n_dims_per_step": -1
316
+ }
317
+ ```
318
+
319
+ ### Training Hyperparameters
320
+ #### Non-Default Hyperparameters
321
+
322
+ - `eval_strategy`: steps
323
+ - `per_device_train_batch_size`: 16
324
+ - `per_device_eval_batch_size`: 16
325
+ - `gradient_accumulation_steps`: 32
326
+ - `learning_rate`: 8e-05
327
+ - `warmup_ratio`: 0.1
328
+ - `bf16`: True
329
+ - `dataloader_num_workers`: 4
330
+ - `load_best_model_at_end`: True
331
+ - `ddp_find_unused_parameters`: False
332
+ - `dataloader_persistent_workers`: True
333
+ - `gradient_checkpointing`: True
334
+ - `batch_sampler`: no_duplicates
335
+
336
+ #### All Hyperparameters
337
+ <details><summary>Click to expand</summary>
338
+
339
+ - `overwrite_output_dir`: False
340
+ - `do_predict`: False
341
+ - `eval_strategy`: steps
342
+ - `prediction_loss_only`: True
343
+ - `per_device_train_batch_size`: 16
344
+ - `per_device_eval_batch_size`: 16
345
+ - `per_gpu_train_batch_size`: None
346
+ - `per_gpu_eval_batch_size`: None
347
+ - `gradient_accumulation_steps`: 32
348
+ - `eval_accumulation_steps`: None
349
+ - `torch_empty_cache_steps`: None
350
+ - `learning_rate`: 8e-05
351
+ - `weight_decay`: 0.0
352
+ - `adam_beta1`: 0.9
353
+ - `adam_beta2`: 0.999
354
+ - `adam_epsilon`: 1e-08
355
+ - `max_grad_norm`: 1.0
356
+ - `num_train_epochs`: 3
357
+ - `max_steps`: -1
358
+ - `lr_scheduler_type`: linear
359
+ - `lr_scheduler_kwargs`: {}
360
+ - `warmup_ratio`: 0.1
361
+ - `warmup_steps`: 0
362
+ - `log_level`: passive
363
+ - `log_level_replica`: warning
364
+ - `log_on_each_node`: True
365
+ - `logging_nan_inf_filter`: True
366
+ - `save_safetensors`: True
367
+ - `save_on_each_node`: False
368
+ - `save_only_model`: False
369
+ - `restore_callback_states_from_checkpoint`: False
370
+ - `no_cuda`: False
371
+ - `use_cpu`: False
372
+ - `use_mps_device`: False
373
+ - `seed`: 42
374
+ - `data_seed`: None
375
+ - `jit_mode_eval`: False
376
+ - `use_ipex`: False
377
+ - `bf16`: True
378
+ - `fp16`: False
379
+ - `fp16_opt_level`: O1
380
+ - `half_precision_backend`: auto
381
+ - `bf16_full_eval`: False
382
+ - `fp16_full_eval`: False
383
+ - `tf32`: None
384
+ - `local_rank`: 0
385
+ - `ddp_backend`: None
386
+ - `tpu_num_cores`: None
387
+ - `tpu_metrics_debug`: False
388
+ - `debug`: []
389
+ - `dataloader_drop_last`: True
390
+ - `dataloader_num_workers`: 4
391
+ - `dataloader_prefetch_factor`: None
392
+ - `past_index`: -1
393
+ - `disable_tqdm`: False
394
+ - `remove_unused_columns`: True
395
+ - `label_names`: None
396
+ - `load_best_model_at_end`: True
397
+ - `ignore_data_skip`: False
398
+ - `fsdp`: []
399
+ - `fsdp_min_num_params`: 0
400
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
401
+ - `fsdp_transformer_layer_cls_to_wrap`: None
402
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
403
+ - `parallelism_config`: None
404
+ - `deepspeed`: None
405
+ - `label_smoothing_factor`: 0.0
406
+ - `optim`: adamw_torch_fused
407
+ - `optim_args`: None
408
+ - `adafactor`: False
409
+ - `group_by_length`: False
410
+ - `length_column_name`: length
411
+ - `ddp_find_unused_parameters`: False
412
+ - `ddp_bucket_cap_mb`: None
413
+ - `ddp_broadcast_buffers`: False
414
+ - `dataloader_pin_memory`: True
415
+ - `dataloader_persistent_workers`: True
416
+ - `skip_memory_metrics`: True
417
+ - `use_legacy_prediction_loop`: False
418
+ - `push_to_hub`: False
419
+ - `resume_from_checkpoint`: None
420
+ - `hub_model_id`: None
421
+ - `hub_strategy`: every_save
422
+ - `hub_private_repo`: None
423
+ - `hub_always_push`: False
424
+ - `hub_revision`: None
425
+ - `gradient_checkpointing`: True
426
+ - `gradient_checkpointing_kwargs`: None
427
+ - `include_inputs_for_metrics`: False
428
+ - `include_for_metrics`: []
429
+ - `eval_do_concat_batches`: True
430
+ - `fp16_backend`: auto
431
+ - `push_to_hub_model_id`: None
432
+ - `push_to_hub_organization`: None
433
+ - `mp_parameters`:
434
+ - `auto_find_batch_size`: False
435
+ - `full_determinism`: False
436
+ - `torchdynamo`: None
437
+ - `ray_scope`: last
438
+ - `ddp_timeout`: 1800
439
+ - `torch_compile`: False
440
+ - `torch_compile_backend`: None
441
+ - `torch_compile_mode`: None
442
+ - `include_tokens_per_second`: False
443
+ - `include_num_input_tokens_seen`: False
444
+ - `neftune_noise_alpha`: None
445
+ - `optim_target_modules`: None
446
+ - `batch_eval_metrics`: False
447
+ - `eval_on_start`: False
448
+ - `use_liger_kernel`: False
449
+ - `liger_kernel_config`: None
450
+ - `eval_use_gather_object`: False
451
+ - `average_tokens_across_devices`: True
452
+ - `prompts`: None
453
+ - `batch_sampler`: no_duplicates
454
+ - `multi_dataset_batch_sampler`: proportional
455
+ - `router_mapping`: {}
456
+ - `learning_rate_mapping`: {}
457
+
458
+ </details>
459
+
460
+ ### Training Logs
461
+ | Epoch | Step | Training Loss | Validation Loss | msmarco-ro-dev_cosine_accuracy |
462
+ |:------:|:----:|:-------------:|:---------------:|:------------------------------:|
463
+ | -1 | -1 | - | - | 0.6790 |
464
+ | 0.0176 | 100 | 9.0639 | - | - |
465
+ | 0.0351 | 200 | 6.8571 | - | - |
466
+ | 0.0527 | 300 | 3.9617 | - | - |
467
+ | 0.0703 | 400 | 2.9201 | - | - |
468
+ | 0.0878 | 500 | 2.5575 | - | - |
469
+ | 0.1054 | 600 | 2.3349 | - | - |
470
+ | 0.1229 | 700 | 2.1485 | - | - |
471
+ | 0.1405 | 800 | 1.9714 | - | - |
472
+ | 0.1581 | 900 | 1.8504 | - | - |
473
+ | 0.1756 | 1000 | 1.7105 | 1.3991 | 0.9170 |
474
+ | 0.1932 | 1100 | 1.5833 | - | - |
475
+ | 0.2108 | 1200 | 1.4711 | - | - |
476
+ | 0.2283 | 1300 | 1.3995 | - | - |
477
+ | 0.2459 | 1400 | 1.3314 | - | - |
478
+ | 0.2634 | 1500 | 1.2698 | - | - |
479
+ | 0.2810 | 1600 | 1.2108 | - | - |
480
+ | 0.2986 | 1700 | 1.1522 | - | - |
481
+ | 0.3161 | 1800 | 1.1125 | - | - |
482
+ | 0.3337 | 1900 | 1.0224 | - | - |
483
+ | 0.3513 | 2000 | 0.9665 | 0.8378 | 0.9440 |
484
+ | 0.3688 | 2100 | 0.9283 | - | - |
485
+ | 0.3864 | 2200 | 0.8779 | - | - |
486
+ | 0.4039 | 2300 | 0.848 | - | - |
487
+ | 0.4215 | 2400 | 0.7973 | - | - |
488
+ | 0.4391 | 2500 | 0.7679 | - | - |
489
+ | 0.4566 | 2600 | 0.7361 | - | - |
490
+ | 0.4742 | 2700 | 0.7071 | - | - |
491
+ | 0.4918 | 2800 | 0.6764 | - | - |
492
+ | 0.5093 | 2900 | 0.657 | - | - |
493
+ | 0.5269 | 3000 | 0.6395 | 0.5249 | 0.9640 |
494
+ | 0.5444 | 3100 | 0.617 | - | - |
495
+ | 0.5620 | 3200 | 0.5985 | - | - |
496
+ | 0.5796 | 3300 | 0.5818 | - | - |
497
+ | 0.5971 | 3400 | 0.5589 | - | - |
498
+ | 0.6147 | 3500 | 0.5549 | - | - |
499
+ | 0.6323 | 3600 | 0.5391 | - | - |
500
+ | 0.6498 | 3700 | 0.5251 | - | - |
501
+ | 0.6674 | 3800 | 0.5139 | - | - |
502
+ | 0.6849 | 3900 | 0.51 | - | - |
503
+ | 0.7025 | 4000 | 0.4879 | 0.3452 | 0.9820 |
504
+ | 0.7201 | 4100 | 0.4858 | - | - |
505
+ | 0.7376 | 4200 | 0.4774 | - | - |
506
+ | 0.7552 | 4300 | 0.4651 | - | - |
507
+ | 0.7728 | 4400 | 0.4556 | - | - |
508
+ | 0.7903 | 4500 | 0.4477 | - | - |
509
+ | 0.8079 | 4600 | 0.4411 | - | - |
510
+ | 0.8254 | 4700 | 0.4273 | - | - |
511
+ | 0.8430 | 4800 | 0.4251 | - | - |
512
+ | 0.8606 | 4900 | 0.4158 | - | - |
513
+ | 0.8781 | 5000 | 0.405 | 0.2828 | 0.9840 |
514
+ | 0.8957 | 5100 | 0.4052 | - | - |
515
+ | 0.9133 | 5200 | 0.3941 | - | - |
516
+ | 0.9308 | 5300 | 0.3973 | - | - |
517
+ | 0.9484 | 5400 | 0.3867 | - | - |
518
+ | 0.9660 | 5500 | 0.3804 | - | - |
519
+ | 0.9835 | 5600 | 0.3818 | - | - |
520
+ | 1.0011 | 5700 | 0.3721 | - | - |
521
+ | 1.0186 | 5800 | 0.3654 | - | - |
522
+ | 1.0362 | 5900 | 0.3687 | - | - |
523
+ | 1.0537 | 6000 | 0.3608 | 0.2476 | 0.9860 |
524
+ | 1.0713 | 6100 | 0.3566 | - | - |
525
+ | 1.0889 | 6200 | 0.3564 | - | - |
526
+ | 1.1064 | 6300 | 0.3475 | - | - |
527
+ | 1.1240 | 6400 | 0.3432 | - | - |
528
+ | 1.1416 | 6500 | 0.3402 | - | - |
529
+ | 1.1591 | 6600 | 0.3378 | - | - |
530
+ | 1.1767 | 6700 | 0.3296 | - | - |
531
+ | 1.1942 | 6800 | 0.3215 | - | - |
532
+ | 1.2118 | 6900 | 0.3161 | - | - |
533
+ | 1.2294 | 7000 | 0.3106 | 0.2066 | 0.9910 |
534
+ | 1.2469 | 7100 | 0.3068 | - | - |
535
+ | 1.2645 | 7200 | 0.3005 | - | - |
536
+ | 1.2821 | 7300 | 0.2978 | - | - |
537
+ | 1.2996 | 7400 | 0.2845 | - | - |
538
+ | 1.3172 | 7500 | 0.2688 | - | - |
539
+ | 1.3347 | 7600 | 0.267 | - | - |
540
+ | 1.3523 | 7700 | 0.2718 | - | - |
541
+ | 1.3699 | 7800 | 0.2741 | - | - |
542
+ | 1.3874 | 7900 | 0.2724 | - | - |
543
+ | 1.4050 | 8000 | 0.2601 | 0.1884 | 0.9930 |
544
+ | 1.4226 | 8100 | 0.2532 | - | - |
545
+ | 1.4401 | 8200 | 0.2546 | - | - |
546
+ | 1.4577 | 8300 | 0.2539 | - | - |
547
+ | 1.4752 | 8400 | 0.2515 | - | - |
548
+ | 1.4928 | 8500 | 0.2616 | - | - |
549
+ | 1.5104 | 8600 | 0.2514 | - | - |
550
+ | 1.5279 | 8700 | 0.2548 | - | - |
551
+ | 1.5455 | 8800 | 0.2481 | - | - |
552
+ | 1.5631 | 8900 | 0.2521 | - | - |
553
+ | 1.5806 | 9000 | 0.2533 | 0.1815 | 0.9920 |
554
+
555
+
556
+ ### Framework Versions
557
+ - Python: 3.11.13
558
+ - Sentence Transformers: 5.1.1
559
+ - Transformers: 4.56.2
560
+ - PyTorch: 2.9.0+cu128
561
+ - Accelerate: 1.12.0
562
+ - Datasets: 4.4.1
563
+ - Tokenizers: 0.22.1
564
+
565
+ ## Citation
566
+
567
+ ### BibTeX
568
+
569
+ #### Sentence Transformers
570
+ ```bibtex
571
+ @inproceedings{reimers-2019-sentence-bert,
572
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
573
+ author = "Reimers, Nils and Gurevych, Iryna",
574
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
575
+ month = "11",
576
+ year = "2019",
577
+ publisher = "Association for Computational Linguistics",
578
+ url = "https://arxiv.org/abs/1908.10084",
579
+ }
580
+ ```
581
+
582
+ #### MatryoshkaLoss
583
+ ```bibtex
584
+ @misc{kusupati2024matryoshka,
585
+ title={Matryoshka Representation Learning},
586
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
587
+ year={2024},
588
+ eprint={2205.13147},
589
+ archivePrefix={arXiv},
590
+ primaryClass={cs.LG}
591
+ }
592
+ ```
593
+
594
+ #### CachedMultipleNegativesRankingLoss
595
+ ```bibtex
596
+ @misc{gao2021scaling,
597
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
598
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
599
+ year={2021},
600
+ eprint={2101.06983},
601
+ archivePrefix={arXiv},
602
+ primaryClass={cs.LG}
603
+ }
604
+ ```
605
+
606
+ <!--
607
+ ## Glossary
608
+
609
+ *Clearly define terms in order to be accessible across audiences.*
610
+ -->
611
+
612
+ <!--
613
+ ## Model Card Authors
614
+
615
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
616
+ -->
617
+
618
+ <!--
619
+ ## Model Card Contact
620
+
621
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
622
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "do_lower_case": 1,
8
+ "do_remove_accents": 0,
9
+ "dtype": "bfloat16",
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.1,
13
+ "hidden_size": 1024,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 4096,
16
+ "layer_norm_eps": 1e-12,
17
+ "max_position_embeddings": 512,
18
+ "model_type": "bert",
19
+ "num_attention_heads": 16,
20
+ "num_hidden_layers": 24,
21
+ "pad_token_id": 0,
22
+ "position_embedding_type": "absolute",
23
+ "transformers_version": "4.56.2",
24
+ "type_vocab_size": 2,
25
+ "use_cache": true,
26
+ "vocab_size": 37788
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.1.1",
5
+ "transformers": "4.56.2",
6
+ "pytorch": "2.9.0+cu128"
7
+ },
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1a7a91635c2f66c20648db8480bd86d6cf1406180c843d70abc098d46a4c452c
3
+ size 683110192
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "2": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "3": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "4": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "5": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": true,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "model_max_length": 512,
51
+ "never_split": null,
52
+ "pad_token": "[PAD]",
53
+ "sep_token": "[SEP]",
54
+ "strip_accents": false,
55
+ "tokenize_chinese_chars": true,
56
+ "tokenizer_class": "BertTokenizer",
57
+ "unk_token": "[UNK]"
58
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff