cuadron11 commited on
Commit
a0b40d4
·
verified ·
1 Parent(s): 8b9812f

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1185 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:55314
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: intfloat/multilingual-e5-large
11
+ widget:
12
+ - source_sentence: Zer egiten zuen Angelitak larunbatetan?
13
+ sentences:
14
+ - 'Etxebizitzen garestitzeak ez du etenik, salmentak jaitsi arren
15
+
16
+
17
+ Etxebizitzarenak ez du merkatuaren logika ulertzen. Urteko lehen hiruhilekoan
18
+ %3,8 jaitsi da etxeen salerosketa Hego Euskal Herrian, baina, hala ere, horien
19
+ prezioak gora eta gora egiten du etengabe. INE Espainiako Estatistika Institutuak
20
+ gaur argitaratutako datuen arabera, Nafarroan batez beste 2022an baino %7,4 garestiago
21
+ izan dira, eta Araban, Bizkaian eta Gipuzkoan %6,4 garestitu dira.
22
+
23
+
24
+ Igoerak etenik ez duen arren, moteldu egin da etxebizitzen garestitzea. Iaz, antzeko
25
+ mailan igo ziren: %7,3 Nafarroan eta %6,4 beste hiru lurraldeetan.
26
+
27
+
28
+ Etxe berrien prezioa garestitu da gehien: %12.7 Nafarroan, eta %12,3 Araban, Bizkaian
29
+ eta Gipuzkoan. Iaz baino handiagoa izaten ari da igoera. Etxebizitza berriak %10,9
30
+ garestitu ziren iaz Nafarroan, eta %6,1 beste hiru lurraldeetan. Gutxi gorabehera,
31
+ saltzen diren hamarretik bi dira.
32
+
33
+
34
+ Bigarren eskukoetan apalagoa izan da igoera urteko lehen hiruhilekoan. %5 garestitu
35
+ dira Nafarroan, eta %5,1 beste hiru lurraldeetan.
36
+
37
+
38
+ Salerosketa eta hipoteka gutxiago
39
+
40
+
41
+ Urteko lehen hiruhilekoan 747 etxebizitza salerosi dira Hego Euskal Herrian, iaz
42
+ epe berean baino %3,8 gutxiago. Baliteke interes tasa handien eraginez jaitsi
43
+ izana salerosketak, baina ez dute hainbesteko eragina izan prezioen igoeran.
44
+
45
+
46
+ Hamar etxetik bederatzi inguru hipoteka mailegu baten bitartez erosten dira gaur
47
+ egun. Urteko lehen hiruhilekoan, 6.374 hipoteka sinatu ziren, iaz baino %6,7 gutxiago.'
48
+ - 'Eskutitzak ere idazten omen zenituen...
49
+
50
+
51
+ Marokon soldadu zeudenei. Bizilagunen semeei. Izeba Txitak, izeba Panorrak...
52
+ Afrikan zituzten semeak. «Idatzi nire semeari, Angelita, mesedez». Haiek ez baitzekiten
53
+ ez idazten eta ez irakurtzen. Eta nik idazten nien seme haiei, banekielako euren
54
+ amek zer esan nahi zieten. Izan ere, oso gustuko izan dut beti idaztea.
55
+
56
+
57
+ Zein da sukaldaritzarekin lotutako zure lehen oroitzapena?
58
+
59
+
60
+ Ongi gogoan daukat. Astegunetan eskolara joaten nintzen, baina larunbatetan txirikordak
61
+ egitera.
62
+
63
+
64
+ Txirikordak?
65
+
66
+
67
+ Bai, gizona, abarketak egiteko txirikordak. Eta igandetan, txirikordak saltzen
68
+ zituen fabrikako jabearen etxera joaten nintzen, haren seme-alabak zaintzera.
69
+
70
+
71
+ «Bizilagunek ez zekiten idazten eta irakurtzen. Afrikan soldadu zeuden semeei
72
+ nik idazten nizkien eskutitzak»
73
+
74
+
75
+ Zenbat urte zenituen?
76
+
77
+
78
+ 13. Nireak balira bezala zaintzen nituen. Eta etxe hartan ikusi nuen aurreneko
79
+ aldiz sukaldari bat. Zerbitzaria zeukaten, haurtzaina zeukaten, eta sukaldari
80
+ bat! Baina sukaldari txapela eta guzti! Gumersindo zuen izena, baina Misindo deitzen
81
+ genion, laburtzeko. Aingeruak bezala kozinatzen zuen. Eta hari kopiatu nion nire
82
+ lehen errezeta: eperrak eskabetxean. Txunditu egiten ninduen etxe batean sukaldari
83
+ bat ikusteak. Gurean, sutegi bat eta bi ohe baino ez geneuzkan.
84
+
85
+
86
+ Eta hori guztia 13 urterekin?'
87
+ - 'lotsabako
88
+
89
+
90
+ Antzinaroko Greziako pentsalari bat?
91
+
92
+
93
+ Porfirio. Tesia haren inguruan egin nuen; publiko orokorrarentzat ez da hain ezaguna,
94
+ baina oso interesgarria da. Haragia kontsumitzearen aurkako testu bat dauka.
95
+
96
+
97
+ Egungo pentsalari bat?
98
+
99
+
100
+ Carol J. Adams. Ezagutu nuenean, oso originala iruditu zitzaidan; ikuspegia asko
101
+ aldatu zidan, espezismoaren eta feminismoaren arteko loturaz konturatu nintzelako.
102
+
103
+
104
+ Antiespezismoan sartzeko liburu bat?
105
+
106
+
107
+ Feminismotik, Carol J. Adams sarbide ona da. Eta Zoopolis liburua ere oso interesgarria
108
+ da [Sue Donaldson eta Will Kymlicka], batez ere filosofia politikoan interesa
109
+ dutenentzat.'
110
+ - source_sentence: Zein da Basauriko Udalaren jarrera Kalero auzoko sutean kaltetutako
111
+ bizilagunekin?
112
+ sentences:
113
+ - 'UPV/EHU aurrerantzean EHU soilik izango da
114
+
115
+
116
+ Euskal Herriko Unibertsitateak irudi berria izango du. Hauxe aldaketa nagusia:
117
+ aurrerantzean, gaztelerazko siglak kendu, eta EHU baino ez da izango, ez UPV/EHU.
118
+ Eduardo Txillida eskultoreak sortu zuen ikur nagusia, aldiz, mantendu egingo dute,
119
+ EHUren siglekin batera, eta «kolore paleta korporatiboa» gehitu dute, logotipoari
120
+ euskarria emateko.
121
+
122
+
123
+ Errektoretza taldeak gaur aurkeztu du irudi berria gobernu kontseiluan. Aurreratu
124
+ dutenez, bi arrazoi dituzte UPV/EHU izatetik EHU soilik izatera igarotzeko. Bat:
125
+ «Unibertsitatearen irudia berritzea eta aro digitalera egokitzea, sinpleagoa bihurtzea
126
+ eta unibertsitatearen ikurrari garrantzia handiagoa ematea, Euskal Herriko Unibertsitatearen
127
+ oinarria hobeto isla dadin eta identifikagarriagoa izan dadin». Eta bi: izendapen
128
+ bikoitzak eragiten dituen arazoei aurre egitea, eta, batez ere, Valentziako UPV
129
+ Universidad Politecnica de Valenciarekin (Herrialde Katalanak) nahastea saihestea.
130
+ «Era berean, eta ikuspegi teknikoago batetik, izena sinplifikatzeak eta zehar
131
+ marra alboratzeak indexazio akademikoa erraztu dezake», erantsi dute.
132
+
133
+
134
+ Marka berria ekainean aurkeztu asmo dute jendaurrean, Txillida Lekun.
135
+
136
+
137
+ Ordezkoak, lanaldi osoan
138
+
139
+
140
+ Irudiarena ez da gobernu kontseiluko gai bakarra izan: gaur berretsi dute gehiengo
141
+ sindikalarekin hartutako akordioa, datorren ikasturtetik aurrera ordezko irakasleak
142
+ lanaldi osora kontratatu ahal izateko, eta, modu horretan, langile horien lan
143
+ baldintzak hobetzeko. Gaur egun, ia berrehun irakasle ari da lanaldi partzialean
144
+ ordezko gisa lanean.'
145
+ - 'Kalero auzoko Kareaga Goikoa kalean piztu zen sutea, urtarrilaren 31n. Garretatik
146
+ ihes egiteko, pertsona batek eraikinetik jauzi egin zuen, eta hil egin zen. Beste
147
+ lau pertsona erreskatatu zituzten suhiltzaileek. Sutea gertatu eta hiru astera,
148
+ Ertzaintzak mutil bat atxilotu zuen, sute hori sortu izana egotzita. «Nire erraina
149
+ eta bi ilobak erreskatatu behar izan zituzten; suhiltzaileek bizia salbatu zieten»,
150
+ gogoratu du Tamarak —ez du abizenik eman—. Haren semeak etxea galdu du, eta Tamara
151
+ ahal duen guztia egiten ari da hura eta senideak laguntzeko.
152
+
153
+
154
+ «Familiek ez dute dirurik nahi, teilatua bermatua izatea baizik»
155
+
156
+
157
+ PABLO OLIVEROS Batu etxebizitza sindikatuko kidea
158
+
159
+
160
+ «Etxea eta oroitzapen guztiak galdu dituzte, eta hotel bateko logela batean igarotzen
161
+ ari dira trauma, mugitu ezinik, bi haur oso txiki baitituzte», kontatu du Tamarak.
162
+ «Eta, hori gutxi balitz bezala, hoteletik alde egin behar dutela esan diete orain».
163
+ Udalaren jarrera kritikatu du Tamarak, lagundu beharrean «oztopoak jarri besterik
164
+ ez dutelako egiten». «Oharrak ateratzen baditu, zerbait estali nahiko du», salatu
165
+ du.
166
+
167
+
168
+ Joan den astean udalak jakinarazi zuenez, arretarako, informaziorako eta laguntza
169
+ sozialerako leihatila bakarra abiarazi du sutean kaltetutako bizilagunak artatzeko.
170
+ Arreta puntu horren helburua da, besteak beste, erantzun koordinatu eta eraginkorra
171
+ eskaintzea, tramiteak egiten laguntzea, bizikidetza unitateen egoerak aztertzea
172
+ eta laguntza psikosoziala eskaintzea. Lan hori egiteko, enpresa espezializatu
173
+ bat kontratatu dute.
174
+
175
+
176
+ Jakinarazpenik ez'
177
+ - 'Garai hartan, Atahualpa Yupanqui eta David Bowie asko entzuten zituela ere kontatu
178
+ du, zeinak irudiak beste modu batera ikusten lagundu zioten, «modu onirikoago,
179
+ metaforikoago batean». Zoruan zabaldutako kartoizko laukizuzen batek eta sabaitik
180
+ zintzilikatutako pendulu batek osatzen dute, besteak beste, obra. «Pertsona batek
181
+ lo egiteko moduko espazio bat eratu nahi nuen. Bibliako istorio batekin lotzen
182
+ nuen; nola Jakobek lotan dagoen bitartean eskailera batean gora eta behera aingeruak
183
+ ikusten dituen. Irudiaren elementu sinpleak eta poetikotasuna gustatzen zitzaizkidan».
184
+
185
+
186
+ «Eskasiaren ingeniaritza»
187
+
188
+
189
+ Handik ezkerrerantz eginda daude erakusketako obra gehientsuenak. Han daude, esaterako,
190
+ adobez egindako tamaina handiko Chailen eskulturak —Veneziako Bienalean parte
191
+ hartu zuen 2022an, eskultura handien sailarekin—. Irene Isabel (2024) aurkeztu
192
+ du orain, tartean. Amari eta antzinako oinordetzari egindako omenaldi bat da,
193
+ eta 2016an Argentinaren independentziaren bigarren mendeurrenaren harira egindako
194
+ lan baten bertsio bat ere bada. «Argentina Argentina izan aurretik gertatzen zen
195
+ horretan zentratu nintzen, eta nire etxekoen istorioekin —nire amona artisau indigena
196
+ bat izan zen— eta arkeologiarekiko nire pasioekin konektatu nuen berriz».
197
+
198
+
199
+ Gabriel Chaileren Irene Isabel (2024) pieza, Donostiako Tabakaleran. JON URBE
200
+ / FOKU
201
+
202
+
203
+ Segidan datorren lanetako bat da Eskasiaren ingeniaritza (2012), artistak bere
204
+ familiaren, lagunen, auzotarren jokabideak behatuz sortu zuena. Berogailu bat
205
+ da izan, adreilu bat zuzenean korronte elektrikora konektatzean pizten dena. «Asko
206
+ erabiltzen dira muturreko egoeretan, beste baliabiderik izan ez eta elektrizitatea
207
+ lapurtzen duenean batek, adibidez. Espetxeetan ere erabiltzen da, eta aurrekoan
208
+ batek esan zidan hemen bere aitonak ere erabiltzen zuela landa lanetan». Bere
209
+ sormen prozesuekin loturarik ere ikusten dio artistak: «Nire lanean beti dago
210
+ arazoak konpontzearen potentzialitatea».'
211
+ - source_sentence: Non ospatuko da Euskal Herriko Mendizale Federazioaren 100 urteak
212
+ gogoratzeko ekitaldi instituzionala?
213
+ sentences:
214
+ - 'Zein da benetako informazio hori?
215
+
216
+
217
+ Europako proiektua bake proiektu bat dela, eta munduan aitzindaria dela gure bizitzeko
218
+ eta antolatzeko modua. Gure demokrazia inperfektua da sarritan, baina ez dago
219
+ sistema hoberik.
220
+
221
+
222
+
223
+
224
+ Ekaineko hauteskundeetan ez zara izango EAJko hautagaia. Alderdiak zeresana izan
225
+ du erreleboan?
226
+
227
+
228
+ Nire alderdiko presidenteari zera esan nion: «Ez dakit zer duzuen buruan, baina,
229
+ aldaketa bada, gauzak erraztuko dizkizuet, utzi egingo dut eta». Nirea izan da
230
+ erabakia.
231
+
232
+
233
+ Eta, hala ere, EAJren lehendakarigaien kinielan sartu zintuzten...
234
+
235
+
236
+ Kazetariak zelebreak zarete batzuetan. Albiste horrek ez zuen inolako oinarririk.
237
+
238
+
239
+ 1998an hasi zinen legebiltzarkide gisa Eusko Legebiltzarrean. 2005ean, Legebiltzarreko
240
+ lehen emakume bihurtu zinen. Europako Parlamentuan parlamentari gutxik eramango
241
+ dute zuk bezainbeste urte. Gizona izango bazina, bide hori guztia egin duzuna
242
+ baino errazago egingo zenuen?
243
+
244
+
245
+ Afiliatu gabe hasi nintzen 80ko hamarkadan, EAJren banaketaren testuinguruan.
246
+ Emakume gaztea, argala eta txikia nintzen, eta badakit zer eztabaida sortu zituen
247
+ nire aldeko apustuak. Gaztea eta emakumea izateak balioa dauka orain. Nire belaunaldiko
248
+ emakumeen artean, politikan, zorte handia izan dut beharbada. Baina berdintasunean
249
+ egin dut ibilbide hori? Ez. Egunerokoan ohartzen zara horretaz, hainbat eta hainbat
250
+ pasartetan, oztopotan. Baina aurrera egin dut beti emakume gisa, ez gizonen moldeekin
251
+ eta balioekin. Emakumeak landu egin behar du autoritatea, eta gizonari eman egiten
252
+ zaio.
253
+
254
+
255
+ «Behin, afari ofizial batera joan eta ''opiltxo'' bati buruz aritu zen agintari
256
+ bat niri erreparatuz. Barregarri geratzen ari denari barregarri geratzen uztea
257
+ izan da beti nire erantzuna».
258
+
259
+
260
+ Inoiz izan duzu pasarte desatseginen bat zure sexuari lotuta?'
261
+ - 'Aurten 100 urte bete dituzten mendi taldeen aitortza.
262
+
263
+ 10:45. Ekitaldi instituzionala Euskal Herriko ordezkari politikoekin.
264
+
265
+ 11:00. Mendi Federazioko presidente ohien aitortza.
266
+
267
+ 11:30.'
268
+ - 'EGITARAUA
269
+
270
+
271
+ Martxoak 20. Elgetatik igaroko da 23. Korrika, eta mendizaleek kilometro oso berezia
272
+ korrituko dute federazioa sortu zen herrian.
273
+
274
+ Apirilak 24. Tolosan, (Leidor Aretoan), 40 urtetik gorako ibilbide jarraitua duten
275
+ federatu gipuzkoarrei aitortza egingo zaie, urrezko ikurra emanez.
276
+
277
+ Apirilak 27-28. ''100 urte 100 mendi'' egitasmoa. Euskal Herriko ehun mendi talde
278
+ baino gehiago igoko dira zazpi herrialdeetatik aukeratutako 100 tontorretara,
279
+ eta ehungarren urteurreneko bandera eramango dute. Efemeridea oroitzeko bi mila
280
+ mapa egingo dira.
281
+
282
+ Maiatzak 18. Ekitaldi instituzionala eta mendi girokoa Elgetan, 1924ko maiatzaren
283
+ 18an federazioa sortu zen, pertsona politiko, erakunde eta mendi taldeekin. Ekitaldi
284
+ ofizialaren ondoren, herri bazkaria frontoian. Egunean zehar, udaletxeko plazan
285
+ marmolezko plaka jartzea, musika, ibilketa nordikoa...
286
+
287
+ Ekainak 17. 1974an Everesterako ''Tximist'' espedizioaren 50. urteurrena ospatzeko
288
+ erakusketa inauguratuko dute Gasteizen, EMMOA fundazioaren eskutik.
289
+
290
+ Urriak 13. Bi federazioen martxa bateratua Euskal Herriko erdigune geografikora,
291
+ Urbasa-Andia parke naturalean. Aurten, ekitaldi berean, Mendeurren Ermandadearen
292
+ diplomak ere banatuko dira.
293
+
294
+ Urriak 18. Bi federazioen martxa bateratua Urbasa Andiako Parke Naturalean dagoen
295
+ Euskal Herriko erdigune geografikora. Aurten, ekitaldi berean, Ehun Mendietako
296
+ Mendizaleen Elkartearen diplomak ere banatuko dira.
297
+
298
+ Abenduak 12. ''Euskal Herriko Mendizale Federazioaren 100 urte'' monografikoa
299
+ ''Pyrenaica'' aldizkarian. Egun horretarako, urteko ekitaldien ikus-entzunezko
300
+ bat ere egongo da.'
301
+ - source_sentence: Zein da Sara Ahmeden ikuspuntua emozioen psikologizazio eta pribatizazioari
302
+ buruz?
303
+ sentences:
304
+ - 'Udako seriea. Euskal Herriko ingurubirak (II)
305
+
306
+
307
+ Illunzar, Ineritze leizeko babesleku
308
+
309
+
310
+ Historiak eta kondairak bat egiten duten bazter amiragarria bertatik bertara ezagutzeko
311
+ parada emango du ibilbide honek. Aulestiko Narea auzoa da abiapuntua. Ineritze
312
+ haitzuloa Illunzar mendiguneko bizkarrean ikus daiteke.
313
+
314
+
315
+ Irakurri hemen serieko artikulu guztiak
316
+
317
+
318
+
319
+
320
+ Aulesti eta Nabarniz (Bizkaia) udalerrien artean Illunzar mendigunea altxatzen
321
+ da airoski. Ezbairik gabe, ezusteko handia hartuko du bisitariak mendigune gotortu
322
+ izanaren itxura duen parajeotara hurreratzen den lehen aldian. Pirinioetako tontorrik
323
+ garaienean nola, hala agertuko zaio ibiltariari mugarik gabeko zeruertza. Izan
324
+ ere, handik goitik Euskal Herriko erliebe malkartsuaz jabetzea ez da lan nekosoa:
325
+ tontorrak, haranak eta haitz zorrotzak, malkarrak eta ordokiak... Halakoxea da
326
+ Bizkaiko orografia, mugimendu orogenikoek sorrarazitako tolestura apetatsuan ederki
327
+ bermatua. Magaletik eskegiak udalerriok osatzen dituzten auzo eta baserriak antzemango
328
+ ditu bisitariak. Herri xumeak eta baserriak han-hemenka sakabanatuta ikusiko ditu.
329
+ Gainera, artadi kantauriarrak osatzen dituen baso trinkoak Illunzarreko paisaiaren
330
+ protagonistak izango dira. Nagitasun gozoan eta eguzkiaren epeletan emango dute
331
+ zuhaitzok urte osoan, hosto gogor, latz eta arantzadunak goialdeko larrediarekin
332
+ lehia bizian.'
333
+ - 'Naziogintza Taldea
334
+
335
+
336
+ Abiapuntuaren garrantzia analisi zuzenak egiteko
337
+
338
+
339
+ BERRIA egunkarian idatzitako artikulu batean, Andoni Olariaga filosofoak migrazioaren
340
+ eta kolonialismoaren arteko harremanaz jardun zuen. Bertan, besteak beste, hau
341
+ aipatzen zuen: «Iparralde globalean bizi garen herri eta pertsona garen aldetik,
342
+ Hego globalaren esplotazioan oinarritutako bizi-eredu batean oinarritzen garela
343
+ jakitun, migrazioaren gaiari modu emantzipatzailean erantzuteko erantzukizuna
344
+ dugu».
345
+
346
+
347
+ Bat gatoz Olariagarekin eskuin muturrak migrazioarekiko duen jarrera salatzeko.
348
+ Giza eskubideen erabilera maltzurra egiten dute eskuin muturreko ideologoek, eta
349
+ orain mespretxatu egiten dituzte historian zehar politika inperialisten bidez
350
+ modu basatian zapaldu eta esplotatu zituzten herrialdeetako herritarrak.
351
+
352
+
353
+ Hala ere, migrazioen auziak ertz asko ditu. Olariagak bere artikuluan aipatzen
354
+ duena egia izanik ere, ez da egia osoa. Migrazio-fenomenoaren azterketa integralaren
355
+ falta sentitzen dugu, erantzukizunak banatzerakoan maila berean jartzen baititu
356
+ estatuak eta gurea bezalako estaturik gabeko nazioak. Eta hori ez da bidezkoa.
357
+
358
+
359
+ Olariagari eta immigrazioaren gaia jorratzen duten beste aditu euskaldun batzuei
360
+ gauza garrantzitsu bat ahazten zaie, analisi horretarako funtsezkoa dena: eztabaidaren
361
+ abiapuntua. Ahaztu egiten zaie aipatzea Euskal Herria estaturik gabeko nazio zapaldua
362
+ dela, nazio ukatua, zatitua eta kolonizatua. Ez dakigu Olariagak eta besteek abiapuntu
363
+ hori onartuko duten, baina gure ustez funtsezkoa da hori gogoan hartzea migrazioari
364
+ buruzko eztabaida behar den bezala kokatzeko. Gure egoera ez da Espainiakoa, Frantziakoa
365
+ edo Alemaniakoa, hots, estatua duten lurraldeena. Horiek burujabetza osoa dute
366
+ haien politika propioak egiteko, tresnak eta baliabideak dituzte migranteak integratzeko
367
+ eta, batez ere, haien kulturak eta hizkuntzak ez daude egoera zaurgarrian, eta,
368
+ horrenbestez, migrazioak ez ditu haien hizkuntza hegemonikoak higatzen. Gu, bistan
369
+ da, ez gaude egoera berean.'
370
+ - 'Emozioen kultura politikoa
371
+
372
+
373
+ Sara Ahmedek atzo egindako feminizketan zioen bizitzaz galdetzea dela feminismoa,
374
+ eta nik aitzakia probestu dut Ahmeden liburuetako galdera batzuk euskaratzeko.
375
+ Ahmeden The Cultural Politics of Emotion liburuak mugitu ninduen gehiena, Ahmed
376
+ ez da emozioen psikologizazio eta pribatizaziora mugatzen, eta, besteak beste,
377
+ ondorengo galderak egiten ditu: Nola txertatzen da mina politikan? Nola ari gara
378
+ minak sozializatzen? Zergatik sentitzen da gorrotoa barrutik kanpora baletor bezala?
379
+ Nondik nora mugitzen da beldurra? Lotsa bihurtu daiteke askatzaile? Zer egiten
380
+ da maitasunaren izenean jokatzen dugunean? Zergatik da hobea maitasunarengatik
381
+ egiten dena? Noiz bihurtzen dira arauk forma? Sentipenak euren objektu, ibilbide
382
+ eta orbainak dituzte. Ahmedek orbainez dio lesioaren marka direla, sendatzeko
383
+ aukeraren erakusle, lesioa, are, mina estali dezaketela; baina orbainek zauria
384
+ agerian utzi eta gorputzari forma bat ere ematen diote. Emozioak kultura politiko
385
+ gisa pentsatzea da sortzen denari erreparatzea. «Nekatuta nago», «ze nazka!»,
386
+ «maite zaitut» horiek egoera psikologikoak bainoago, praktika sozial eta kulturalak
387
+ dira, eta sentitzen dut, baina ez dira zure-zureak.'
388
+ - source_sentence: Nola lotzen dira longterminismoa eta transhumanismoa korronte ideologiko
389
+ gisa?
390
+ sentences:
391
+ - 'Berganzok gogorarazi du ia 300 milioi euro horien barruan anbulantziak ere badaudela,
392
+ «gaur egun hitzarmen baten bidez eskaintzen dira eta».
393
+
394
+
395
+ Behin-behinekotasuna
396
+
397
+
398
+ Eragile politiko, sindikal eta sozial ugari bat datoz honetan: Osakidetzako lantaldeak
399
+ egonkorra izan behar du. Horren haritik, Osasun Sailak 2018-2019 aldiko LEP lan
400
+ eskaintza publikoaren postu guztiak adjudikatu ditu, eta «laster» ebatziak egongo
401
+ dira 2020tik 2022rako LEPak, baita 2021ean egin zuten egonkortzeko LEPa ere. Guztira
402
+ 11.057 postu emango dituzte bi hilabetean, beraz. Osasun Sailak aurreikusi duenez,
403
+ postu horiek esleitutakoan Osakidetzako behin-behinekotasuna %10,72koa izango
404
+ da. Aurrerago beste oposizio batzuk egiteko asmoa dute, eta, horiek ebaztean,
405
+ behin-behinekotasun tasa %9 ingurukoa izango dela uste dute.
406
+
407
+
408
+ Zenbaki horiek denek zer esan nahi dute, ordea? Lehenik eta behin, ondo jakin
409
+ behar dela zein den Osakidetzako lantaldearen osaera. Iazko urriko hauteskunde
410
+ sindikaletan Osakidetzako langileen errolda egin zuten: Osakidetzak guztira 46.372
411
+ langile zituen orduan. Datu horren barruan, egiturazko lantaldea 32.442 lanpostuk
412
+ osatzen dute, Osasun Sailaren arabera.
413
+
414
+
415
+ «Deribazioak eginda, estatistiketan datuak betetzen dituzte, pazienteak itxaron
416
+ zerrendatik ateratzen dituzte eta ebakuntza egin diete»
417
+
418
+
419
+ MAIDER PORTOLESLAB sindikatuko osasungintzako arduraduna
420
+
421
+
422
+ Hala ere, langile finkoak ez dira hainbeste. Saavedrak Osasun Sailaren datuak
423
+ aipatuta azaldu duenez, Osakidetzako langile finkoak 18.329 ziren iazko maiatzean
424
+ —Osasun Sailak orduan eman zizkien lantaldeari buruzko datuak azken aldiz—: «Lan
425
+ eskaintza publiko batean postu kodifikatu bat lortu duten langileak dira. Izan
426
+ ere, LEP batean eskaini ahal izateko, lanpostu horrek kode bat izan behar du».'
427
+ - Kontzeptu hori, aldez edo moldez, toki askotatik ari dira azpimarratzen, Zuberogoitiaren
428
+ aburuz; esate baterako, «ekologia sakonetik biologiaren korronte garaikide batzuetatik,
429
+ feminismotik edota fisika
430
+ - 'Gaur egungo gizarteko supergaizkileak diren bilionarioak dira honen guztiaren
431
+ bultzatzaile nagusietakoak, eraginkortasun honen helburu den longterminism edo
432
+ epeluzerismoa bezala itzuli genezakeenarekin lotuta. Badakizu mundua pikutara
433
+ bidaltzen ari diren bitartean nortzuk ari diren beraien burua salbatzeko ahalegin
434
+ handiena egiten. Hauen hitzetan, ez da guztia desagertuko delako, noski ezetz,
435
+ gizateria izan daitekeenaren potentziala gauzatzeko baizik. Eta epe luzeak eskaintzen
436
+ duen potentzialaren izenean oso gauza arriskutsuak egin daitezke. Esaterako, orain
437
+ eta hemen kaltetuak direnei erreparatzeari uztea. Epe luzeari begiratzen badiogu,
438
+ Gazako gerrak ez duelako gizakiarentzat arrisku existentzialik suposatzen, adibidez.
439
+ Horregatik gizatasun, etika edo sentimenduetan oinarritutako kausetan denbora
440
+ galdu beharrean, eragin zabal bat duten horietara zuzendu beharko genuke gure
441
+ indarra. Arrazoinamendu honetatik gizakiaren potentziala betetzen dela bermatzen
442
+ duen eugenesiara ez dago ezer. Nick Bostrom filosofoak aipatzen dituen gure emozioak
443
+ kontrolatzea ahalbidetuko duten aldaketa genetikoetara edo Elon Musk-ek bultzaturiko
444
+ burmuinean egindako inplanteetara ere ez. Potentziala transhumanoa da. Aseguru
445
+ etxeen algoritmoak onartuko duen bioingeniaritzarena. Gorputza eta espazioa konkistatu
446
+ ahal izango duen kapitalarena. Ez da sentimentala. Eta ez da gurea.
447
+
448
+
449
+ Korronte honek guztiak gizakiaren intuizio eta emozioen kontra egiten du epe luzeko
450
+ teorian baina epe motzeko praktika beste zerbait izaten ari da. Azkenaldian ikusi
451
+ ditugu, Estatu Batuetan eta Argentinan adibidez, (asmatutako) datuak eskutan,
452
+ koadratzen ez dien ezer erraietatik ezabatzeko prest. Beharrezkoa den eraginkortasun
453
+ objektibo bezala aurkeztuz murrizketa emozionala besterik ez dena.'
454
+ pipeline_tag: sentence-similarity
455
+ library_name: sentence-transformers
456
+ metrics:
457
+ - cosine_accuracy
458
+ model-index:
459
+ - name: SentenceTransformer based on intfloat/multilingual-e5-large
460
+ results:
461
+ - task:
462
+ type: triplet
463
+ name: Triplet
464
+ dataset:
465
+ name: multilingual e5 large
466
+ type: multilingual-e5-large
467
+ metrics:
468
+ - type: cosine_accuracy
469
+ value: 0.8685561418533325
470
+ name: Cosine Accuracy
471
+ ---
472
+
473
+ # SentenceTransformer based on intfloat/multilingual-e5-large
474
+
475
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
476
+
477
+ ## Model Details
478
+
479
+ ### Model Description
480
+ - **Model Type:** Sentence Transformer
481
+ - **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision 0dc5580a448e4284468b8909bae50fa925907bc5 -->
482
+ - **Maximum Sequence Length:** 512 tokens
483
+ - **Output Dimensionality:** 1024 dimensions
484
+ - **Similarity Function:** Cosine Similarity
485
+ <!-- - **Training Dataset:** Unknown -->
486
+ <!-- - **Language:** Unknown -->
487
+ <!-- - **License:** Unknown -->
488
+
489
+ ### Model Sources
490
+
491
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
492
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
493
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
494
+
495
+ ### Full Model Architecture
496
+
497
+ ```
498
+ SentenceTransformer(
499
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
500
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
501
+ (2): Normalize()
502
+ )
503
+ ```
504
+
505
+ ## Usage
506
+
507
+ ### Direct Usage (Sentence Transformers)
508
+
509
+ First install the Sentence Transformers library:
510
+
511
+ ```bash
512
+ pip install -U sentence-transformers
513
+ ```
514
+
515
+ Then you can load this model and run inference.
516
+ ```python
517
+ from sentence_transformers import SentenceTransformer
518
+
519
+ # Download from the 🤗 Hub
520
+ model = SentenceTransformer("cuadron11/mle5_large_berria")
521
+ # Run inference
522
+ sentences = [
523
+ 'Nola lotzen dira longterminismoa eta transhumanismoa korronte ideologiko gisa?',
524
+ 'Gaur egungo gizarteko supergaizkileak diren bilionarioak dira honen guztiaren bultzatzaile nagusietakoak, eraginkortasun honen helburu den longterminism edo epeluzerismoa bezala itzuli genezakeenarekin lotuta. Badakizu mundua pikutara bidaltzen ari diren bitartean nortzuk ari diren beraien burua salbatzeko ahalegin handiena egiten. Hauen hitzetan, ez da guztia desagertuko delako, noski ezetz, gizateria izan daitekeenaren potentziala gauzatzeko baizik. Eta epe luzeak eskaintzen duen potentzialaren izenean oso gauza arriskutsuak egin daitezke. Esaterako, orain eta hemen kaltetuak direnei erreparatzeari uztea. Epe luzeari begiratzen badiogu, Gazako gerrak ez duelako gizakiarentzat arrisku existentzialik suposatzen, adibidez. Horregatik gizatasun, etika edo sentimenduetan oinarritutako kausetan denbora galdu beharrean, eragin zabal bat duten horietara zuzendu beharko genuke gure indarra. Arrazoinamendu honetatik gizakiaren potentziala betetzen dela bermatzen duen eugenesiara ez dago ezer. Nick Bostrom filosofoak aipatzen dituen gure emozioak kontrolatzea ahalbidetuko duten aldaketa genetikoetara edo Elon Musk-ek bultzaturiko burmuinean egindako inplanteetara ere ez. Potentziala transhumanoa da. Aseguru etxeen algoritmoak onartuko duen bioingeniaritzarena. Gorputza eta espazioa konkistatu ahal izango duen kapitalarena. Ez da sentimentala. Eta ez da gurea.\n\nKorronte honek guztiak gizakiaren intuizio eta emozioen kontra egiten du epe luzeko teorian baina epe motzeko praktika beste zerbait izaten ari da. Azkenaldian ikusi ditugu, Estatu Batuetan eta Argentinan adibidez, (asmatutako) datuak eskutan, koadratzen ez dien ezer erraietatik ezabatzeko prest. Beharrezkoa den eraginkortasun objektibo bezala aurkeztuz murrizketa emozionala besterik ez dena.',
525
+ 'Kontzeptu hori, aldez edo moldez, toki askotatik ari dira azpimarratzen, Zuberogoitiaren aburuz; esate baterako, «ekologia sakonetik biologiaren korronte garaikide batzuetatik, feminismotik edota fisika',
526
+ ]
527
+ embeddings = model.encode(sentences)
528
+ print(embeddings.shape)
529
+ # [3, 1024]
530
+
531
+ # Get the similarity scores for the embeddings
532
+ similarities = model.similarity(embeddings, embeddings)
533
+ print(similarities)
534
+ # tensor([[1.0000, 0.6321, 0.1526],
535
+ # [0.6321, 1.0000, 0.2649],
536
+ # [0.1526, 0.2649, 1.0000]])
537
+ ```
538
+
539
+ <!--
540
+ ### Direct Usage (Transformers)
541
+
542
+ <details><summary>Click to see the direct usage in Transformers</summary>
543
+
544
+ </details>
545
+ -->
546
+
547
+ <!--
548
+ ### Downstream Usage (Sentence Transformers)
549
+
550
+ You can finetune this model on your own dataset.
551
+
552
+ <details><summary>Click to expand</summary>
553
+
554
+ </details>
555
+ -->
556
+
557
+ <!--
558
+ ### Out-of-Scope Use
559
+
560
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
561
+ -->
562
+
563
+ ## Evaluation
564
+
565
+ ### Metrics
566
+
567
+ #### Triplet
568
+
569
+ * Dataset: `multilingual-e5-large`
570
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
571
+
572
+ | Metric | Value |
573
+ |:--------------------|:-----------|
574
+ | **cosine_accuracy** | **0.8686** |
575
+
576
+ <!--
577
+ ## Bias, Risks and Limitations
578
+
579
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
580
+ -->
581
+
582
+ <!--
583
+ ### Recommendations
584
+
585
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
586
+ -->
587
+
588
+ ## Training Details
589
+
590
+ ### Training Dataset
591
+
592
+ #### Unnamed Dataset
593
+
594
+ * Size: 55,314 training samples
595
+ * Columns: <code>anchor</code> and <code>positive</code>
596
+ * Approximate statistics based on the first 1000 samples:
597
+ | | anchor | positive |
598
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
599
+ | type | string | string |
600
+ | details | <ul><li>min: 8 tokens</li><li>mean: 21.07 tokens</li><li>max: 45 tokens</li></ul> | <ul><li>min: 88 tokens</li><li>mean: 383.98 tokens</li><li>max: 498 tokens</li></ul> |
601
+ * Samples:
602
+ | anchor | positive |
603
+ |:-------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
604
+ | <code>Zergatik dio artikuluaren izenburuak "Ez gaude hemen"?</code> | <code>Ez gaude hemen<br><br>Goizeko kafesnea zerbitzatzen dizunak ea asteburuko pilota partida ikusi zenuten galdetu dizu, gogorra izan zela, berak ez zuela faboritorik, ea zurea zein zen. Beti ematen du hizketarako gogoa duela, baina gaur bere alabak lehengo kimio saioa du. Ez da ari pilota partidan pentsatzen. Zure lankide apaina orain arte ikusi ez diozun arropa koloretsu batekin etorri da, ilea ondulatua, hortzak zuri. Nola egiten du? Liburu bat atera du poltsatik. «Zuretzako». Asteburuan irakurri duela, gustatu zaiola, eta nirekin gogoratu dela. Nola egiten du? Atzo bere lagun baten nebaz esan ziotena darabil buruan. Esan egin behar lioke? Badagokio? Eta egia bada? Gaua lorik egin gabe pasatu du, zuri eman dizun liburua irakurtzen. Pilateseko irakaslearentzat gaur, apirilak 1, lehenengo aldiz larrua jo zuen eguna da. Laranjak oso onak daudela esan dizun dendariak Adolescence telesailean beste ezertan ezin du pentsatu. «Zer moduz eguna?» whatsappez galdetu dizun lagunak inoizko haserre handien...</code> |
605
+ | <code>Zein dira LABen proposamenak industria trantsiziorako plangintzei dagokienez?</code> | <code>Hori jakinda, LABek «bizitza kapitalaren gainetik» jarri behar dela aldarrikatu du, eta «sistema kapitalista heteropatriarkal, arrazista eta biozida gainditzeko» proposamen sorta bat egin du, zazpi ataletan zatituta.<br><br>1<br><br>Industria trantsiziorako plangintzak<br><br>Enpresen plan estrategikoak negoziazio kolektiboaren menpe jartzea nahi du, eta, hortaz, enpresa batzordeetan eztabaidatzea eta bozkatzea, eta batzordeek horri buruzko beto ahalmena izatea.<br><br>2<br><br>Diru publikoaren erabilera<br><br>LABen arabera, energia trantsiziorako jarritako diru publikoa ezin da mugatu ekimen pribatua laguntzera. Uste duenez, erakundeek zuzenean inplikatu behar dute jabetza publikoko proiektuen garapenean, eta krisian dauden enpresa industrialak erosi behar dituzte. Gainera, dirua jasotzen duten enpresek derrigortuta egon beharko lukete hamar urtez ez ixtera eta inor ez kanporatzera. «Itxierak, kaleratzeak edo murrizketak egin dituzten enpresek laguntza publikoen lehiaketetatik kanpo geratu behar dute, eta diru laguntza...</code> |
606
+ | <code>Zenbat pakete inportatu zituen Europako Batasunak joan den urtean?</code> | <code>Pakete txikien zama handia<br><br>Donald Trumpek abiarazitako merkataritza gerraren azpian badago beste merkataritza gerra bat, AEB Ameriketako Estatu Batuak eta EB Europako Batasuna, neurri txikiagoan bada ere, aspaldian irabazi ezinda dabiltzana: balio gutxiko salgaien inportazio neurrigabeena. Bereziki Txinatik datozen produktu horiek ez dute muga zergarik ordaintzen, eta Temu, Shein, Alibaba eta merkataritza elektronikoko beste plataforma handiek salbuespen hori baliatu dute azken urteetan negozioa handitzeko. AEBetan, 800 dolarretik beherako paketeei aplikatzen zaie salbuespena; EBn, aldiz, 150 euro baino gutxiagokoei.<br><br>Bruselak salbuespena amaitzea proposatu die EBko herrialdeei. Europako Batzordeak proposatu du paketeei tasa bat kobratzen hastea, eta, horretarako, lege aldaketa hastea galdegin die Europako Parlamentuari eta Europako Kontseiluari. Zera proposatu du: pakete bakoitzeko bi euroko tasa ordainaraztea produktua norbanako batek erosten duenean zuzenean, eta 50 zentimokoa hand...</code> |
607
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
608
+ ```json
609
+ {
610
+ "scale": 20.0,
611
+ "similarity_fct": "cos_sim"
612
+ }
613
+ ```
614
+
615
+ ### Evaluation Dataset
616
+
617
+ #### Unnamed Dataset
618
+
619
+ * Size: 55,324 evaluation samples
620
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
621
+ * Approximate statistics based on the first 1000 samples:
622
+ | | anchor | positive | negative |
623
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
624
+ | type | string | string | string |
625
+ | details | <ul><li>min: 6 tokens</li><li>mean: 21.24 tokens</li><li>max: 43 tokens</li></ul> | <ul><li>min: 97 tokens</li><li>mean: 385.43 tokens</li><li>max: 502 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 183.66 tokens</li><li>max: 499 tokens</li></ul> |
626
+ * Samples:
627
+ | anchor | positive | negative |
628
+ |:--------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
629
+ | <code>Zein da Kanarietako lorratz ekologikoa munduko batez bestekoarekin alderatuta?</code> | <code>Auzoen lapurreta<br><br>Etxebizitzari dagokionez, pisu turistikoen galgarik gabeko hazkundeak larriagotu du egoera. Mota horretako 53.938 etxebizitza daude orain uhartedian, 2022ko azaroan baino %39,7 gehiago. Dena den, gobernuak argitaratu du horiek erregulatzeko lege proiektu bat, adituen arabera, negozio horrekin amaitzeko balioko duena.<br><br>Bizileku turistiko asko orain arte bertakoenak izan diren tokietan daude. Reyesen iritziz, mobilizatzeko arrazoi nagusietako bat da hori. Auzoak eta eremu naturalak lapurtu nahi dizkietela diote kanariar askok. Hernandezek sakondu du gaian, eta sakelakoek eragindako aldaketak nabarmendu ditu: «Pandemia osteko turistak gehiago mugitzen dira; gure auzoetan topatzen ditugu orain, gure jatetxeetan, gure txoko sekretuetan». Sare sozialei esker aurkitzen dituzte leku horiek.<br><br>Etxebizitzaren inguruko aldarrikapenak Kanaria Handiko Las Palmas hirian, apirilaren 20an egindako manifestazioan. QUIQUE CURBELO / EFE<br><br>Ekologistak Martxan-eko kideak, ezinbestean, hizpi...</code> | <code>Pradalesek arreta berezia jarri zuen gazteengan eta etxebizitza politikan. Onartu zuen etxebizitzarena «erronka handietako bat» dela gaur egun, eta, horregatik, iragarri zuen emantzipazioa errazteko eta erronka demografikoari aurre egiteko hainbat neurri hartuko dituela. Horien artean daude, besteak beste, alokairu sozialerako 7.000 etxebizitza eraikitzea eta aitatasun eta amatasun baimenak luzatzea.<br><br>Ekonomiaren alorrean, iragarri zuen 2028rako industria plan bat osatuko duela, eta trantsizio energetikoa eta deskarbonizazioa sustatzeko erraztasunak emango dituela. Bizikidetzaren alorrean, «zoru etikoa» onartzeko beharra aldarrikatu zuen, zeinak «giza eskubideen urraketen biktima guztiak» aintzat hartuko dituen. Euskarari dagokionez, berriz, ezagutza eta erabilera sustatzeko beharra aipatu zuen, doakotasuna oinarri gisa hartuta. Urkulluri eskerrak emanez amaitu zuen hitzaldia, eta hark egindako lanari aitortza eginez.<br><br>Lurzoru partekatua<br><br>Otxandianok etorkizuneko herri proiektu parteka...</code> |
630
+ | <code>Zein da Ukrainako presidente Zelenskiren onarpen maila ukrainarren artean?</code> | <code>Aurreko hilabeteetan, baina, AEBetako presidente Donald Trumpek ere iradoki izan du Ukrainan hauteskundeak egiteko garaia dela, eta Zelenski «diktadoretzat» jo izan du sare sozialetan. Gainera, otsailaren 19an emandako prentsaurreko batean, Etxe Zuriko maizterrak ziurtatu zuen Zelenskik ez duela ukrainarren babesik. «Nahiago nuke esan behar ez izatea, baina %4ko onarpen maila baino ez dauka», adierazi zuen. Ez zuen argitu datu hori zer iturritatik atera zuen. Azken inkestek bestelako joera bat erakusten dute: Kieveko Nazioarteko Soziologia Institutuak atzo argitaratutako inkesta baten arabera, Ukrainako herritarren %69k dute konfiantza egungo presidentearengan.<br><br>Trumpek presidente kargua hartu aurretik ziurtatu zuen Etxe Zurira iritsi bezain laster amaiaraziko zuela Ukrainako gerra. Putinen ustez, Trumpek «benetan» nahi du Ukrainako gerra amaitu, eta, atzo azaldu zuenez, horregatik hitz egin du harekin hainbatetan. AEBetako presidenteak, ordea, oraingoz ez du lortu hori, baina Washingt...</code> | <code>Ukrainako presidente Volodimir Zelenskirentzat, «baldintzarik gabeko menia bat» lortzea da lehentasuna, eta, haren hitzetan, hori bera izango da biharko Londresko bilkuraren xedea.</code> |
631
+ | <code>Zein dira Frantziako Gobernuaren politikak aberastasunaren banaketari dagokionez, sindikatuen iritziz?</code> | <code>Dominique Pons CGT sindikatuko ordezkariak garrantzia kendu zion LABen presentziari, azpimarratuta lehenago ere elkarrekin mobilizatu izan direla, baina Eñaut Aramendi sindikatu abertzaleko kideak baieztatu zuen segregazio sindikalik gabe iragaten den lehen mobilizazioa dela: «Egia da iazkoa egoera oso konplikatua izan zela [erretreten erreformaren kontrako protestetatik kanpo utzi zuten LAB]. Aurten lortu dugu Maiatzaren Lehena gehiengo sindikal batean antolatzen. Sindikatu batzuk baizik ez dira eskas; haiek esplikatu beharko dute zer interes duten Maiatzaren Lehenean ez mobilizatzeko». Besteak beste, FO sindikatuak ez du parte hartu nahi izan, baina bai CFDT, CGT, LAB, FSU-Snuipp, Solidaires eta UNSA sindikatuek, beste hainbat eragile politiko eta sozialekin batera.<br><br>LABen bandera batu zitzaien lehen aldiz CGT, CFDT, FSU, UNSA eta Solidaires sindikatuetakoei, Baionan. PATXI BELTZAIZ<br><br>Bukaeran irakurritako agiri bateratuan «bestelako aberastasunen banaketa» aldarrikatu zuten. «Hemen g...</code> | <code>Hala ere, Jon Hernandez legebiltzarkidearen iritziz, ezinbestekoa da aberastasunaren sorrerari erreparatu ordez haren banaketari behatzea.</code> |
632
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
633
+ ```json
634
+ {
635
+ "scale": 20.0,
636
+ "similarity_fct": "cos_sim"
637
+ }
638
+ ```
639
+
640
+ ### Training Hyperparameters
641
+ #### Non-Default Hyperparameters
642
+
643
+ - `eval_strategy`: epoch
644
+ - `learning_rate`: 2e-05
645
+ - `num_train_epochs`: 5
646
+ - `warmup_ratio`: 0.1
647
+ - `batch_sampler`: no_duplicates
648
+
649
+ #### All Hyperparameters
650
+ <details><summary>Click to expand</summary>
651
+
652
+ - `overwrite_output_dir`: False
653
+ - `do_predict`: False
654
+ - `eval_strategy`: epoch
655
+ - `prediction_loss_only`: True
656
+ - `per_device_train_batch_size`: 8
657
+ - `per_device_eval_batch_size`: 8
658
+ - `per_gpu_train_batch_size`: None
659
+ - `per_gpu_eval_batch_size`: None
660
+ - `gradient_accumulation_steps`: 1
661
+ - `eval_accumulation_steps`: None
662
+ - `torch_empty_cache_steps`: None
663
+ - `learning_rate`: 2e-05
664
+ - `weight_decay`: 0.0
665
+ - `adam_beta1`: 0.9
666
+ - `adam_beta2`: 0.999
667
+ - `adam_epsilon`: 1e-08
668
+ - `max_grad_norm`: 1.0
669
+ - `num_train_epochs`: 5
670
+ - `max_steps`: -1
671
+ - `lr_scheduler_type`: linear
672
+ - `lr_scheduler_kwargs`: {}
673
+ - `warmup_ratio`: 0.1
674
+ - `warmup_steps`: 0
675
+ - `log_level`: passive
676
+ - `log_level_replica`: warning
677
+ - `log_on_each_node`: True
678
+ - `logging_nan_inf_filter`: True
679
+ - `save_safetensors`: True
680
+ - `save_on_each_node`: False
681
+ - `save_only_model`: False
682
+ - `restore_callback_states_from_checkpoint`: False
683
+ - `no_cuda`: False
684
+ - `use_cpu`: False
685
+ - `use_mps_device`: False
686
+ - `seed`: 42
687
+ - `data_seed`: None
688
+ - `jit_mode_eval`: False
689
+ - `use_ipex`: False
690
+ - `bf16`: False
691
+ - `fp16`: False
692
+ - `fp16_opt_level`: O1
693
+ - `half_precision_backend`: auto
694
+ - `bf16_full_eval`: False
695
+ - `fp16_full_eval`: False
696
+ - `tf32`: None
697
+ - `local_rank`: 0
698
+ - `ddp_backend`: None
699
+ - `tpu_num_cores`: None
700
+ - `tpu_metrics_debug`: False
701
+ - `debug`: []
702
+ - `dataloader_drop_last`: False
703
+ - `dataloader_num_workers`: 0
704
+ - `dataloader_prefetch_factor`: None
705
+ - `past_index`: -1
706
+ - `disable_tqdm`: False
707
+ - `remove_unused_columns`: True
708
+ - `label_names`: None
709
+ - `load_best_model_at_end`: False
710
+ - `ignore_data_skip`: False
711
+ - `fsdp`: []
712
+ - `fsdp_min_num_params`: 0
713
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
714
+ - `fsdp_transformer_layer_cls_to_wrap`: None
715
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
716
+ - `parallelism_config`: None
717
+ - `deepspeed`: None
718
+ - `label_smoothing_factor`: 0.0
719
+ - `optim`: adamw_torch
720
+ - `optim_args`: None
721
+ - `adafactor`: False
722
+ - `group_by_length`: False
723
+ - `length_column_name`: length
724
+ - `ddp_find_unused_parameters`: None
725
+ - `ddp_bucket_cap_mb`: None
726
+ - `ddp_broadcast_buffers`: False
727
+ - `dataloader_pin_memory`: True
728
+ - `dataloader_persistent_workers`: False
729
+ - `skip_memory_metrics`: True
730
+ - `use_legacy_prediction_loop`: False
731
+ - `push_to_hub`: False
732
+ - `resume_from_checkpoint`: None
733
+ - `hub_model_id`: None
734
+ - `hub_strategy`: every_save
735
+ - `hub_private_repo`: None
736
+ - `hub_always_push`: False
737
+ - `hub_revision`: None
738
+ - `gradient_checkpointing`: False
739
+ - `gradient_checkpointing_kwargs`: None
740
+ - `include_inputs_for_metrics`: False
741
+ - `include_for_metrics`: []
742
+ - `eval_do_concat_batches`: True
743
+ - `fp16_backend`: auto
744
+ - `push_to_hub_model_id`: None
745
+ - `push_to_hub_organization`: None
746
+ - `mp_parameters`:
747
+ - `auto_find_batch_size`: False
748
+ - `full_determinism`: False
749
+ - `torchdynamo`: None
750
+ - `ray_scope`: last
751
+ - `ddp_timeout`: 1800
752
+ - `torch_compile`: False
753
+ - `torch_compile_backend`: None
754
+ - `torch_compile_mode`: None
755
+ - `include_tokens_per_second`: False
756
+ - `include_num_input_tokens_seen`: False
757
+ - `neftune_noise_alpha`: None
758
+ - `optim_target_modules`: None
759
+ - `batch_eval_metrics`: False
760
+ - `eval_on_start`: False
761
+ - `use_liger_kernel`: False
762
+ - `liger_kernel_config`: None
763
+ - `eval_use_gather_object`: False
764
+ - `average_tokens_across_devices`: False
765
+ - `prompts`: None
766
+ - `batch_sampler`: no_duplicates
767
+ - `multi_dataset_batch_sampler`: proportional
768
+ - `router_mapping`: {}
769
+ - `learning_rate_mapping`: {}
770
+
771
+ </details>
772
+
773
+ ### Training Logs
774
+ <details><summary>Click to expand</summary>
775
+
776
+ | Epoch | Step | Training Loss | Validation Loss | multilingual-e5-large_cosine_accuracy |
777
+ |:------:|:-----:|:-------------:|:---------------:|:-------------------------------------:|
778
+ | 0.0145 | 100 | 0.9059 | - | - |
779
+ | 0.0289 | 200 | 0.3141 | - | - |
780
+ | 0.0434 | 300 | 0.0799 | - | - |
781
+ | 0.0578 | 400 | 0.0351 | - | - |
782
+ | 0.0723 | 500 | 0.0291 | - | - |
783
+ | 0.0868 | 600 | 0.0318 | - | - |
784
+ | 0.1012 | 700 | 0.0237 | - | - |
785
+ | 0.1157 | 800 | 0.0191 | - | - |
786
+ | 0.1302 | 900 | 0.0242 | - | - |
787
+ | 0.1446 | 1000 | 0.0102 | - | - |
788
+ | 0.1591 | 1100 | 0.0182 | - | - |
789
+ | 0.1735 | 1200 | 0.0209 | - | - |
790
+ | 0.1880 | 1300 | 0.0212 | - | - |
791
+ | 0.2025 | 1400 | 0.0153 | - | - |
792
+ | 0.2169 | 1500 | 0.0137 | - | - |
793
+ | 0.2314 | 1600 | 0.0093 | - | - |
794
+ | 0.2458 | 1700 | 0.0164 | - | - |
795
+ | 0.2603 | 1800 | 0.0118 | - | - |
796
+ | 0.2748 | 1900 | 0.0124 | - | - |
797
+ | 0.2892 | 2000 | 0.009 | - | - |
798
+ | 0.3037 | 2100 | 0.0175 | - | - |
799
+ | 0.3181 | 2200 | 0.0188 | - | - |
800
+ | 0.3326 | 2300 | 0.0171 | - | - |
801
+ | 0.3471 | 2400 | 0.0151 | - | - |
802
+ | 0.3615 | 2500 | 0.0205 | - | - |
803
+ | 0.3760 | 2600 | 0.014 | - | - |
804
+ | 0.3905 | 2700 | 0.0289 | - | - |
805
+ | 0.4049 | 2800 | 0.0187 | - | - |
806
+ | 0.4194 | 2900 | 0.0179 | - | - |
807
+ | 0.4338 | 3000 | 0.0161 | - | - |
808
+ | 0.4483 | 3100 | 0.0305 | - | - |
809
+ | 0.4628 | 3200 | 0.0244 | - | - |
810
+ | 0.4772 | 3300 | 0.0233 | - | - |
811
+ | 0.4917 | 3400 | 0.0276 | - | - |
812
+ | 0.5061 | 3500 | 0.0335 | - | - |
813
+ | 0.5206 | 3600 | 0.0204 | - | - |
814
+ | 0.5351 | 3700 | 0.0289 | - | - |
815
+ | 0.5495 | 3800 | 0.0131 | - | - |
816
+ | 0.5640 | 3900 | 0.0225 | - | - |
817
+ | 0.5785 | 4000 | 0.0189 | - | - |
818
+ | 0.5929 | 4100 | 0.0206 | - | - |
819
+ | 0.6074 | 4200 | 0.0163 | - | - |
820
+ | 0.6218 | 4300 | 0.0257 | - | - |
821
+ | 0.6363 | 4400 | 0.0199 | - | - |
822
+ | 0.6508 | 4500 | 0.0211 | - | - |
823
+ | 0.6652 | 4600 | 0.0135 | - | - |
824
+ | 0.6797 | 4700 | 0.0163 | - | - |
825
+ | 0.6941 | 4800 | 0.0183 | - | - |
826
+ | 0.7086 | 4900 | 0.0189 | - | - |
827
+ | 0.7231 | 5000 | 0.024 | - | - |
828
+ | 0.7375 | 5100 | 0.017 | - | - |
829
+ | 0.7520 | 5200 | 0.0187 | - | - |
830
+ | 0.7664 | 5300 | 0.024 | - | - |
831
+ | 0.7809 | 5400 | 0.0215 | - | - |
832
+ | 0.7954 | 5500 | 0.0166 | - | - |
833
+ | 0.8098 | 5600 | 0.0217 | - | - |
834
+ | 0.8243 | 5700 | 0.0273 | - | - |
835
+ | 0.8388 | 5800 | 0.0136 | - | - |
836
+ | 0.8532 | 5900 | 0.0224 | - | - |
837
+ | 0.8677 | 6000 | 0.021 | - | - |
838
+ | 0.8821 | 6100 | 0.0151 | - | - |
839
+ | 0.8966 | 6200 | 0.0256 | - | - |
840
+ | 0.9111 | 6300 | 0.0151 | - | - |
841
+ | 0.9255 | 6400 | 0.0205 | - | - |
842
+ | 0.9400 | 6500 | 0.019 | - | - |
843
+ | 0.9544 | 6600 | 0.0193 | - | - |
844
+ | 0.9689 | 6700 | 0.0237 | - | - |
845
+ | 0.9834 | 6800 | 0.0093 | - | - |
846
+ | 0.9978 | 6900 | 0.0185 | - | - |
847
+ | 1.0 | 6915 | - | 0.4856 | 0.8297 |
848
+ | 1.0123 | 7000 | 0.0079 | - | - |
849
+ | 1.0268 | 7100 | 0.0079 | - | - |
850
+ | 1.0412 | 7200 | 0.0131 | - | - |
851
+ | 1.0557 | 7300 | 0.0073 | - | - |
852
+ | 1.0701 | 7400 | 0.0114 | - | - |
853
+ | 1.0846 | 7500 | 0.0096 | - | - |
854
+ | 1.0991 | 7600 | 0.0103 | - | - |
855
+ | 1.1135 | 7700 | 0.009 | - | - |
856
+ | 1.1280 | 7800 | 0.0106 | - | - |
857
+ | 1.1424 | 7900 | 0.0182 | - | - |
858
+ | 1.1569 | 8000 | 0.0201 | - | - |
859
+ | 1.1714 | 8100 | 0.008 | - | - |
860
+ | 1.1858 | 8200 | 0.0148 | - | - |
861
+ | 1.2003 | 8300 | 0.0146 | - | - |
862
+ | 1.2148 | 8400 | 0.0092 | - | - |
863
+ | 1.2292 | 8500 | 0.0094 | - | - |
864
+ | 1.2437 | 8600 | 0.0085 | - | - |
865
+ | 1.2581 | 8700 | 0.0101 | - | - |
866
+ | 1.2726 | 8800 | 0.0108 | - | - |
867
+ | 1.2871 | 8900 | 0.009 | - | - |
868
+ | 1.3015 | 9000 | 0.0091 | - | - |
869
+ | 1.3160 | 9100 | 0.0122 | - | - |
870
+ | 1.3304 | 9200 | 0.0124 | - | - |
871
+ | 1.3449 | 9300 | 0.0107 | - | - |
872
+ | 1.3594 | 9400 | 0.0151 | - | - |
873
+ | 1.3738 | 9500 | 0.0147 | - | - |
874
+ | 1.3883 | 9600 | 0.0115 | - | - |
875
+ | 1.4027 | 9700 | 0.0146 | - | - |
876
+ | 1.4172 | 9800 | 0.0114 | - | - |
877
+ | 1.4317 | 9900 | 0.0086 | - | - |
878
+ | 1.4461 | 10000 | 0.0215 | - | - |
879
+ | 1.4606 | 10100 | 0.0109 | - | - |
880
+ | 1.4751 | 10200 | 0.0078 | - | - |
881
+ | 1.4895 | 10300 | 0.0062 | - | - |
882
+ | 1.5040 | 10400 | 0.0084 | - | - |
883
+ | 1.5184 | 10500 | 0.0082 | - | - |
884
+ | 1.5329 | 10600 | 0.0104 | - | - |
885
+ | 1.5474 | 10700 | 0.0087 | - | - |
886
+ | 1.5618 | 10800 | 0.0107 | - | - |
887
+ | 1.5763 | 10900 | 0.0092 | - | - |
888
+ | 1.5907 | 11000 | 0.0136 | - | - |
889
+ | 1.6052 | 11100 | 0.0109 | - | - |
890
+ | 1.6197 | 11200 | 0.0059 | - | - |
891
+ | 1.6341 | 11300 | 0.0094 | - | - |
892
+ | 1.6486 | 11400 | 0.0119 | - | - |
893
+ | 1.6631 | 11500 | 0.0092 | - | - |
894
+ | 1.6775 | 11600 | 0.0158 | - | - |
895
+ | 1.6920 | 11700 | 0.0111 | - | - |
896
+ | 1.7064 | 11800 | 0.0066 | - | - |
897
+ | 1.7209 | 11900 | 0.01 | - | - |
898
+ | 1.7354 | 12000 | 0.0125 | - | - |
899
+ | 1.7498 | 12100 | 0.0079 | - | - |
900
+ | 1.7643 | 12200 | 0.0177 | - | - |
901
+ | 1.7787 | 12300 | 0.0155 | - | - |
902
+ | 1.7932 | 12400 | 0.0093 | - | - |
903
+ | 1.8077 | 12500 | 0.0149 | - | - |
904
+ | 1.8221 | 12600 | 0.0126 | - | - |
905
+ | 1.8366 | 12700 | 0.0076 | - | - |
906
+ | 1.8510 | 12800 | 0.0103 | - | - |
907
+ | 1.8655 | 12900 | 0.0092 | - | - |
908
+ | 1.8800 | 13000 | 0.0048 | - | - |
909
+ | 1.8944 | 13100 | 0.008 | - | - |
910
+ | 1.9089 | 13200 | 0.0142 | - | - |
911
+ | 1.9234 | 13300 | 0.0101 | - | - |
912
+ | 1.9378 | 13400 | 0.0097 | - | - |
913
+ | 1.9523 | 13500 | 0.0094 | - | - |
914
+ | 1.9667 | 13600 | 0.0054 | - | - |
915
+ | 1.9812 | 13700 | 0.0092 | - | - |
916
+ | 1.9957 | 13800 | 0.0142 | - | - |
917
+ | 2.0 | 13830 | - | 0.4555 | 0.8377 |
918
+ | 2.0101 | 13900 | 0.0051 | - | - |
919
+ | 2.0246 | 14000 | 0.0108 | - | - |
920
+ | 2.0390 | 14100 | 0.0036 | - | - |
921
+ | 2.0535 | 14200 | 0.0055 | - | - |
922
+ | 2.0680 | 14300 | 0.0042 | - | - |
923
+ | 2.0824 | 14400 | 0.0049 | - | - |
924
+ | 2.0969 | 14500 | 0.0158 | - | - |
925
+ | 2.1114 | 14600 | 0.0024 | - | - |
926
+ | 2.1258 | 14700 | 0.0075 | - | - |
927
+ | 2.1403 | 14800 | 0.0044 | - | - |
928
+ | 2.1547 | 14900 | 0.0024 | - | - |
929
+ | 2.1692 | 15000 | 0.0069 | - | - |
930
+ | 2.1837 | 15100 | 0.008 | - | - |
931
+ | 2.1981 | 15200 | 0.0074 | - | - |
932
+ | 2.2126 | 15300 | 0.0044 | - | - |
933
+ | 2.2270 | 15400 | 0.0048 | - | - |
934
+ | 2.2415 | 15500 | 0.006 | - | - |
935
+ | 2.2560 | 15600 | 0.008 | - | - |
936
+ | 2.2704 | 15700 | 0.0045 | - | - |
937
+ | 2.2849 | 15800 | 0.0043 | - | - |
938
+ | 2.2993 | 15900 | 0.0054 | - | - |
939
+ | 2.3138 | 16000 | 0.003 | - | - |
940
+ | 2.3283 | 16100 | 0.0034 | - | - |
941
+ | 2.3427 | 16200 | 0.0018 | - | - |
942
+ | 2.3572 | 16300 | 0.006 | - | - |
943
+ | 2.3717 | 16400 | 0.0064 | - | - |
944
+ | 2.3861 | 16500 | 0.0044 | - | - |
945
+ | 2.4006 | 16600 | 0.0091 | - | - |
946
+ | 2.4150 | 16700 | 0.006 | - | - |
947
+ | 2.4295 | 16800 | 0.0064 | - | - |
948
+ | 2.4440 | 16900 | 0.0024 | - | - |
949
+ | 2.4584 | 17000 | 0.008 | - | - |
950
+ | 2.4729 | 17100 | 0.0042 | - | - |
951
+ | 2.4873 | 17200 | 0.0059 | - | - |
952
+ | 2.5018 | 17300 | 0.0049 | - | - |
953
+ | 2.5163 | 17400 | 0.0025 | - | - |
954
+ | 2.5307 | 17500 | 0.0111 | - | - |
955
+ | 2.5452 | 17600 | 0.0039 | - | - |
956
+ | 2.5597 | 17700 | 0.0044 | - | - |
957
+ | 2.5741 | 17800 | 0.0029 | - | - |
958
+ | 2.5886 | 17900 | 0.0034 | - | - |
959
+ | 2.6030 | 18000 | 0.0025 | - | - |
960
+ | 2.6175 | 18100 | 0.005 | - | - |
961
+ | 2.6320 | 18200 | 0.0052 | - | - |
962
+ | 2.6464 | 18300 | 0.0059 | - | - |
963
+ | 2.6609 | 18400 | 0.0062 | - | - |
964
+ | 2.6753 | 18500 | 0.0055 | - | - |
965
+ | 2.6898 | 18600 | 0.0072 | - | - |
966
+ | 2.7043 | 18700 | 0.0052 | - | - |
967
+ | 2.7187 | 18800 | 0.0047 | - | - |
968
+ | 2.7332 | 18900 | 0.0073 | - | - |
969
+ | 2.7477 | 19000 | 0.0071 | - | - |
970
+ | 2.7621 | 19100 | 0.0049 | - | - |
971
+ | 2.7766 | 19200 | 0.0073 | - | - |
972
+ | 2.7910 | 19300 | 0.0018 | - | - |
973
+ | 2.8055 | 19400 | 0.0037 | - | - |
974
+ | 2.8200 | 19500 | 0.0048 | - | - |
975
+ | 2.8344 | 19600 | 0.0037 | - | - |
976
+ | 2.8489 | 19700 | 0.0065 | - | - |
977
+ | 2.8633 | 19800 | 0.0059 | - | - |
978
+ | 2.8778 | 19900 | 0.0039 | - | - |
979
+ | 2.8923 | 20000 | 0.0022 | - | - |
980
+ | 2.9067 | 20100 | 0.0054 | - | - |
981
+ | 2.9212 | 20200 | 0.0027 | - | - |
982
+ | 2.9356 | 20300 | 0.0049 | - | - |
983
+ | 2.9501 | 20400 | 0.0039 | - | - |
984
+ | 2.9646 | 20500 | 0.0102 | - | - |
985
+ | 2.9790 | 20600 | 0.0055 | - | - |
986
+ | 2.9935 | 20700 | 0.0063 | - | - |
987
+ | 3.0 | 20745 | - | 0.4280 | 0.8453 |
988
+ | 3.0080 | 20800 | 0.0021 | - | - |
989
+ | 3.0224 | 20900 | 0.0045 | - | - |
990
+ | 3.0369 | 21000 | 0.0018 | - | - |
991
+ | 3.0513 | 21100 | 0.0032 | - | - |
992
+ | 3.0658 | 21200 | 0.0025 | - | - |
993
+ | 3.0803 | 21300 | 0.0008 | - | - |
994
+ | 3.0947 | 21400 | 0.0051 | - | - |
995
+ | 3.1092 | 21500 | 0.003 | - | - |
996
+ | 3.1236 | 21600 | 0.0075 | - | - |
997
+ | 3.1381 | 21700 | 0.0047 | - | - |
998
+ | 3.1526 | 21800 | 0.0053 | - | - |
999
+ | 3.1670 | 21900 | 0.0034 | - | - |
1000
+ | 3.1815 | 22000 | 0.0036 | - | - |
1001
+ | 3.1960 | 22100 | 0.0014 | - | - |
1002
+ | 3.2104 | 22200 | 0.0037 | - | - |
1003
+ | 3.2249 | 22300 | 0.0015 | - | - |
1004
+ | 3.2393 | 22400 | 0.0026 | - | - |
1005
+ | 3.2538 | 22500 | 0.0023 | - | - |
1006
+ | 3.2683 | 22600 | 0.0013 | - | - |
1007
+ | 3.2827 | 22700 | 0.0026 | - | - |
1008
+ | 3.2972 | 22800 | 0.0031 | - | - |
1009
+ | 3.3116 | 22900 | 0.0017 | - | - |
1010
+ | 3.3261 | 23000 | 0.0022 | - | - |
1011
+ | 3.3406 | 23100 | 0.0046 | - | - |
1012
+ | 3.3550 | 23200 | 0.0023 | - | - |
1013
+ | 3.3695 | 23300 | 0.0021 | - | - |
1014
+ | 3.3839 | 23400 | 0.0054 | - | - |
1015
+ | 3.3984 | 23500 | 0.0022 | - | - |
1016
+ | 3.4129 | 23600 | 0.0068 | - | - |
1017
+ | 3.4273 | 23700 | 0.0016 | - | - |
1018
+ | 3.4418 | 23800 | 0.0017 | - | - |
1019
+ | 3.4563 | 23900 | 0.0011 | - | - |
1020
+ | 3.4707 | 24000 | 0.0022 | - | - |
1021
+ | 3.4852 | 24100 | 0.0091 | - | - |
1022
+ | 3.4996 | 24200 | 0.0023 | - | - |
1023
+ | 3.5141 | 24300 | 0.0017 | - | - |
1024
+ | 3.5286 | 24400 | 0.002 | - | - |
1025
+ | 3.5430 | 24500 | 0.0013 | - | - |
1026
+ | 3.5575 | 24600 | 0.0067 | - | - |
1027
+ | 3.5719 | 24700 | 0.0037 | - | - |
1028
+ | 3.5864 | 24800 | 0.0007 | - | - |
1029
+ | 3.6009 | 24900 | 0.0044 | - | - |
1030
+ | 3.6153 | 25000 | 0.0023 | - | - |
1031
+ | 3.6298 | 25100 | 0.0049 | - | - |
1032
+ | 3.6443 | 25200 | 0.0037 | - | - |
1033
+ | 3.6587 | 25300 | 0.0033 | - | - |
1034
+ | 3.6732 | 25400 | 0.0034 | - | - |
1035
+ | 3.6876 | 25500 | 0.0014 | - | - |
1036
+ | 3.7021 | 25600 | 0.0031 | - | - |
1037
+ | 3.7166 | 25700 | 0.0023 | - | - |
1038
+ | 3.7310 | 25800 | 0.0027 | - | - |
1039
+ | 3.7455 | 25900 | 0.0028 | - | - |
1040
+ | 3.7599 | 26000 | 0.004 | - | - |
1041
+ | 3.7744 | 26100 | 0.0017 | - | - |
1042
+ | 3.7889 | 26200 | 0.0009 | - | - |
1043
+ | 3.8033 | 26300 | 0.0013 | - | - |
1044
+ | 3.8178 | 26400 | 0.0056 | - | - |
1045
+ | 3.8322 | 26500 | 0.001 | - | - |
1046
+ | 3.8467 | 26600 | 0.0019 | - | - |
1047
+ | 3.8612 | 26700 | 0.001 | - | - |
1048
+ | 3.8756 | 26800 | 0.0051 | - | - |
1049
+ | 3.8901 | 26900 | 0.0057 | - | - |
1050
+ | 3.9046 | 27000 | 0.0032 | - | - |
1051
+ | 3.9190 | 27100 | 0.0033 | - | - |
1052
+ | 3.9335 | 27200 | 0.0025 | - | - |
1053
+ | 3.9479 | 27300 | 0.002 | - | - |
1054
+ | 3.9624 | 27400 | 0.0022 | - | - |
1055
+ | 3.9769 | 27500 | 0.0026 | - | - |
1056
+ | 3.9913 | 27600 | 0.0022 | - | - |
1057
+ | 4.0 | 27660 | - | 0.3906 | 0.8562 |
1058
+ | 4.0058 | 27700 | 0.0022 | - | - |
1059
+ | 4.0202 | 27800 | 0.0018 | - | - |
1060
+ | 4.0347 | 27900 | 0.0018 | - | - |
1061
+ | 4.0492 | 28000 | 0.0012 | - | - |
1062
+ | 4.0636 | 28100 | 0.0009 | - | - |
1063
+ | 4.0781 | 28200 | 0.0018 | - | - |
1064
+ | 4.0926 | 28300 | 0.0033 | - | - |
1065
+ | 4.1070 | 28400 | 0.004 | - | - |
1066
+ | 4.1215 | 28500 | 0.0009 | - | - |
1067
+ | 4.1359 | 28600 | 0.0019 | - | - |
1068
+ | 4.1504 | 28700 | 0.0016 | - | - |
1069
+ | 4.1649 | 28800 | 0.0027 | - | - |
1070
+ | 4.1793 | 28900 | 0.0022 | - | - |
1071
+ | 4.1938 | 29000 | 0.0018 | - | - |
1072
+ | 4.2082 | 29100 | 0.0067 | - | - |
1073
+ | 4.2227 | 29200 | 0.001 | - | - |
1074
+ | 4.2372 | 29300 | 0.0008 | - | - |
1075
+ | 4.2516 | 29400 | 0.0021 | - | - |
1076
+ | 4.2661 | 29500 | 0.0008 | - | - |
1077
+ | 4.2805 | 29600 | 0.0024 | - | - |
1078
+ | 4.2950 | 29700 | 0.0034 | - | - |
1079
+ | 4.3095 | 29800 | 0.0014 | - | - |
1080
+ | 4.3239 | 29900 | 0.0074 | - | - |
1081
+ | 4.3384 | 30000 | 0.0021 | - | - |
1082
+ | 4.3529 | 30100 | 0.0051 | - | - |
1083
+ | 4.3673 | 30200 | 0.001 | - | - |
1084
+ | 4.3818 | 30300 | 0.005 | - | - |
1085
+ | 4.3962 | 30400 | 0.0019 | - | - |
1086
+ | 4.4107 | 30500 | 0.0051 | - | - |
1087
+ | 4.4252 | 30600 | 0.0009 | - | - |
1088
+ | 4.4396 | 30700 | 0.003 | - | - |
1089
+ | 4.4541 | 30800 | 0.002 | - | - |
1090
+ | 4.4685 | 30900 | 0.0043 | - | - |
1091
+ | 4.4830 | 31000 | 0.0091 | - | - |
1092
+ | 4.4975 | 31100 | 0.0011 | - | - |
1093
+ | 4.5119 | 31200 | 0.0018 | - | - |
1094
+ | 4.5264 | 31300 | 0.0008 | - | - |
1095
+ | 4.5409 | 31400 | 0.0008 | - | - |
1096
+ | 4.5553 | 31500 | 0.0027 | - | - |
1097
+ | 4.5698 | 31600 | 0.0016 | - | - |
1098
+ | 4.5842 | 31700 | 0.0019 | - | - |
1099
+ | 4.5987 | 31800 | 0.0031 | - | - |
1100
+ | 4.6132 | 31900 | 0.0036 | - | - |
1101
+ | 4.6276 | 32000 | 0.0026 | - | - |
1102
+ | 4.6421 | 32100 | 0.0012 | - | - |
1103
+ | 4.6565 | 32200 | 0.0016 | - | - |
1104
+ | 4.6710 | 32300 | 0.0005 | - | - |
1105
+ | 4.6855 | 32400 | 0.0018 | - | - |
1106
+ | 4.6999 | 32500 | 0.001 | - | - |
1107
+ | 4.7144 | 32600 | 0.0005 | - | - |
1108
+ | 4.7289 | 32700 | 0.0027 | - | - |
1109
+ | 4.7433 | 32800 | 0.0007 | - | - |
1110
+ | 4.7578 | 32900 | 0.001 | - | - |
1111
+ | 4.7722 | 33000 | 0.0009 | - | - |
1112
+ | 4.7867 | 33100 | 0.001 | - | - |
1113
+ | 4.8012 | 33200 | 0.001 | - | - |
1114
+ | 4.8156 | 33300 | 0.0011 | - | - |
1115
+ | 4.8301 | 33400 | 0.0007 | - | - |
1116
+ | 4.8445 | 33500 | 0.0009 | - | - |
1117
+ | 4.8590 | 33600 | 0.0025 | - | - |
1118
+ | 4.8735 | 33700 | 0.0012 | - | - |
1119
+ | 4.8879 | 33800 | 0.0064 | - | - |
1120
+ | 4.9024 | 33900 | 0.0013 | - | - |
1121
+ | 4.9168 | 34000 | 0.0018 | - | - |
1122
+ | 4.9313 | 34100 | 0.0023 | - | - |
1123
+ | 4.9458 | 34200 | 0.0049 | - | - |
1124
+ | 4.9602 | 34300 | 0.0009 | - | - |
1125
+ | 4.9747 | 34400 | 0.0011 | - | - |
1126
+ | 4.9892 | 34500 | 0.0016 | - | - |
1127
+ | 5.0 | 34575 | - | 0.3471 | 0.8686 |
1128
+
1129
+ </details>
1130
+
1131
+ ### Framework Versions
1132
+ - Python: 3.9.7
1133
+ - Sentence Transformers: 5.0.0
1134
+ - Transformers: 4.56.0
1135
+ - PyTorch: 2.7.1+cu126
1136
+ - Accelerate: 1.5.2
1137
+ - Datasets: 4.0.0
1138
+ - Tokenizers: 0.22.0
1139
+
1140
+ ## Citation
1141
+
1142
+ ### BibTeX
1143
+
1144
+ #### Sentence Transformers
1145
+ ```bibtex
1146
+ @inproceedings{reimers-2019-sentence-bert,
1147
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1148
+ author = "Reimers, Nils and Gurevych, Iryna",
1149
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1150
+ month = "11",
1151
+ year = "2019",
1152
+ publisher = "Association for Computational Linguistics",
1153
+ url = "https://arxiv.org/abs/1908.10084",
1154
+ }
1155
+ ```
1156
+
1157
+ #### MultipleNegativesRankingLoss
1158
+ ```bibtex
1159
+ @misc{henderson2017efficient,
1160
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1161
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1162
+ year={2017},
1163
+ eprint={1705.00652},
1164
+ archivePrefix={arXiv},
1165
+ primaryClass={cs.CL}
1166
+ }
1167
+ ```
1168
+
1169
+ <!--
1170
+ ## Glossary
1171
+
1172
+ *Clearly define terms in order to be accessible across audiences.*
1173
+ -->
1174
+
1175
+ <!--
1176
+ ## Model Card Authors
1177
+
1178
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1179
+ -->
1180
+
1181
+ <!--
1182
+ ## Model Card Contact
1183
+
1184
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1185
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "XLMRobertaModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "transformers_version": "4.56.0",
24
+ "type_vocab_size": 1,
25
+ "use_cache": true,
26
+ "vocab_size": 250002
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.0.0",
5
+ "transformers": "4.56.0",
6
+ "pytorch": "2.7.1+cu126"
7
+ },
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1c00f2ee0874d1398b1a88607495557b7c90c26258a392cc00989be086c82d1a
3
+ size 2239607176
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 512,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }