JonasGru commited on
Commit
1981db8
·
verified ·
1 Parent(s): cd58f00

Fine-tuned on Lithuanian data retriever model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md CHANGED
@@ -1,3 +1,654 @@
1
  ---
2
- license: apache-2.0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ language: []
3
+ tags:
4
+ - sentence-transformers
5
+ - sentence-similarity
6
+ - feature-extraction
7
+ - generated_from_trainer
8
+ - dataset_size:199992
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: intfloat/multilingual-e5-base
11
+ widget:
12
+ - source_sentence: 'query: eigulių kapinės paaiškinimas'
13
+ sentences:
14
+ - 'passage: fair antigua we salute thee nuostabioji antigva mes sveikinam tave antigvos
15
+ ir barbudos valstybinis himnas himno kompozitorius walter garnet picart chambers
16
+ teksto autorius novelle hamilton richards naudojamas nuo oficialiai patvirtintas
17
+ naudojamas kartu su karališkuoju himnu god save the queen dažniausiai grojamas
18
+ tik pirmas himno posmas eilės anglų kalba fair antigua and barbuda we thy sons
19
+ and daughters stand strong and firm in peace or danger to safeguard our native
20
+ land we commit ourselves to building true nation brave and free ever striving
21
+ ever seeking dwell in love and unity nuorodos instrumentinė versija mp kategorija
22
+ antigvos ir barbudos atributika kategorija valstybiniai himnai'
23
+ - 'passage: eigulių kapinių vakarinė pusė eigulių kapinės kapinės kaune eiguliuose
24
+ neries kairiajame krante jonavos netoli magistralės plotas ha kapinės suskirstytos
25
+ kvartalus aptvertos metaline tvora sujungta mūro stulpais pagrindiniai vartai
26
+ iš jonavos pusės antkapiniai paminklai daugiausia iš akmens kapinėse palaidota
27
+ nemažai žymių žmonių įrengtas lietuvoje cirko artistų panteonas istorija eigulių
28
+ kaimo kapinės įsteigtos apie iš pradžių laidoti kaimo ir apylinkės gyventojai
29
+ eigulius ir prijungus prie kauno tapo miesto kapinėmis kapinėse yra lietuvos cirko
30
+ artistų panteonas eigulių kapinės įrašytos kultūros paminklų sąrašą kapinėse palaidoti
31
+ cirko artistai francas černiauskas pranas gudauskas maksimilianas truci massimiliano
32
+ truzzi konstantinas feroni mykolas vilenčikas antanas pilkauskas jonas ramanauskas
33
+ vladislava variakojienė stankutė jadvyga ramanauskienė stankutė ir kt lietuvos
34
+ teatro kūrėjas juozas vaičkus aktorės bronė kurmytė monkevičienė ona kurmytė mazurkevičienė
35
+ visuomenės kultūros ir sporto veikėjai juozas bagdonas stepas butautas klemensas
36
+ čerbulėnas valerija čiurlionytė karužienė saulius gricius dalia grinkevičiūtė
37
+ juozas muralis karininkai jonas jurgis bulota antanas malijonis anatolijus okulič
38
+ kozarinas jonas petruitis rapolas okulič kazarinas pulkininkas archeologas petras
39
+ tarasenka pedagogė pianistė kompozitorė elena laumenskienė profesoriai konradas
40
+ aleksa vytautas vaičiūnas žemaitis kunigas erikas laiconas prozininkas vertėjas
41
+ kazys jankauskas skulptorius tapytojas matas menčinskas sopranas violeta sagaitytė
42
+ kankinė elena spirgevičiūtė perlaidota iš senųjų kapinių perlaidota prie šv antano
43
+ paduviečio bažnyčios prozininkas mečys rakauskas politinis bei visuomenės veikėjas
44
+ juozapas jokubauskas naikinant kauno centrines kapines šiose kapinėse perlaidoti
45
+ savanoriai kauno miesto ir apskrities komendantūros eilinis pranas eimutis'
46
+ - 'passage: permas pradžia ma pabaiga ma epochos lopingijus gvadalupis kizuralis
47
+ px dimetrodon grandis fosilinis skeletas permas ma milijonai metų permas paleozojaus
48
+ eros periodas tarptautinis žymėjimas anglų geologas seras roderick murchison tyrinėdamas
49
+ uralo kalnus išskyrė šią naują sistemą ir pavadino permu pagal permės miesto pavadinimą
50
+ permo periodas pasibaigė permo triaso išmirimu tai kartu ir paleozojaus eros riba
51
+ per didžiausią žemės istorijoje išmirimą išnyko daugiau kaip jūrų gyvybės ir sausumos
52
+ gyvybės manoma kad tokį išmirimą paskatino nukritęs meteoritas arba didelis vulkaninis
53
+ aktyvumas išsiveržę sibiro trapai šis įvykis pakeitė žemės klimatą todėl išnyko
54
+ labai daug floros ir faunos rūšių lietuvoje ankstyvojo permo nuogulos aptinkamos
55
+ tik siaurame ruože per perloją ir kalvariją link lenkijos ir karaliaučiaus srities
56
+ pasienio sąlygos permo laikotarpiu kontinentai susijungė superkontinentą pangėją
57
+ žemėje buvo du okeanai paleotetis mažas praktiškai vidinis okeanas ir pantalasas
58
+ taip pat skaitykite geologinė laiko skalė šaltiniai kategorija paleozojus'
59
+ - source_sentence: 'query: šrekas apibrėžimas'
60
+ sentences:
61
+ - 'passage: šrekas jav sukurtas kompiuterinės animacijos komedinis filmas william
62
+ steig pasakų knygos tuo pačiu pavadinimu ekranizacija filmą sukūrė animacijos
63
+ studija dreamworks animation skg režisavo iš naujosios zelandijos kilęs režisierius
64
+ andrew adamson tai buvo pirmasis filmas kuris pelnė oskarą už geriausią pilnametražį
65
+ animacinį filmą apdovanojimo kategorija atsirado lapkričio filmas išleistas dvd
66
+ formatu vardas šrekas kilo iš reiškiančio baimę terorą arba išgąstį tokią pat
67
+ reikšmę turi animacinis filmas kritikų pripažintas kaip suaugusiųjų dėmesio vertas
68
+ animacinis filmas dėl daugybės suaugusiems skirtų juokų ir sąsajų tačiau paprastas
69
+ scenarijus ir humoras taip pat puikiai tiko vaikų auditorijai filme jaučiamas
70
+ žymus pop muzikos naudojimas garso takelyje galima rasti tokių dainų autorių kaip
71
+ smash mouth joan jett the proclaimers jason wade the baha men ir rufus wainwright
72
+ filmo išleidimas buvo ypatingai sėkmingas ir tai padėjo dreamworks tapti pagrindine
73
+ walt disney pictures varžove pilnametražių animacinių filmų industrijoje ypatingai
74
+ kompiuterinėje trimatėje animacijoje be to šrekas tapo kompanijos animacinių filmų
75
+ talismanu siužetas šrekas asocialus ir ramybę mėgstantis žmogėdra kuriam patinka
76
+ vienišiaus gyvenimas savo pelkėje tačiau lordo farkvado įsakymas ištremti pasakų
77
+ būtybes šreko valdas sudrumsčia jo įprastą gyvenimo rimtį nepatenkintas farkvado
78
+ sprendimu šrekas nusprendžia nuvykti valdovo pilį ir pareikalauti kad ištremtieji
79
+ būtų perkelti kur nors kitur su juo kelionę leidžiasi ir įkyrus žmogėdros palydovas
80
+ asilėlis pasiūlęs šį ten nuvesti tuo tarpu farkvado kambaryje pastatytas magiškas
81
+ veidrodis praneša jog šis privalo vesti princesę'
82
+ - 'passage: rizika nuo dievo malonės priklausantis pragyvenimas arba apsukrumas
83
+ galimi faktinių rezultatų nuokrypiai nuo laukiamų dažniausiai siejama su nepageidaujamo
84
+ beverčio ar žalingo rezultato klaidos ar nuostolių tikimybe rizikingu laikomas
85
+ toks sprendimas kurio klaidos ar faktinio rezultato nuokrypio nuo laukiamo tikimybė
86
+ santykinai didelė arba nežinoma ir to kaina viršija laukiamą naudą arba vykdymo
87
+ sąnaudas rūšys kredito rizika rizika dėl sandorio šalies nesugebėjimo atsiskaityti
88
+ sutartyje nustatyta tvarka rinkos rizika tikimybė kad rinkos kintamieji pvz palūkanų
89
+ normos valiutų kursai nuosavybės vertybinių popierių biržos prekių kainos ir kt
90
+ pasikeis taip jog bankas dėl sudaryto sandorio patirs nuostolių užsienio valiutos
91
+ kurso rizika rizika kad bankas turintis grynąją atvirą poziciją užsienio valiuta
92
+ taip pat ir tauriaisiais metalais susidariusią dėl prekybinių operacijų užsienio
93
+ valiuta ir ar dėl jo turto ir įsipareigojimų struktūros patirs nuostolių dėl tam
94
+ tikros užsienio valiutos keitimo kurso arba kursų svyravimo palūkanų normos rizika
95
+ rizika kad bankas patirs nuostolių dėl palūkanų normų svyravimo nuosavybės vertybinių
96
+ popierių kainos rizika rizika kad bankas patirs nuostolių dėl turimų nuosavybės
97
+ vertybinių popierių kainų svyravimo išskiriama specifinė ir bendroji palūkanų
98
+ normos bei nuosavybės vertybinių popierių kainos rizika specifinė rizika atitinkamos
99
+ finansinės priemonės kainos pasikeitimo rizika dėl veiksnių susijusių su jos emitentu
100
+ arba išvestinės finansinės priemonės atveju rizika susijusi su pagrindinės pirminės
101
+ finansinės priemonės emitentu bendroji rizika nuostoliųdėl bendro finansinių priemonių
102
+ ir išvestinių finansinių priemonių rinkos kainų svyravimo rizika sandorio šalies'
103
+ - 'passage: xviii pasaulio futbolo čempionatas vyko birželio liepos oje vokietijos
104
+ miestų čempionais ketvirtą kartą tapo italijos vyrų futbolo rinktinė finale po
105
+ baudinių serijos įveikusi prancūziją atrankos varžybos vyko nuo sausio iki pabaigos
106
+ čempionato burtai ištraukti gruodžio leipcige vokietija iškovojo teisę rengti
107
+ varžybas nurungusi kitas kandidates pietų afrikos respubliką angliją braziliją
108
+ ir maroką italija laimėjo turnyrą ketvirtą kartą tapdama pasaulio čempione finale
109
+ jie po baudinių serijos įveikė prancūziją kai pagrindinis laikas buvo baigtas
110
+ lygiosiomis vokietija įveikė portugaliją ir užėmė trečią vietą angola gana dramblio
111
+ kaulo krantas trinidadas ir tobagas bei togas pasaulio čempionate dalyvavo pirmą
112
+ kartą šiame čempionate serbija dalyvavo kartu su juodkalnija kaip serbija ir juodkalnija
113
+ nors gegužės mėn prieš pat turnyrą juodkalnija pasisakė referendume dėl pasaulio
114
+ futbolo taurė tapo vienu žiūrimiausių įvykių televizijos istorijoje transliacija
115
+ iš viso buvo įsijungta milijardo kartų finalas pritraukė maždaug milijono žiūrovų
116
+ auditoriją šeimininkai balsavimas dėl turnyro šeimininkų išrinkimo įvyko liepą
117
+ ciuriche šveicarijoje jame dalyvavo keturios paraiškas pateikusios šalys brazilija
118
+ paraišką atsiimė prieš balsavimą vokietija pietų afrikos respublika anglija ir
119
+ marokas reikėjo trijų balsavimo raundų po kurio iškrisdavo po valstybę surinkusią
120
+ mažiausiai balsų pirmieji du turai vyko liepos trečiasis liepos kurį vokietija
121
+ laimėjo prieš pietų afrikos respubliką balsavimo rezultatai šalis pirmasis raundas
122
+ antrasis raundas trečiasis raundas vokietija pietų afrikos respublika anglija
123
+ marokas įtarimai dėl kyšininkavimo ir korupcijos kaltinimai kyšininkavimu ir korupcija
124
+ jau nuo pat pradžių lydėjo'
125
+ - source_sentence: 'query: poligrafas paaiškinimas'
126
+ sentences:
127
+ - 'passage: thumb poligrafas melo detektorius žmogaus emocinę būseną fiksuojantis
128
+ prietaisas atliekantis įvairių su žmogaus emocijomis susijusių fiziologinių rodiklių
129
+ registravimą paprasčiausiu atveju matuojamas žmogaus kūno elektrinis laidumas
130
+ toks poligrafas susideda iš ommetro ir kalibravimo įrenginio žmogui jaudinantis
131
+ išsiskiria prakaitas kūno varža sumažėja ką ir parodo prietaisas nustatant ar
132
+ žmogus meluoja prieš matavimus užduodami testiniai klausimai vieni susilauksiantys
133
+ žinomai melagingo atsakymo kiti žinomai nuoširdaus remiantis varžos rodikliais
134
+ gautais atitinkamais momentais galima daryti prielaidą apie tai ar žmogus vėliau
135
+ atsakinėjo meluodamas ar ne sudėtingesni poligrafai matuoja ir kitus parametrus
136
+ pvz pulso dažnį kraujospūdį adrenalino išsiskyrimą vyzdžių dydį judesių kiekį
137
+ ir pan teisminiame tyrime detektorius pirmą kartą buvo panaudotas jav vasario
138
+ poligrafija daugelio mokslininkų yra vertinama kaip pseudomokslas šiuo metu daugumoje
139
+ europos valstybių poligrafo parodymai nelaikomi patikimu įrodymu teisme jav teismuose
140
+ žmogus gali pasitikrinti melo detektoriumi tik tada jei sutinka pats kanados teismuose
141
+ nuo metų šis prietaisas nebegali būti naudojamas australijoje bendro nutarimo
142
+ dar nėra tačiau žinoma atvejų kai teismas atsisakė pripažinti poligrafo parodymus
143
+ gynybos naudai lietuvoje poligrafas pradėtas naudoti metais nežiūrint tai kad
144
+ poligrafo panaudojimo įstatymas nėra tobulas ir jame nėra numatyti kriminalinių
145
+ įvykių tyrimai vadovaujantis lr baudžiamojo proceso kodeksu buvo sėkmingai atlikti
146
+ tyrimai poligrafu keliasdešimtyje rezonansinių baudžiamųjų bylų nuo metų tyriant
147
+ kriminalinius nusikaltimus pasiteisino ekt įvykio žinojimo testas metodika kuri
148
+ jau aprašyta lenkijoje ir rusijoje išleistuose vadovėliuose poligrafologams išnašos
149
+ nuorodos skeptic dictionary polygraph'
150
+ - 'passage: didžiulis ežeras pietryčių lietuvoje trakų rajone lentvario seniūnijoje
151
+ apie km šiaurės rytus nuo trakų km šiaurės vakarus nuo grigiškių pietvakarius
152
+ nuo automagistralės vilnius klaipėda ilgis iš šiaurės vakarų pietryčius km plotis
153
+ iki km altitudė giliausia vieta yra ežero viduryje ir siekia kranto linija vingiuota
154
+ pietinėje dalyje yra kelios gilios įlankos jų gylis rytinių ir pietinės vakarinės
155
+ yra salelės ha ha ha ha ha ha ir ha taip pat yra keletas plaukiojančių salų pietiniai
156
+ ir šiauriniai krantai žemi ir pelkėti driekiasi pelkių plotai rytiniai ir vakariniai
157
+ krantai statūs aukšti apyežeris aukštas bemiškis plyti pievos tik vakaruose auga
158
+ miškelis vakarinę didžiulio dalį įteka bevardis upelis taip pat prateka neries
159
+ intakas saidė didžiulis nuo moluvėnų pusės pietrytiniame didžiulio krante yra
160
+ dėdeliškių kaimas vakariniame moluvėnų kaimas veikia pramogų ir poilsio kompleksas
161
+ ežerėvardis didžiùlis kilęs iš būdvardžio didžiulis labai didelis šlapynė ežero
162
+ pietinėje dalyje šaltiniai kategorija trakų rajono ežerai'
163
+ - 'passage: birželio yra oji metų diena pagal grigaliaus kalendorių keliamaisiais
164
+ metais oji nuo šios dienos iki metų galo lieka dienos informacija šventės vardadieniai
165
+ diana galindas liutgarda margarita pelagija pelagijus vingailė šią dieną lietuvoje
166
+ įvykiai vytenis mūšyje prie trojanovo sumušė lenčicos kunigaikščio kazimiero ii
167
+ kariuomenę pirmoji klausytojų grupė kaune baigė pašto telegrafo ir telefono kursus
168
+ steigiamajame seime priimta laikinoji iii lietuvos konstitucija skelbianti lietuvą
169
+ demokratine respublika naujamiestyje atidengtas paminklas vincui kudirkai paminklą
170
+ sukūrė skulptorius vincas grybas išrinktas ketvirtasis seimas įsteigta lietuvos
171
+ moterų sąjunga prisiekė rolando pakso vadovaujama vyriausybė vladimiras putinas
172
+ pasirašė įstatymus dėl lietuvos ir rusijos valstybės sienos bei kontinentinio
173
+ šelfo baltijos jūroje atskyrimo sutarčių ratifikavimo lietuviškas vikižodynas
174
+ pasiekė straipsnių ribą gimimo dienos johanas ferdinandas kelkis mažosios lietuvos
175
+ pedagogas spaudos ir raštijos darbuotojas jonas burdulis burdulevičius romos katalikų
176
+ kunigas visuomenininkas lietuvybės puoselėtojas antanas baltrušaitis antanėlis
177
+ knygnešys spaudos darbuotojas antanas pocius vargonininkas pianistas dirigentas
178
+ pedagogas kompozitorius aleksas ambrose jav lietuvių visuomenės ir spaudos veikėjas
179
+ jonas žmuidzinas prozininkas poetas jonas graičiūnas lietuvių poetas ir vertėjas
180
+ antanas gulbinas lietuvos gydytojas dermatologas daktaras albinas liaugminas lietuvos
181
+ pedagogas psichologas jav lietuvių visuomenės veikėjas filosofijos daktaras aleksandras
182
+ lileikis lietuvos tarpukario policininkas teistas dėl karo nusikaltimų holokausto
183
+ balys lukošius aktorius eugenijus manomaitis lietuvos statybos inžinierius architektas
184
+ vytautas antanas dambrava lietuvos ir jav diplomatas žurnalistas visuomenės veikėjas
185
+ teisės mokslų daktaras vytautas sirtautas lietuvos kalbininkas poliglotas vadovėlių
186
+ autorius poetas marija mondeikaitė'
187
+ - source_sentence: 'query: niels bohr apibrėžimas'
188
+ sentences:
189
+ - 'passage: vaizdas das jüngste gericht memling jpg thumb px paskutiniojo teismo
190
+ diena aut hans memling apie dies irae iš lot rūstybės diena žymus xiii lotyniškas
191
+ bažnytinis himnas sukurtas tomo celaniečio tai lotyniška poema aprašanti paskutiniojo
192
+ teismo dieną dies irae įeina requiem sekvenciją kūrinio įžanga naudojama requiem
193
+ dies iræ dies illa solvet sæclum in favilla teste david cum sibylla quantus tremor
194
+ est futurus quando judex est venturus cuncta stricte discussurus erste strophe
195
+ des dies irae vaizdas dies irae ogg nuorodos dies irae iš mocarto requiem grigališkoji
196
+ giesmė dies irae kategorija lotyniškos frazės kategorija bažnytinė muzika'
197
+ - 'passage: nilsas boras spalio lapkričio danų fizikas daug prisidėjo prie kvantinės
198
+ mechanikos teorijos vystymo biografija jaunystė nilsas boras gimė kopenhagoje
199
+ metais jo tėvas kristianas boras christian bohr dirbo fiziologijos profesoriumi
200
+ kopenhagos universitete ir buvo danijos mokslų akademijos nariu motina elena adler
201
+ ellen adler bohr kilusi iš pasiturinčios sefardų žydų šeimos žinomos tarp danų
202
+ bankininkų ir parlamentarų boras turėjo vyresniąją seserį dženę ir jaunesnįjį
203
+ brolį haroldą haroldas boras matematikas ir olimpinis futbolo žaidėjas londonas
204
+ žaidė danijos rinktinės komandoje nilsas boras irgi buvo aistringas futbolo žaidėjas
205
+ abudu broliai sužaidė daugybę mačų už akademisk boldklub metais boras baigia hamelholmo
206
+ mokyklą ir įstoja kopenhagos universitetą metais danijos karališkoji akademija
207
+ paskiria aukso medalį už skysčių paviršiaus įtempimo tyrimus metais gauna fizikos
208
+ mokslų magistro laipsnį metais boras kopenhagos universitete įgijo daktaro laipsnį
209
+ apgynęs disertaciją kurioje buvo nagrinėjamas elektroninės teorijos panaudojimas
210
+ metalų savybėms aiškinti tuo metu jis studijavo viktorijos universitete mančesteris
211
+ jungtinė karalystė ernesto rezerfordo ernest rutherford laboratorijoje šioje laboratorijoje
212
+ ir buvo užbaigtas eksperimentas kurio metu aiškių aiškiausiai buvo įrodyta kad
213
+ atomas turi branduolį metų balandį boras pasiūlo atomo numerio dėsnio izotopijos
214
+ ir radioaktyviųjų poslinkių dėsnių idėjas remdamasis rezefordo teorijomis boras
215
+ metais paskelbė savo atominės struktūros modelį įvesdamas teiginį apie elektronus
216
+ skriejančius aplink atomo branduolį ir kad chemines elementų savybes lemia elektronų
217
+ kiekis kiekvienoje orbitoje boras taip pat iškėlė idėją kad elektronas gali kristi
218
+ iš aukštesnės energijos orbitos'
219
+ - 'passage: skuodo rajono mosėdžio gimnazija dieninė savarankiško mokymosi bendrojo
220
+ lavinimo mokykla mosėdyje skuodo raj salantų vykdanti pagrindinio vidurinio ir
221
+ papildomo ugdymo programas lietuvių kalba įstaigos kodas steigėjas skuodo rajono
222
+ savivaldybės taryba filialai mosėdžio vidurinės mokyklos krakių pradinio ugdymo
223
+ skyrius mosėdžio vidurinės mokyklos šauklių pradinio ugdymo skyrius mosėdžio vidurinės
224
+ mokyklos udralių pradinio ugdymo skyrius istorija mosėdyje prie bažnyčios įsteigta
225
+ žemaitiška parapinė mokykla atkurta įsteigta valdinė pradžios mokykla visi dalykai
226
+ buvo dėstomi rusų kalba pradėjo veikti lietuviška mokykla vasaros atostogų metu
227
+ sudegė medinis mokyklos pastatas naujieji mokslo metai prasidėjo privačiose patalpose
228
+ užbaigta naujos mokyklos statyba jos fundatorius archivyskupas pranciškus karevičius
229
+ mokykla pastatyta pagal tipinį to meto pradžios mokyklų projektą dviaukštė su
230
+ klasėmis viename šone ir erdviu koridoriumi šiaurinėje pusėje pradžios mokyklos
231
+ patalpose įsikūrė rusų karinis dalinys mokykla persikėlė buvusias klebonijos patalpas
232
+ pokariu mosėdžio pradinės mokyklos patalpose veikė lauko ligoninė jai išsikėlus
233
+ čia iš naujukų persikėlė skuodo vidurinė mokykla mosėdžio pradinės mokyklos mokiniai
234
+ mokėsi šalia esančiame valsčiaus pastate ir buvusioje klebonijoje tose patalpose
235
+ po gaisro sunaikinusio pradinės mokyklos pastatą prisiglaudė ir skuodo vidurinė
236
+ mokykla skuodo vidurinei mokyklai išsikėlus skuodą mosėdyje liko ne tik pradinės
237
+ bet ir vidurinės mokyklos klasės kurios vėliau peraugo pilną vidurinę mokyklą
238
+ vidurinę mokyklą baigė pirmoji abiturientų laida mosėdžio kolūkio lėšomis pastatyta
239
+ mokyklos sporto salė gruodžio mėn duris atvėrė nauja mokykla bet pradinės klasės
240
+ liko senajame pastate biblioteka dirbtuvės kituose pastatuose'
241
+ - source_sentence: 'query: stasys šimkus paaiškinimas'
242
+ sentences:
243
+ - 'passage: alma adamkienė vasario šiauliuose gegužės vilniuje lietuvių filantropė
244
+ visuomenės veikėja lr prezidento valdo adamkaus žmona buvusi pirmoji šalies dama
245
+ vaizdas alma adamkiene and laura bush jpg thumb left px alma adamkienė su laura
246
+ buš knygos viršelis biografija adamkienės tėvas stasys nutautas buvo prekybininkas
247
+ motina ona soblytė nutautienė talkino vyrui versle augo telšiuose tarybinei kariuomenei
248
+ veržiantis lietuvą nutautų šeima sunkvežimiu išvyko šventają kur apsigyveno pas
249
+ žvejį nuo kurios juos laivu išplaukė link švedijos bet nepasiekus kranto laivą
250
+ sulaikė vokiečių kariai ir išplukdino rygą kur juos dviems savaitėms pasodino
251
+ rygos kalėjimą iš ten juos nuplukdino prekybiniu laivu gdanską tada traukinius
252
+ ir vokietiją pabėgėlių stovyklą alma adamkienė vokietijoje baigė eichšteto lietuvių
253
+ gimnaziją ten susipažino su valdu adamkumi kur jis mokėsi lietuvių kalbos vėliau
254
+ studijavo erlangeno universiteto filologijos fakultete bavarijoje adamkienės šeima
255
+ persikėlė jungtines amerikos valstijas kur jos šeima turėjo giminių ilinojuje
256
+ pati gyveno rokforde atvykusi jungtines amerikos valstijas alma adamkienė dirbo
257
+ plieno gamyklos laboratorijoje laborante vėliau draudimo kompanijoje ištekėjo
258
+ už valdo adamkaus nuo net dvidešimt penkerius metus ji vadovavo iš jav lietuvių
259
+ bendruomenės aktyvisto juozo bačiūno įsigytai tabor farmos vasarvietei kuri tapo
260
+ svarbiu lietuvybės centru čia daug metų vykdavo liberaliosios pakraipos lietuvių
261
+ išeivių organizacijos santara šviesa suvažiavimai dar rudenį vykstant prezidento
262
+ rinkimų kampanijai alma adamkienė nusprendė kad ir kaip baigtųsi rinkimai ji lietuvoje
263
+ pradės labdaringą veiklą buvo įkurtas almos adamkienės labdaros ir paramos'
264
+ - 'passage: šis straipsnis apie vokiečių ordino magistrą apie vokiečių ordino magistrą
265
+ skaitykite šį straipsnį heinrichas roisas plauenas heinrichas fon plauenas plauenas
266
+ saksonija gruodžio mėn laukstyčių pilis prie žuvininkų semba vokiečių ordino karinis
267
+ ir valstybės veikėjas vokiečių ordino magistras biografija heinricho fon plaueno
268
+ statula kilęs iš garsios kryžiuočių ordino riterių giminės prūsiją atvyko kaip
269
+ vokiečių ordino garbės svečias vėliau tapo jo pilnateisiu nariu nuo dancigo nuo
270
+ nesavos švecės komtūras per lenkijos ir lietuvos didžiosios kunigaikštystės karą
271
+ su vokiečių ordinu heinrichas fon plauenas su žmonių įgula švecės pilyje vyslos
272
+ žemupio kairiajame krante saugojo prūsijos pietinę dalį po liepos žalgirio mūšio
273
+ skubiai sutelkė mūšyje nedalyvavusias vokiečių ordino karines pajėgas apie žmonių
274
+ marienburgo pilį lenkijos ir lietuvos didžiosios kunigaikštystės kariuomenėms
275
+ ją liepos mėn apsupus apie mėn atlaikė apgulą ryžtingi heinricho fon plaueno veiksmai
276
+ išsaugojo vokiečių ordiną kaip valstybę tapęs didžiuoju magistru už marienburgo
277
+ pilyje išsaugoto vokiečių ordino iždo lėšas skubiai pasamdė kryžininkų kitose
278
+ šalyse taip iš dalies atkūrė vokiečių ordino galią ir atsiėmė lenkų ir lietuvių
279
+ užimtas vokiečių ordino pilis po torūnės taikos prūsiją toliau stiprino kariškai
280
+ bei ūkiškai ir vėl rengėsi kariauti aukštieji vokiečių ordino pareigūnai nepritarė
281
+ tokiai rizikingai heinricho fon plaueno politikai didysis maršalas mykolas kiuchmeisteris
282
+ von šternbergas rugsėjo įsakė atitraukti kariuomenę nuo sienos su savo šalininkais
283
+ atskubėjo marienburgą uždarė heinrichą bokštą ir pradžioje pats buvo išrinktas
284
+ didžiuoju magistru heinrichas fon plauenas toliau'
285
+ - 'passage: stasys šimkus vasario motiškiuose seredžiaus valsčius rusijos imperija
286
+ spalio kaune kompozitorius chorų organizatorius ir dirigentas muzikos publicistas
287
+ folkloristas pedagogas ir muzikos visuomenininkas biografija vaizdas stasys šimkus
288
+ with son algis jpeg thumb left px stasys šimkus su sūnumi algiu jav stasys šimkus
289
+ su karine uniforma gimė mažažemių valstiečių šeimoje nuo muzikos mokėsi pas vietos
290
+ vargonininką juozo naujalio vargonininkų ir dirigentų kursuose kaune dainavo mėgėjų
291
+ choruose nuo metų vargonininkavo čiobiškyje krokialaukyje skirsnemunėje nuo dalyvavo
292
+ lietuviškųjų vakarų veikloje organizavo chorus rengė koncertus užrašinėjo liaudies
293
+ dainas mokėsi varšuvos muzikos instituto vargonų klasėje pas prof suržinskį vedė
294
+ varšuvos lietuvių draugijos chorą stažavosi peterburgo vadovavo lietuvių chorams
295
+ be studijų dėstė muziką šv kotrynos bažnyčios katalikų gimnazijoje kaip chormeisteris
296
+ bendradarbiavo su česlovu sasnausku lietuvių draugijos nukentėjusiems dėl karo
297
+ šelpti pasiųstas jav rinkti aukų organizavo lietuvių chorus rengė koncertus statė
298
+ operetes jav miestuose leido žurnalą muzika grįžęs lietuvą dalyvavo lietuvių meno
299
+ kūrėjų draugijos veikloje buvo jos valdybos pirmininkas studijavo kompoziciją
300
+ leipcigo ir berlyno klaipėdoje įkūrė muzikos mokyklą joje dėstė ir buvo jos direktorius
301
+ čia subūrė simfoninį orkestrą valstybės teatro dirigentas vytauto didžiojo universiteto
302
+ mišraus choro vadovas ir švietimo ministerijos muzikos inspektorius šimkus daug
303
+ prisidėjo prie pirmųjų lietuvos dainų švenčių rengimo buvo jų dirigentas nuo kauno
304
+ profesorius palaidotas petrašiūnų kapinėse stasys šimkus buvo įdomi asmenybė didelio
305
+ temperamento ūmus neišsenkamos energijos dažnai būdavo geros nuotaikos nekreipdavo
306
+ dėmesio smulkmenas karštai griebdavosi'
307
+ datasets: []
308
+ pipeline_tag: sentence-similarity
309
+ library_name: sentence-transformers
310
  ---
311
+
312
+ # SentenceTransformer based on intfloat/multilingual-e5-base
313
+
314
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
315
+
316
+ ## Model Details
317
+
318
+ ### Model Description
319
+ - **Model Type:** Sentence Transformer
320
+ - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision 835193815a3936a24a0ee7dc9e3d48c1fbb19c55 -->
321
+ - **Maximum Sequence Length:** 512 tokens
322
+ - **Output Dimensionality:** 768 tokens
323
+ - **Similarity Function:** Cosine Similarity
324
+ <!-- - **Training Dataset:** Unknown -->
325
+ <!-- - **Language:** Unknown -->
326
+ <!-- - **License:** Unknown -->
327
+
328
+ ### Model Sources
329
+
330
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
331
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
332
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
333
+
334
+ ### Full Model Architecture
335
+
336
+ ```
337
+ SentenceTransformer(
338
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
339
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
340
+ (2): Normalize()
341
+ )
342
+ ```
343
+
344
+ ## Usage
345
+
346
+ ### Direct Usage (Sentence Transformers)
347
+
348
+ First install the Sentence Transformers library:
349
+
350
+ ```bash
351
+ pip install -U sentence-transformers
352
+ ```
353
+
354
+ Then you can load this model and run inference.
355
+ ```python
356
+ from sentence_transformers import SentenceTransformer
357
+
358
+ # Download from the 🤗 Hub
359
+ model = SentenceTransformer("sentence_transformers_model_id")
360
+ # Run inference
361
+ sentences = [
362
+ 'query: stasys šimkus paaiškinimas',
363
+ 'passage: stasys šimkus vasario motiškiuose seredžiaus valsčius rusijos imperija spalio kaune kompozitorius chorų organizatorius ir dirigentas muzikos publicistas folkloristas pedagogas ir muzikos visuomenininkas biografija vaizdas stasys šimkus with son algis jpeg thumb left px stasys šimkus su sūnumi algiu jav stasys šimkus su karine uniforma gimė mažažemių valstiečių šeimoje nuo muzikos mokėsi pas vietos vargonininką juozo naujalio vargonininkų ir dirigentų kursuose kaune dainavo mėgėjų choruose nuo metų vargonininkavo čiobiškyje krokialaukyje skirsnemunėje nuo dalyvavo lietuviškųjų vakarų veikloje organizavo chorus rengė koncertus užrašinėjo liaudies dainas mokėsi varšuvos muzikos instituto vargonų klasėje pas prof suržinskį vedė varšuvos lietuvių draugijos chorą stažavosi peterburgo vadovavo lietuvių chorams be studijų dėstė muziką šv kotrynos bažnyčios katalikų gimnazijoje kaip chormeisteris bendradarbiavo su česlovu sasnausku lietuvių draugijos nukentėjusiems dėl karo šelpti pasiųstas jav rinkti aukų organizavo lietuvių chorus rengė koncertus statė operetes jav miestuose leido žurnalą muzika grįžęs lietuvą dalyvavo lietuvių meno kūrėjų draugijos veikloje buvo jos valdybos pirmininkas studijavo kompoziciją leipcigo ir berlyno klaipėdoje įkūrė muzikos mokyklą joje dėstė ir buvo jos direktorius čia subūrė simfoninį orkestrą valstybės teatro dirigentas vytauto didžiojo universiteto mišraus choro vadovas ir švietimo ministerijos muzikos inspektorius šimkus daug prisidėjo prie pirmųjų lietuvos dainų švenčių rengimo buvo jų dirigentas nuo kauno profesorius palaidotas petrašiūnų kapinėse stasys šimkus buvo įdomi asmenybė didelio temperamento ūmus neišsenkamos energijos dažnai būdavo geros nuotaikos nekreipdavo dėmesio smulkmenas karštai griebdavosi',
364
+ 'passage: alma adamkienė vasario šiauliuose gegužės vilniuje lietuvių filantropė visuomenės veikėja lr prezidento valdo adamkaus žmona buvusi pirmoji šalies dama vaizdas alma adamkiene and laura bush jpg thumb left px alma adamkienė su laura buš knygos viršelis biografija adamkienės tėvas stasys nutautas buvo prekybininkas motina ona soblytė nutautienė talkino vyrui versle augo telšiuose tarybinei kariuomenei veržiantis lietuvą nutautų šeima sunkvežimiu išvyko šventają kur apsigyveno pas žvejį nuo kurios juos laivu išplaukė link švedijos bet nepasiekus kranto laivą sulaikė vokiečių kariai ir išplukdino rygą kur juos dviems savaitėms pasodino rygos kalėjimą iš ten juos nuplukdino prekybiniu laivu gdanską tada traukinius ir vokietiją pabėgėlių stovyklą alma adamkienė vokietijoje baigė eichšteto lietuvių gimnaziją ten susipažino su valdu adamkumi kur jis mokėsi lietuvių kalbos vėliau studijavo erlangeno universiteto filologijos fakultete bavarijoje adamkienės šeima persikėlė jungtines amerikos valstijas kur jos šeima turėjo giminių ilinojuje pati gyveno rokforde atvykusi jungtines amerikos valstijas alma adamkienė dirbo plieno gamyklos laboratorijoje laborante vėliau draudimo kompanijoje ištekėjo už valdo adamkaus nuo net dvidešimt penkerius metus ji vadovavo iš jav lietuvių bendruomenės aktyvisto juozo bačiūno įsigytai tabor farmos vasarvietei kuri tapo svarbiu lietuvybės centru čia daug metų vykdavo liberaliosios pakraipos lietuvių išeivių organizacijos santara šviesa suvažiavimai dar rudenį vykstant prezidento rinkimų kampanijai alma adamkienė nusprendė kad ir kaip baigtųsi rinkimai ji lietuvoje pradės labdaringą veiklą buvo įkurtas almos adamkienės labdaros ir paramos',
365
+ ]
366
+ embeddings = model.encode(sentences)
367
+ print(embeddings.shape)
368
+ # [3, 768]
369
+
370
+ # Get the similarity scores for the embeddings
371
+ similarities = model.similarity(embeddings, embeddings)
372
+ print(similarities.shape)
373
+ # [3, 3]
374
+ ```
375
+
376
+ <!--
377
+ ### Direct Usage (Transformers)
378
+
379
+ <details><summary>Click to see the direct usage in Transformers</summary>
380
+
381
+ </details>
382
+ -->
383
+
384
+ <!--
385
+ ### Downstream Usage (Sentence Transformers)
386
+
387
+ You can finetune this model on your own dataset.
388
+
389
+ <details><summary>Click to expand</summary>
390
+
391
+ </details>
392
+ -->
393
+
394
+ <!--
395
+ ### Out-of-Scope Use
396
+
397
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
398
+ -->
399
+
400
+ <!--
401
+ ## Bias, Risks and Limitations
402
+
403
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
404
+ -->
405
+
406
+ <!--
407
+ ### Recommendations
408
+
409
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
410
+ -->
411
+
412
+ ## Training Details
413
+
414
+ ### Training Dataset
415
+
416
+ #### Unnamed Dataset
417
+
418
+
419
+ * Size: 199,992 training samples
420
+ * Columns: <code>sentence_0</code> and <code>sentence_1</code>
421
+ * Approximate statistics based on the first 1000 samples:
422
+ | | sentence_0 | sentence_1 |
423
+ |:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
424
+ | type | string | string |
425
+ | details | <ul><li>min: 6 tokens</li><li>mean: 12.31 tokens</li><li>max: 35 tokens</li></ul> | <ul><li>min: 144 tokens</li><li>mean: 358.42 tokens</li><li>max: 512 tokens</li></ul> |
426
+ * Samples:
427
+ | sentence_0 | sentence_1 |
428
+ |:--------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
429
+ | <code>query: fiziologija</code> | <code>passage: vaizdas claude bernard and his pupils oil painting after léon augus wellcome jpg thumb upright paveiksle vaizduojamas klodas bernaras šiuolaikinės fiziologijos pradininkas su savo mokiniais fiziologija gamta ir λόγος lógos mokslas protas gr φυσιολογία mokslas tiriantis gyvųjų organizmų fizikines biochemines ir informacijos perdirbimo funkcijas tradiciškai fiziologijos mokslas skirstomas augalų fiziologiją ir gyvūnų fiziologiją tačiau fiziologijos principai yra tie patys visiems organizmams pvz žinios apie mielių ląsteles gali būti pritaikomos ir žmogaus ląstelėms normalioji fiziologija nagrinėja sveiko organizmo funkcijas jų reguliavimo mechanizmus norint suprasti gyvo organizmo funkcijas būtina išmanyti jo struktūrą sandarą todėl fiziologija glaudžiai siejasi su anatomija histologija biochemija biofizika fiziologija siejasi ir su kitais mokslais zoologija genetika matematika chemija fizika fiziologijos tyrimo objektas gyvas organizmas ar jo struktūrinės dalys organų sistemos organai audiniai ląstelės fiziologija padeda suprasti sveiko organizmo veiklą jo sugebėjimą prisitaikyti prie nuolat kintančios aplinkos nepakitus vidinės terpės sudėčiai fiziologija sudaro teorinį ir praktinį pagrindą nagrinėjant organizme vykstančius patologinius procesus sporto fiziologija tiria organizmo struktūrą bei funkcijų pokyčius veikiant fiziniams krūviams joje taikoma koncepcija kad veikiant fiziniams krūviams organizmas prie jų adaptuojasi sporto fiziologijos raida sporto fiziologija gana jaunas mokslas tik xix pabaigoje londone buvo išleistas pirmas fizinių pratimų vadovėlis kurio autorius la grange xx pradžioje šį mokslą toliau vystė chopkinas nustatęs ryšį tarp raumenų veiklos ir laktato kaupimosi dilas įkūrė laboratoriją nuovargio kilmei tirti po pirmojo</code> |
430
+ | <code>query: gūšra apibrėžimas</code> | <code>passage: gūšra dar žinoma kaip milvydo ežeras ežeras vakarų lietuvoje telšių rajone apie km šiaurės rytus nuo varnių km rytus nuo janapolės varnių regioniniame parke ežeras ovalios formos ilgis iš šiaurės pietus km plotis km altitudė giliausia vieta ežeras telkšo ištirpusio ledo luisto suformuotame duburyje krantai žemi vakarinis krantas plačiai užpelkėjęs apaugęs mišku pietuose įteka bevardis upelis vakaruose netoliese tekančią virvytę išteka druja ežeras yra drujos draustinyje prie gūšros rasta neolito gyvenviečių pėdsakų šalia įsikūrę milvydiškių ir lenkalių kaimai šaltiniai kategorija telšių rajono ežerai</code> |
431
+ | <code>query: get apibrėžimas</code> | <code>passage: getas dgs gittim gittin žydų skyrybų raštas kurį žydas išduoda žydei nutraukiant vedybas pagrindinis rašto tekstas nuo dabar tu gali bendrauti su visais vyrais kitaip sakant tu nebesi ištekėjusi moteris ir tau paleistuvavimą draudžiantys įstatymai daugiau nebegalioja geto skyrybų raštas taip pat sugrąžina moteriai visas buvusias teises kurias ji turėjo prieš ištekėdama būtini reikalavimai getui getas skyrybų raštas privalo būti parašytas tik pas judaizmo soferį tam turi būti gautas judėjo vyro sutikimas žydei žmonai draudžiama skirtis getas turi būti parašytas ant tokio poperiaus kurio turinio nebūtų galima ištrinti arba taisyti geto data turi atitikti skyrybų rašto sudarymo datą bet koks geto taisyklių pažeidimas panaikina skyrybų procedūrą nuorodos skyrybos judėjiškai skyrybų raštas kategorija judaizmas</code> |
432
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
433
+ ```json
434
+ {
435
+ "scale": 20.0,
436
+ "similarity_fct": "cos_sim"
437
+ }
438
+ ```
439
+
440
+ ### Training Hyperparameters
441
+ #### Non-Default Hyperparameters
442
+
443
+ - `per_device_train_batch_size`: 12
444
+ - `per_device_eval_batch_size`: 12
445
+ - `num_train_epochs`: 1
446
+ - `multi_dataset_batch_sampler`: round_robin
447
+
448
+ #### All Hyperparameters
449
+ <details><summary>Click to expand</summary>
450
+
451
+ - `overwrite_output_dir`: False
452
+ - `do_predict`: False
453
+ - `eval_strategy`: no
454
+ - `prediction_loss_only`: True
455
+ - `per_device_train_batch_size`: 12
456
+ - `per_device_eval_batch_size`: 12
457
+ - `per_gpu_train_batch_size`: None
458
+ - `per_gpu_eval_batch_size`: None
459
+ - `gradient_accumulation_steps`: 1
460
+ - `eval_accumulation_steps`: None
461
+ - `learning_rate`: 5e-05
462
+ - `weight_decay`: 0.0
463
+ - `adam_beta1`: 0.9
464
+ - `adam_beta2`: 0.999
465
+ - `adam_epsilon`: 1e-08
466
+ - `max_grad_norm`: 1
467
+ - `num_train_epochs`: 1
468
+ - `max_steps`: -1
469
+ - `lr_scheduler_type`: linear
470
+ - `lr_scheduler_kwargs`: {}
471
+ - `warmup_ratio`: 0.0
472
+ - `warmup_steps`: 0
473
+ - `log_level`: passive
474
+ - `log_level_replica`: warning
475
+ - `log_on_each_node`: True
476
+ - `logging_nan_inf_filter`: True
477
+ - `save_safetensors`: True
478
+ - `save_on_each_node`: False
479
+ - `save_only_model`: False
480
+ - `restore_callback_states_from_checkpoint`: False
481
+ - `no_cuda`: False
482
+ - `use_cpu`: False
483
+ - `use_mps_device`: False
484
+ - `seed`: 42
485
+ - `data_seed`: None
486
+ - `jit_mode_eval`: False
487
+ - `use_ipex`: False
488
+ - `bf16`: False
489
+ - `fp16`: False
490
+ - `fp16_opt_level`: O1
491
+ - `half_precision_backend`: auto
492
+ - `bf16_full_eval`: False
493
+ - `fp16_full_eval`: False
494
+ - `tf32`: None
495
+ - `local_rank`: 0
496
+ - `ddp_backend`: None
497
+ - `tpu_num_cores`: None
498
+ - `tpu_metrics_debug`: False
499
+ - `debug`: []
500
+ - `dataloader_drop_last`: False
501
+ - `dataloader_num_workers`: 0
502
+ - `dataloader_prefetch_factor`: None
503
+ - `past_index`: -1
504
+ - `disable_tqdm`: False
505
+ - `remove_unused_columns`: True
506
+ - `label_names`: None
507
+ - `load_best_model_at_end`: False
508
+ - `ignore_data_skip`: False
509
+ - `fsdp`: []
510
+ - `fsdp_min_num_params`: 0
511
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
512
+ - `fsdp_transformer_layer_cls_to_wrap`: None
513
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
514
+ - `deepspeed`: None
515
+ - `label_smoothing_factor`: 0.0
516
+ - `optim`: adamw_torch
517
+ - `optim_args`: None
518
+ - `adafactor`: False
519
+ - `group_by_length`: False
520
+ - `length_column_name`: length
521
+ - `ddp_find_unused_parameters`: None
522
+ - `ddp_bucket_cap_mb`: None
523
+ - `ddp_broadcast_buffers`: False
524
+ - `dataloader_pin_memory`: True
525
+ - `dataloader_persistent_workers`: False
526
+ - `skip_memory_metrics`: True
527
+ - `use_legacy_prediction_loop`: False
528
+ - `push_to_hub`: False
529
+ - `resume_from_checkpoint`: None
530
+ - `hub_model_id`: None
531
+ - `hub_strategy`: every_save
532
+ - `hub_private_repo`: False
533
+ - `hub_always_push`: False
534
+ - `gradient_checkpointing`: False
535
+ - `gradient_checkpointing_kwargs`: None
536
+ - `include_inputs_for_metrics`: False
537
+ - `eval_do_concat_batches`: True
538
+ - `fp16_backend`: auto
539
+ - `push_to_hub_model_id`: None
540
+ - `push_to_hub_organization`: None
541
+ - `mp_parameters`:
542
+ - `auto_find_batch_size`: False
543
+ - `full_determinism`: False
544
+ - `torchdynamo`: None
545
+ - `ray_scope`: last
546
+ - `ddp_timeout`: 1800
547
+ - `torch_compile`: False
548
+ - `torch_compile_backend`: None
549
+ - `torch_compile_mode`: None
550
+ - `dispatch_batches`: None
551
+ - `split_batches`: None
552
+ - `include_tokens_per_second`: False
553
+ - `include_num_input_tokens_seen`: False
554
+ - `neftune_noise_alpha`: None
555
+ - `optim_target_modules`: None
556
+ - `batch_eval_metrics`: False
557
+ - `batch_sampler`: batch_sampler
558
+ - `multi_dataset_batch_sampler`: round_robin
559
+
560
+ </details>
561
+
562
+ ### Training Logs
563
+ | Epoch | Step | Training Loss |
564
+ |:------:|:-----:|:-------------:|
565
+ | 0.0300 | 500 | 0.3228 |
566
+ | 0.0600 | 1000 | 0.0094 |
567
+ | 0.0900 | 1500 | 0.009 |
568
+ | 0.1200 | 2000 | 0.0037 |
569
+ | 0.1500 | 2500 | 0.005 |
570
+ | 0.1800 | 3000 | 0.0041 |
571
+ | 0.2100 | 3500 | 0.0034 |
572
+ | 0.2400 | 4000 | 0.0052 |
573
+ | 0.2700 | 4500 | 0.0036 |
574
+ | 0.3000 | 5000 | 0.0015 |
575
+ | 0.3300 | 5500 | 0.0009 |
576
+ | 0.3600 | 6000 | 0.0017 |
577
+ | 0.3900 | 6500 | 0.0023 |
578
+ | 0.4200 | 7000 | 0.002 |
579
+ | 0.4500 | 7500 | 0.0023 |
580
+ | 0.4800 | 8000 | 0.0017 |
581
+ | 0.5100 | 8500 | 0.0018 |
582
+ | 0.5400 | 9000 | 0.0018 |
583
+ | 0.5700 | 9500 | 0.0023 |
584
+ | 0.6000 | 10000 | 0.0019 |
585
+ | 0.6300 | 10500 | 0.0016 |
586
+ | 0.6600 | 11000 | 0.0007 |
587
+ | 0.6900 | 11500 | 0.0005 |
588
+ | 0.7200 | 12000 | 0.0012 |
589
+ | 0.7500 | 12500 | 0.0003 |
590
+ | 0.7800 | 13000 | 0.0007 |
591
+ | 0.8100 | 13500 | 0.0013 |
592
+ | 0.8400 | 14000 | 0.0007 |
593
+ | 0.8700 | 14500 | 0.0004 |
594
+ | 0.9000 | 15000 | 0.0002 |
595
+ | 0.9300 | 15500 | 0.0012 |
596
+ | 0.9600 | 16000 | 0.0004 |
597
+ | 0.9900 | 16500 | 0.0006 |
598
+
599
+
600
+ ### Framework Versions
601
+ - Python: 3.12.9
602
+ - Sentence Transformers: 3.0.1
603
+ - Transformers: 4.41.2
604
+ - PyTorch: 2.9.1+cu128
605
+ - Accelerate: 0.31.0
606
+ - Datasets: 4.4.2
607
+ - Tokenizers: 0.19.1
608
+
609
+ ## Citation
610
+
611
+ ### BibTeX
612
+
613
+ #### Sentence Transformers
614
+ ```bibtex
615
+ @inproceedings{reimers-2019-sentence-bert,
616
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
617
+ author = "Reimers, Nils and Gurevych, Iryna",
618
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
619
+ month = "11",
620
+ year = "2019",
621
+ publisher = "Association for Computational Linguistics",
622
+ url = "https://arxiv.org/abs/1908.10084",
623
+ }
624
+ ```
625
+
626
+ #### MultipleNegativesRankingLoss
627
+ ```bibtex
628
+ @misc{henderson2017efficient,
629
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
630
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
631
+ year={2017},
632
+ eprint={1705.00652},
633
+ archivePrefix={arXiv},
634
+ primaryClass={cs.CL}
635
+ }
636
+ ```
637
+
638
+ <!--
639
+ ## Glossary
640
+
641
+ *Clearly define terms in order to be accessible across audiences.*
642
+ -->
643
+
644
+ <!--
645
+ ## Model Card Authors
646
+
647
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
648
+ -->
649
+
650
+ <!--
651
+ ## Model Card Contact
652
+
653
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
654
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "intfloat/multilingual-e5-base",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.41.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.41.2",
5
+ "pytorch": "2.9.1+cu128"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5f334f7b640fbb2139ee9341694d79d947f1266fb63dad705783207ca0b16f3f
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }