SentenceTransformer based on intfloat/multilingual-e5-large

This is a sentence-transformers model finetuned from intfloat/multilingual-e5-large. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: intfloat/multilingual-e5-large
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("cuadron11/parleus-v2-ft")
# Run inference
sentences = [
    'Nola konparatzen da BECen metro koadroko eraikuntza-kostua Madrilgo IFEMA azokaren handitze-kostuarekin?',
    'Muchas gracias, señora presidenta. Arrazoia du sailburu andreak; ez zaizkit ez oso berritzaileak iruditu egin dizkigun proposamenak, begibistakoa baita 150 milioi euro horiek ordaintzeko dirurik ez badugu mailegua birnegoziatu egin beharko dela edo beste finantzaketa-bideren bat topatu, eta, zure hitzak entzunda eta BECen gainean martxoaren 21ean lortu zenuten akordio horri erreparatuta, nago ez duzuela finantzabideak topatzeko eta mailegua amortizatzeko asmorik, baizik eta ordainketa-epea luzatzekoa edo atzeratzekoa, beste gobernu batek amortiza dezan dagokion unean, ezta? Lehiakortasun-planari dagokionez, ez omen da berritzailea. Eta zuzen zaude; ez da berritzailea, baina gauza batek harritu nau. Beste azoka batzuekin eta beste sektore batzuekin harremanetan jartzeko asmoa omen duzue, BECera azoka eta negozio berriak ekartzen saiatze aldera; bada, harritu egin nau hori entzuteak, eta zalantza eragin dit: Kontuan hartuta egundoko porrota izan duela hamar urte luzez, zer demontretan aritu dira, bada, denbora horretan BECen kudea- tzaileak? Hau da, ekimen horiek abian jartzen ere ez ziren saiatu ala? Aspaldi-aspalditik galde egin zitzaieneta tribuna honetatik bertatik, Legebiltzar honetatik bertatik, aho batez gainera, ekimen horiek abian jar zitzaten! Nola izan litezke honelako proposamenak berehalako planaren funtsa: "Ekinean hasiko gara; beste azoka batzuekin harremanetan jarriko gara; uneotan ernatzen ari diren sektoreekin harremanetan jarriko gara…". Harri eta zur utzi nau horrek. Bide horiek urratuta behar zuten dagoeneko! Dena den, ez bada orain arte halakorik egin, egin dadila lehenbailehen. Nolanahi ere, gauza bat esango dizut nik. Ondo iruditu zait zure proposamena: lehen aldiz entzun diot gaur Eusko Jaurlaritzaren bateko kideren bati dauzkagun lur-sailei dagokien balioa eman behar diegula; izan ere, 150.000 metro koadro baino gehiago dira, alfer-alferrik galduta, nahiko kokapen ona duten arren; hala, dagokien balioa eman behar zaie, noski. Are gehiago, nahi baduzu, ideiak emango dizkizut. Hasteko, ez dakit erakunde publikoek benetan 150.000 metro koadroko gunea behar duten, kontuan hartuta, gune hori erabiltzen denetan ere, onenean ere, heren bat erabiltzen dela. Beraz, Gobernu honek, agian, honelako ekimenak izan behar lituzke buruan: "Modulu batzuk salduko ditugu, edo modulu batzuk alokatuko ditu…" edo auskalo beste zer. Enpresek biltegi modura erabiltzen badute ere, txarto ez! Kontua erabiltzea baita eta, hartara, diru-sarreren bat eduki ahal izatea, herritarrok urterik urte gero eta diru gehiago ordaindu behar izan ez dezagun 150.000 metro koadroko egitura hori mantentzearren; izan ere, BECen kostua, esaterako, Madrilgo IFEMA azoka handitzeko kostuaren bikoitza izan da metro koadroko –barka aipamena–. Hala, hasierako kostu horiek amortizatzea oso zaila da orain, negozio arruntean, beste azoka batzuekin lehiatzeko orduan, ordaintzen denaren bikoitza ordaindu behar baduzu. Baina tira, horretan jada ez dago atzera egiterik, eta gaur egungo arazoa... Egun dugun arazoa finantzaketa-arazoa da eta azokaren erabileraren gainekoa ere bai. Izan ere, bi urtean behin egiten den makina-erremintaren erakusketa da gure altxorrik preziatuena, baina duela lau urte erakusketan parte hartzen zuten erakusketarien ia erdia baino ez dugu gaur egun; bistan da, beraz, gauzak ez doazela ondo. Sektore guztietan daude txarto, eta makinaerremintaren erakusketa horretan ere bai. Horrenbestez, diru-iturri nagusiak nabarmen egin du behera, profesionalei zuzendutako azokajarduera apaltzeaz batera, hori baitzen negozioaren muina eta, izatez, horretarako eraiki behar baitzen itzelezko egitura hori. Guk ez, guk ez dugu egitura horrengatik urterourtero horrenbeste diru ordaindu nahi. Horregatik, Gobernuak gure babesa izango du, egoera hobetzeko ekimen guztietan, baina beren-beregi eskatu nahi dio- gu gure hausnarketa kontuan har dezan, agian, egitura horrek metro koadro ugari baititu soberan eta erabilera edo balio hobea eman baitakieke espazio horiei, Bizkaiko eta Euskadiko gainerako jarduera ekonomikoetara bideratuta. La',
    'Eskerrik asko, legebiltzarburua. Lehendakari, sailburu eta legebiltzarkideok, egun on. Ez da gai honen inguruan hitz egiten dugun lehen aldia, eta iruditzen zait ez dela azkena izango. Irailaren 18tik hona makina bat aldiz aritu gara kontu honen inguruan, batez ere, Uriarte sailburu andrea. Beste hainbatek ere asko hitz egin du, baliteke gehiegi hitz egin izana eta, batez ere, gehiegikeriak esateko izana. Gaur ere izan dugu horietako zenbait entzuteko aukera, lekuz kanpo daudenak eta egiarekin inolako zerikusirik ez dutenak. Adierazpen arduragabeak, bidegabeak eta egia esaten ez dutenak entzun arren, ez nuke nahiko ergelkeria horiek eztabaida honen funtsa lausotzea. Hori da batzuek egin nahi dutena: eztabaida desbideratu eta ez joan arazoaren funtsa eztabaidatzera. Guk uste dugu eztabaida honek konstruktiboa izan beharko lukeela. Ulertu eta onartzen dugu eztabaida kritikoa izatea, baina konstruktiboa bada, eta ez alternatiba eta proposamenik gabeko eztabaida suntsitzailea. Bihar beteko da hilabetea Eusko Jaurlaritzak hezkuntza arloko eragileekin elkartu eta geroago Heziberri 2020 izena hartuko zuen proposamenaren zirriborroa aurkeztu zienetik, proposamen irekia aurkeztu zienetik, ekarpenak jasoko zituen dokumentua aurkeztu zienetik. 15 egun ere ez dira igaro sailburuak kontroleko plenoan, hemen bertan, horren inguruko hainbat interpelazio eta galdera erantzun zituenetik. Astebete baino ez da igaro Heziberri 2020 ekimena abian jartzeko Jaurlaritzak eta hezkuntza eragileek bilera egin eta elkarlanean aritzeko adostasuna eta aritzeko konpromisoa agertu zutenetik. Are gehiago, astelehen honetan, duela hiru egun, sailburuak agerraldia egin zuen batzordean Heziberri 2020ren inguruko zehaztasun guztiak emateko. Hortaz, esango nuke azalpen asko emanda daudela, eta egon zitezkeen zalantzak eta ustezko susmoak usatuta egon beharko liratekeela, adostasuna izan baita Eusko Jaurlaritzaren ahotik gehien entzun den hitza, bai sailburuaren aldetik, bai lehendakariaren edo bozeramailearen ahotik ere. Egin ez duen guztia. Pero, por lo visto, aún no ha quedado claro. Baina ez omen da, hala ere, argi geratu. Horregatik, berriz azalduko dut zein den Euzko Alderdi Jeltzalearen eta Euzko Abertzaleak taldearen jarrera. Hasteko, jakinekoa denez, oso positibotzat jotzen dugu abian jarritako ekimena, baina hori bezain positibotzat jotzen dugu eragileek lankidetzarako erakutsi duten jarrera eta gogoa; izan ere, eragile horien laguntzarik gabe ezinezkoa litzateke hau abian jartzea; ez, behintzat, guk, Euzko Alderdi Jeltzaleak, hezkuntza gaiak lantzeko orduan dugun ikuspegitik, bai, ordea, beste batzuek duten ikuspegitik. Eta gogorarazi nahi nioke Oyarzabal jaunari ez dezala gezurrik esan, izan ere, eragile horien artean guztiak, inondik inora, ez dira abertzaleak, denetik dago, legebiltzar honetan bezala, baita Alderdi Popularrekoak ere. Galde egiezu ea ados dauden edo ez dauden. Proposamenari berari dagokionez, eduki zehatzez baino gehiago filosofiaz hitz egiteko eguna dela uste dugu. Elkarlanean eta zintzotasunez gogoeta egiteko aukera ematen duen proposamena dela uste dugu, batez ere, proposamen irekia, parte hartzaile guztien artean landu eta adostu beharrekoa. Eta \'guztien\' diodanean, \'guztien\' esan nahi dut: hezkuntza eragileak, eragile sozialak eta politikoak. Guztiok izango dugu parte hartzeko aukera, eta horrek zerikusi zuzena du Oyarzabal jaunak bere ekimenean proposatzen duen adostasun beharrarekin. Hainbat dira adostu beharreko kontuak; izan ere, Celaá andreak esan du euskal hezkuntza sistema kalitatezkoa dela, baina oraindik baduela hobetzeko eta berriztatzeko aukera. Horretan, bat gatoz. Horregatik, aztertu behar dugu norantz joan behar duen euskal hezkuntza sistemak bere osotasunean, aurretik dituen erronkei erantzuteko, nola egokitu Europan hezkuntza eta prestakuntzari buruz 2020rako finkatu diren ildo estrategikoei, hobekuntza hori gauzatzeko aldaketak behar ahal dituzten indarrean dauden curriculumek, eta, hala bada, zertan eta zein zentzutan egin behar diren aldaketa horiek. Eta horrez gain, legean ze kontu aurreikusi beharko liratekeen. Baina horren inguruan gogoeta egiteak ez du esan nahi gai zehatzak, politika zehatzak, Celaá andreak aipatutakoak ala beste batzuk, lantzen ari ez garenik. Izan ere, sinestezina da Celaá andreak nola leporatzen dion Jaurlaritzari ezer ez egitea eta, aldi berean, nola esaten duen zuzenketan arinegi jokatzen ari dela. Zertan gara? Zuk badakizu ez direla egia ez aurrenekoa eta ez bigarrena. Eragileei ondo iruditzen zaie, aurrerapena dela uste dute, bidea egiten hasteko modu bat dela uste dute. Zeren beldur zara zu? Zergatik ahalegintzen zara arreta baztertzen eta desbideratzen? Ez da bada izango zeu ez zinela gai izan lan egiteko eta adostasunak lortzeko eta, zeuk diozun bezala, "divertimentoak" egiten aritu zinela? Euskal Herriari dagokionez. Jaurlaritzak bere osotasunean, lehendakariak eta sailburuek, ondo baino hobeto dakite zein den euren jarduera esparrua, eta errespetatu egin dute orain arte eta hala egingo dute. Baina horrek ez du esan nahi inondik inora hizkuntza eta kultura bera konpartitzen dutenek osatutako komunitatean, Euskal Herrian, lankidetzarako bideak jorratu ezin direnik gai horiei dagokienez lurralde desberdinen artean. Lankidetzarako bideak, inolaz ere inposaketak. Eta guk gure esparrurako jarri dugu abian egitasmo hau. Gure eremurako jarri nahi dugu, baina beste batzuek, nahi izanez gero, euren borondatez erreferentziatzat hartu ahal izango dute. Guk defendatzen dugun sistema sendo eta zorrotza da, egoeraren araberako aldaketa politikoetatik salbu, malgua eta solidarioa, ikasle guztientzat aukera berdintasuna bermatuko duena. Marko egonkor eta iraunkorra proposatzen dugu, etengabeko erreformak, batekoak ala bestekoak, alde batera utziko dituena. Eta horretarako, beharrezkotzat jotzen dugu hezkuntzaren euskal legea, eta horretarako beharrezkoa izango da guk guztiok errealitatearen diagnostiko ona egitea eta erabaki egokiak hartzea. Hori zen gure zuzenketan jasotzen genuena. Zuzenketa hori bat dator 2012ko hauteskunde egitasmoan Euzko Alderdi Jeltzaleak esaten zuenare- kin. Esaten genuen adostasun politiko eta sozial zabala sustatzea ezinbestekoa zela eta lege biltzailea izan behar zuela hezkuntzaren egitura gorpuztu eta koherentziaz jantziko zuenak, eta iruditzen zaigu proposamen honek bidea eman dezakeela gure helburu hori lortzeko. Sakoneko eztabaidari ihes egin eta LOMCEren inguruko eztabaida bihurtu nahi izan dute zenbaitek gaurkoa. Guk ez dugu arazorik kontu honetaz hitz egiteko, eztabaidatzeko, baina tokatzen denean. Gure jarrera zein den ondo baino hobeto dakite talde guztiek: LOMCEren erabat kontra gaude, eta eskura ditugun tresna guztiak erabiliko ditugu euskal hezkuntza sisteman kalterik eta atzerapausorik egon ez dadin. Baina laster eztabaidatuko ditugu horren inguruko hainbat ekimen. Batzordean esan bezala, eragileek lezio bat eman diote Eusko Legebiltzar honi; izan ere, eragile bakoitzak hezkuntzaren ikuspegi propioa izanda ere, ikuspegi horri uko egin gabe, gai izan dira adostasuna lortzeko. Horixe bera egin beharko genuke, gure ustez, hemen ordezkatuta gauden talde guztiok. Zuei dena oinarrizko legeria iruditzen zaizue, bai hezkuntzan eta bai gainerakoan, eta gauzak birzentralizatzeko irrika horretan, berdin zaizue beste batzuen eskumenak zapaltzea, gure kasuan Gernikako Estatutua, hezkuntza bere osotasunean EAEren eskumena dela dioena, maila, gradu, modalitate eta espezialitate guztietan. Zuei berdin zaizue hori guztia edo, are eta okerrago, ondo iruditzen zaizue eta txalotu egiten duzue ministroak egindakoa, eta guk ez dugu hori onartuko, ondo dakizun bezala. Ondo dakizu ekimen horrek adostasunaren gaiak baino askoz garrantzi handiagoa duela curriculuma egin edo aldatzeko orduan. Adostasunaren premiari dagokionez, bat nator zurekin. Gainerakoan, ezertan ez. Ulertzen dut gure zuzenketa, handizalea eta konstruktiboa izateaz gain, askoz integratzaileagoa dela, eta guk uste dugu talde guztiek onartzeko modukoa dela. Beraz, aldeko botoa eskatzen dizuet. Eskerrik asko.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000,  0.5704, -0.0467],
#         [ 0.5704,  1.0000, -0.0472],
#         [-0.0467, -0.0472,  1.0000]])

Evaluation

Metrics

Triplet

Metric Value
cosine_accuracy 0.7263

Training Details

Training Dataset

Unnamed Dataset

  • Size: 24,775 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 16 tokens
    • mean: 40.11 tokens
    • max: 76 tokens
    • min: 512 tokens
    • mean: 512.0 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Zergatik kritikatzen du hizlariak foru-aldundiekin batera eguneratuta izan behar den Baso-suteetarako Larrialdi-Plan bereziak ez duela suteen ikerketarako egiturarik edo azterlanik aipatzen? Bai. Eskerrik asko, legebiltzarburu andrea, eta egun on berriro ere. Bueno, se ha hablado un poco de todo al hilo de esta iniciativa: prebentzioa, zaintza, aprobetxamendua, basoko baliabideak, abeltzaintza... Y como dicen las y los miembros del Gobierno en los plenos de control, "bueno, baso-suteen ikerketaz galdetu didate y procuraré ceñirme, un poco, a ello". Iniziatiban, Becerra jaunak nik uste dut ondo ekartzen duela gaia eta balioan ipintzen du, gainera, Gipuzkoan Suteen kontrako Ikerketa Brigadak egiten duen lana. Y tiene razón, es una buena práctica, pero pienso que hay que realizar ciertas matizaciones, oro ez baita urre. Eurek ere kezka handiak dauzkate, eurek ere arazo potoloak dauzkate, eta horiek ere aipatu behar dira. Batez ere aipatu behar da nola sortu den brigada hau. Izan ere, eurek, langileek, eurek beraiek bilatu behar izan dute formakuntza, eurek topatu behar izan dituzte kontaktuak, Madrilera joan izan dira euren poltsikotik, euren egun libreetan, formazio hori esk...
    Eusko Jaurlaritzak prestatu beharreko enplegu-planak zer elementu eduki behar ditu langileen egonkortasuna bermatzeko, genero-berdintasuna lortzeko eta teknologia berrietara egokitzeko? Eskerrik asko, presidente andrea. Legebiltzarkideok. Euskal Sozialistak legebiltzar-taldeak betetzeeskaera bat eta legebiltzar-mandatu bat dakartza osoko bilkura honetara. Beste askotan bezala, badirudi, lehendakariak esan zuen gisara, "orientazio gisara hartzen dutela, baina ez euskaldunak ordezkatzen ditugun gehienon borondate gisa". Eta egia da. Duela 10 egun, urtebete lehenago planteatutako zirriborroaren ildoko beste zirriborro bat aztertu zuen Gobernuak. Plan eraginkor bihurtzeko, zirriborro horrek Euskadiko Administrazio Orokorraren Enplegu Planaren eragina jasango dutenen eskuhartzea behar du. Horregatik, mandatu hartan, adostasunari buruz aritu ginen. Baina ez dirudi horrela izango denik, eta, zoritxarrez, uste dugu plan hau ere Gobernu honek aurkezten dituen plan guztien erakusleiho berean geldituko dela. Begira aritu naiz plana nondik datorren, eta nire taldeak 2013ko azaroan Herri Administrazio eta Justiziako sailburu Erkoreka jaunari eginiko galderara jo dut. Galderaren fo...
    Zein zailtasun dituzte etorkinek Cervantes Institutuaren nazionalitate azterketetarako online matrikulazioa egiteko orduan? Señora presidenta, muchas gracias. El Gobierno Vasco siempre ha fomentado la cooperación público-privada en materia de migración, y no consideramos necesaria la creación de un servicio público asesor para personas migrantes. Poztu egiten gara lortu dugun akordioagatik, eta, besterik gabe, Podemosen jatorrizko LBPk jasotzen zituen bi baieztapen edo eskaera argituko ditut. Zuk, Guanche andrea, oso azkar eta ia-ia garrantzirik eman gabe aipatu duzu Eusko Jaurlaritzak duen sarea (Aholku-Sarea), Enplegu eta Gizarte Politiketako Sailaren baitan, hain zuzen, etorkinei edozein gairen inguruko informazioa eta aholkuak emateko. Eta pixka batean hemen geratuko naiz, ez baitut uste zure baieztapena zuzena denik; jatorrizko LBPren lehen puntua, alegia, non Eusko Jaurlaritzari eskatzen baitzitzaion aholkularitza-zerbitzu publiko berri bat sor dezan. Administrazioaren ustezko bikoiztasunak salatzen aritzen zarete beti, baina uste dut, kasu honetan, bi- koiztasun batean erori zaretela. Lehen esan duda...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false,
        "directions": [
            "query_to_doc"
        ],
        "partition_mode": "joint",
        "hardness_mode": null,
        "hardness_strength": 0.0
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 2,685 evaluation samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 14 tokens
    • mean: 32.44 tokens
    • max: 55 tokens
    • min: 512 tokens
    • mean: 512.0 tokens
    • max: 512 tokens
    • min: 5 tokens
    • mean: 228.97 tokens
    • max: 512 tokens
  • Samples:
    anchor positive negative
    Zer ezberdintasun tximistatzen da Bilduk Venezuelarekiko duen jarreraren eta Sahara, Tibet edo Kurdistan bezalako lurraldeekiko duen jarreraren artean? Señora presidenta de la Cámara, Bilduko ordezkariari iruzkin bat eginez hasi nahi nuke. Zuk esaten zenuen... Hona ekarri dugun Venezuelako gaiari buruz ari zinen, Venezuelaren gai horrek harritu egiten zintuela, baita gogaitu ere; nire ustez, Venezuelari buruz hitz egitea da gogaikarria egiten zaizuna. Hemen, ordea, zuek, beste talde politiko batzuek bezala, errespetu osoz, jakina, hemen Sahara, Tibet, Kurdistan edo planetako beste leku batzuk ekar ditzakezue edo haietaz hitz egin dezakegu, eta ez duzue eragozpenik leku horiei buruzko ekimenak ekartzeko; eta txalotu egiten dituzue, biribilketa alaian, proposamen horiek. Aizu, lurbira oso handia da; beraz, zuek ulertu beharko duzue halaber hemen Venezuelan gertatzen ari dena gogoratu ahal izatea; gainera Venezuelan askatasun eta giza eskubide falta bat dagoenean, une honetan bizitzen ari direna bezalakoa. Eta nire lagun Martínez Zatón jaunari, Venezuelako krisia petrolioaren krisia dela esanez hasi zaigunari. Baina, aizu, ez iezaiozu zu... Señora Bakartxo Tejeria, señor lehendakari, señoras y señores consejeros, legebiltzarkideok. Lehenik eta behin, Heriotza Duinerako Eskubidearen aldeko Elkarteko ordezkariak agurtu nahi ditut, militantzia eta erresistentzia zibilerako prozesu inbidiagarria baitute, delikatua izanik ere eskubide zibilen kulturarekin lotura zuzena duen gai baten alde; ez gara beste ezertaz ari. Ramón Sampedrok bere buruaz beste egin zuenetik 30 urte igaro diren honetan, 16 aldiz baino gehiagotan, Espainiako Parlamentuak ez du kontuan hartu eutanasiaren eta lagundutako suizidiorako eskubidearen gaineko eztabaida ere. 2002az geroztik, Pazientearen Autonomiari buruzko Legea onartu zenetik, esparru juridiko nahikoa sortu da gai hauei buruz libreki eztabaidatzeko. Elkarrekin Podemosek, ezbairik gabe, bat egiten du Rebeka Ubera andrearen ekimen garrantzitsuarekin, Eusko Legebiltzarrak Zigor Kodearen 143. artikulua aldatzeko proposamena egin diezaien Gorte Nagusiei. Eutanasiaren edo suizidio lagunduaren prozesua...
    Zer ezberdintasun tximistatzen da Bilduk Venezuelarekiko duen jarreraren eta Sahara, Tibet edo Kurdistan bezalako lurraldeekiko duen jarreraren artean? Señora presidenta de la Cámara, Bilduko ordezkariari iruzkin bat eginez hasi nahi nuke. Zuk esaten zenuen... Hona ekarri dugun Venezuelako gaiari buruz ari zinen, Venezuelaren gai horrek harritu egiten zintuela, baita gogaitu ere; nire ustez, Venezuelari buruz hitz egitea da gogaikarria egiten zaizuna. Hemen, ordea, zuek, beste talde politiko batzuek bezala, errespetu osoz, jakina, hemen Sahara, Tibet, Kurdistan edo planetako beste leku batzuk ekar ditzakezue edo haietaz hitz egin dezakegu, eta ez duzue eragozpenik leku horiei buruzko ekimenak ekartzeko; eta txalotu egiten dituzue, biribilketa alaian, proposamen horiek. Aizu, lurbira oso handia da; beraz, zuek ulertu beharko duzue halaber hemen Venezuelan gertatzen ari dena gogoratu ahal izatea; gainera Venezuelan askatasun eta giza eskubide falta bat dagoenean, une honetan bizitzen ari direna bezalakoa. Eta nire lagun Martínez Zatón jaunari, Venezuelako krisia petrolioaren krisia dela esanez hasi zaigunari. Baina, aizu, ez iezaiozu zu... Eskerrik asko, presidente andrea. Eskerrik asko, Tapia andrea. Lehen aritu den Casanova jaunak Cope ekarri duenez hizpidera, horregatik hitz egin dut nik Agropopular saioaz. Baina argi baino argiago dago, bai, programa asko eta onak daudela gure hedabideetan; Lur bizia, urrutira joan gabe, edo Sustraia, hain zuzen ere. Eta, gure lehen sektorearen egoera aztertzen dute eta, jakina, honelako kontuetarako esan dezaketenaren haien zain egon ohi naiz. Baina ez naiz asko aldentzen Lumbreras jaunak esaten duenetik, gure landa-munduak duen edozein arazori dagokionez; eta beste hedabide horiek ere ez dute besterik egiten. Enbaren edo UAGAren web-orriak eta buletinak ere irakurtzen ditut. Bildu ere egiten naiz haiekin eta, horregatik, arazoak ezagutzen ditut; eta horregatik egiten dut planteamendu hau. Izan ere, hausnarketa eta galdera horiek, edo nik egiten dizudan interpelazio hau, herrialde honetako nekazariak eta abeltzainak biltzen eta ordezkatzen dituzten eta hor dabiltzan pertsona horien ...
    Zer ezberdintasun tximistatzen da Bilduk Venezuelarekiko duen jarreraren eta Sahara, Tibet edo Kurdistan bezalako lurraldeekiko duen jarreraren artean? Señora presidenta de la Cámara, Bilduko ordezkariari iruzkin bat eginez hasi nahi nuke. Zuk esaten zenuen... Hona ekarri dugun Venezuelako gaiari buruz ari zinen, Venezuelaren gai horrek harritu egiten zintuela, baita gogaitu ere; nire ustez, Venezuelari buruz hitz egitea da gogaikarria egiten zaizuna. Hemen, ordea, zuek, beste talde politiko batzuek bezala, errespetu osoz, jakina, hemen Sahara, Tibet, Kurdistan edo planetako beste leku batzuk ekar ditzakezue edo haietaz hitz egin dezakegu, eta ez duzue eragozpenik leku horiei buruzko ekimenak ekartzeko; eta txalotu egiten dituzue, biribilketa alaian, proposamen horiek. Aizu, lurbira oso handia da; beraz, zuek ulertu beharko duzue halaber hemen Venezuelan gertatzen ari dena gogoratu ahal izatea; gainera Venezuelan askatasun eta giza eskubide falta bat dagoenean, une honetan bizitzen ari direna bezalakoa. Eta nire lagun Martínez Zatón jaunari, Venezuelako krisia petrolioaren krisia dela esanez hasi zaigunari. Baina, aizu, ez iezaiozu zu... Hemen, ordea, zuek, beste talde politiko batzuek bezala, errespetu osoz, jakina, hemen Sahara, Tibet, Kurdistan edo planetako beste leku batzuk ekar ditzakezue edo haietaz hitz egin dezakegu, eta ez duzue
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false,
        "directions": [
            "query_to_doc"
        ],
        "partition_mode": "joint",
        "hardness_mode": null,
        "hardness_strength": 0.0
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 64
  • learning_rate: 2e-05
  • warmup_steps: 0.1
  • eval_strategy: epoch
  • per_device_eval_batch_size: 64
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • per_device_train_batch_size: 64
  • num_train_epochs: 3
  • max_steps: -1
  • learning_rate: 2e-05
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: None
  • warmup_steps: 0.1
  • optim: adamw_torch_fused
  • optim_args: None
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • optim_target_modules: None
  • gradient_accumulation_steps: 1
  • average_tokens_across_devices: True
  • max_grad_norm: 1.0
  • label_smoothing_factor: 0.0
  • bf16: False
  • fp16: False
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • use_liger_kernel: False
  • liger_kernel_config: None
  • use_cache: False
  • neftune_noise_alpha: None
  • torch_empty_cache_steps: None
  • auto_find_batch_size: False
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • include_num_input_tokens_seen: no
  • log_level: passive
  • log_level_replica: warning
  • disable_tqdm: False
  • project: huggingface
  • trackio_space_id: trackio
  • eval_strategy: epoch
  • per_device_eval_batch_size: 64
  • prediction_loss_only: True
  • eval_on_start: False
  • eval_do_concat_batches: True
  • eval_use_gather_object: False
  • eval_accumulation_steps: None
  • include_for_metrics: []
  • batch_eval_metrics: False
  • save_only_model: False
  • save_on_each_node: False
  • enable_jit_checkpoint: False
  • push_to_hub: False
  • hub_private_repo: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_always_push: False
  • hub_revision: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • restore_callback_states_from_checkpoint: False
  • full_determinism: False
  • seed: 42
  • data_seed: None
  • use_cpu: False
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • dataloader_prefetch_factor: None
  • remove_unused_columns: True
  • label_names: None
  • train_sampling_strategy: random
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • ddp_backend: None
  • ddp_timeout: 1800
  • fsdp: []
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • deepspeed: None
  • debug: []
  • skip_memory_metrics: True
  • do_predict: False
  • resume_from_checkpoint: None
  • warmup_ratio: None
  • local_rank: -1
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss Validation Loss parleus-v2-ft_cosine_accuracy
1.0 388 - 1.7276 0.6998
1.2887 500 0.8416 - -
2.0 776 - 1.5996 0.7229
2.5773 1000 0.3790 - -
3.0 1164 - 1.5811 0.7263

Framework Versions

  • Python: 3.11.8
  • Sentence Transformers: 5.3.0
  • Transformers: 5.2.0
  • PyTorch: 2.11.0+cu130
  • Accelerate: 1.13.0
  • Datasets: 4.8.4
  • Tokenizers: 0.22.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{oord2019representationlearningcontrastivepredictive,
      title={Representation Learning with Contrastive Predictive Coding},
      author={Aaron van den Oord and Yazhe Li and Oriol Vinyals},
      year={2019},
      eprint={1807.03748},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/1807.03748},
}
Downloads last month
23
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for cuadron11/parleus-v2-ft

Finetuned
(183)
this model

Papers for cuadron11/parleus-v2-ft

Evaluation results