selmanbaysan commited on
Commit
c9aac03
·
verified ·
1 Parent(s): ad6e38b

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,817 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:2038410
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: intfloat/multilingual-e5-base
10
+ widget:
11
+ - source_sentence: “Kendilerine güveniyorlarsa teklifimi kabul etsinler, her şey ortaya
12
+ çıksın!”
13
+ sentences:
14
+ - 'CHP Balıkesir Milletvekili ve Parti Meclisi Üyesi Mehmet Tüm, Cumhurbaşkanı ve
15
+ Başbakanın örtülü ödenek harcamalarında bir yıllık ödeneği 8 ayda bitirdiğini
16
+ belirtti ve örtülü ödeneğin TBMM tarafından denetlenmesi için kanun teklifi verdi.
17
+ Maliye Bakanlığının açıkladığı Ocak-Ağustos dönemi bütçe gerçekleşme sonuçlarına
18
+ göre, Cumhurbaşkanı Tayyip Erdoğan ile Başbakan Binali Yıldırım''ın kullanma yetkisinde
19
+ örtülü ödenekten bu yılın ilk 8 ayında yapılan toplam harcama geçen yıla göre
20
+ yüzde 60,7 oranında artarak 1 milyar 319 milyon liradan, 2 milyar 121 milyona
21
+ liraya yükseldi. Tayyip Erdoğan’ın başbakanlığı ve cumhurbaşkanlığı döneminde
22
+ kırdığı harcama rekorlara dikkat çeken CHP’li Tüm, şu açıklamalarda bulundu: “Örtülü
23
+ ödenek harcamaları geçen yıla göre yüzde 60,7 oranında artarak 1 milyar 319 milyon
24
+ liradan 2 milyar 121 milyon liraya yükseldi. Bu hızla giderse harcamalar yeni
25
+ bir rekorla 3 milyar TL’yi de geçmiş olacak. Maliye Bakanlığının verileri dikkate
26
+ alındığında, bu rakamların TBMM, MİT ve birçok bakanlığın bütçesini geçtiğini
27
+ görüyoruz. Saray rejimi, asgari ücrete yılda %5 zammı çok görürken, kendi örtülü
28
+ ödeneğinde %65 artış yapmayı her şeyden daha zaruri görüyor. Ödeneklerdeki bu
29
+ artış, halkın parasının açık ve net bir şekilde israf edilmesidir. Devlet bütçesini
30
+ kimse babasının çiftliği değildir. AKP Genel Başkanı ve yöneticilerinin ne için
31
+ harcadığını bilmediğimiz bu paraların denetimi şeffaf bir şekilde yapılmalıdır.
32
+ Eğer AKP’li vekiller bu konuda kendilerine güveniyorlarsa verdiğim kanun teklifini
33
+ kabul etsinler ve her şey açık ve şeffaf bir şekilde ortaya çıksın.” CHP’li Mehmet
34
+ Tüm, TBMM Başkanlığına sunduğu kanun teklifinde örtülü ödenek harcamalarının Meclis''te
35
+ kurulacak bir komisyonla denetlenmesini ve harcamaların toplam bütçe harcamalarının
36
+ binde ikisini aşmayacak şekilde sınırlandırılmasını istedi. İşte CHP’li Tüm’ün
37
+ örtülü ödeneği denetimine ilişkin kanun teklifi: 10/12/2003 tarihli ve 5018 sayılı
38
+ Kamu Malî Yönetimi ve Kontrol Kanununun 24’üncü Maddesinde yer alan “binde beşini”
39
+ ibaresi “binde ikisini” olarak değiştirilmiştir. 10/12/2003 tarihli ve 5018 sayılı
40
+ Kamu Malî Yönetimi ve Kontrol Kanununa aşağıdaki ek madde eklenmiştir: Bu kanunun
41
+ 24’üncü Maddesi hükümlerine göre Cumhurbaşkanlığı ve Başbakanlık bütçelerine konulan
42
+ örtülü ödeneklerin harcama sonrası denetimi, Türkiye Büyük Millet Meclisi’nde
43
+ bulunan siyasi parti gruplarının güçleri oranında temsil edileceği bir komisyon
44
+ marifetiyle yapılır. Komisyon tarafından yapılan denetim sonrası Türkiye Büyük
45
+ Millet Meclisi Başkanlığına sunulmak üzere bir rapor hazırlanır. Başkanlık, bu
46
+ raporu Sayıştay Uygunluk Bildirimi ile birlikte Plan ve Bütçe Komisyonuna havale
47
+ eder. Denetim raporu Plan ve Bütçe Komisyonunun kapalı oturumunda görüşülür. Komisyon
48
+ üyeleri üçte iki çoğunlukla alınacak kararla, raporun bazı kısımlarına ilişkin
49
+ ayrıntıların açıklanmasına gizlilik kuralları getirebilir.” Bu Kanun yayımı tarihinde
50
+ yürürlüğe girer. Bu Kanun hükümlerini Bakanlar Kurulu yürütür.​'
51
+ - Ligdeki son galibiyetini, 8. haftada Trabzonspor'a konuk olduğu müsabakada 6-1
52
+ gibi farklı bir skorla alan Teleset Mobilya Akhisarspor, bu önemli sonucun ardından
53
+ yaptığı 7 karşılaşmada da 3 puan elde edemedi. Teleset Mobilya Akhisarspor,
54
+ Trabzonspor zaferinin ardından, Gençlerbirliği ile 3-3 berabere kaldıktan sonra,
55
+ Medipol Başakşehir'e 2-1, Aytemiz Alanyaspor'a 4-0 yenildi. Beşiktaş'la golsüz
56
+ berabere kalan ve Göztepe'ye 2-0 mağlup olan yeşil-siyahlı ekip, geçen haftaki
57
+ golsüz Evkur Yeni Malatyaspor beraberliğinin ardından, dün de Galatasaray'a 4-2
58
+ mağlup oldu. Son 7 maçta sadece 3 puan toplayabilen Ege temsilcisi, 15. haftayı
59
+ 19 puanla tamamladı. Yeşil-siyahlılar, Galatasaray'a yenilmesine karşın,
60
+ 4 maçtır devam eden gol hasretini ise sonlandırdı. Ligin 10. haftasındaki Medipol
61
+ Başakşehir maçının 59. dakikasında Paulo Henrique ile rakip ağları havalandırılması
62
+ sonrası, ardından yapılan 4 maçta da skor üretemeyen Teleset Mobilya Akhisarspor,
63
+ Galatasaray müsabakasının 17. dakikasında Maicon'un topu kendi filelerine göndermesiyle,
64
+ 408 dakika sonra gol sevinci yaşamış oldu. Öte yandan, eski takımı Galatasaray'a
65
+ karşı takımının 2. golünü kaydeden Olcan Adın, Süper Lig'de 50. golüne ulaştı.
66
+ Daha önce Trabzonspor formasıyla da Galatasaray'a golü bulunan Olcan Adın, Akhisarspor'da
67
+ toplam 6., bu sezon ise ilk golünü attı. Dünkü maçta gördüğü sarı kartla cezalı
68
+ duruma düşen Abdoulwahid Sissoko, 17 Aralık Pazar günü Manisa'da oynanacak Kayserispor
69
+ maçında forma giyemeyecek. Kırmızı kart gören Miguel Lopes ise Ziraat Türkiye
70
+ Kupası'nda 13 Aralık Çarşamba günü Ankara Demirspor ile oynanacak maçta oynayamayacak.
71
+ Portekizli futbolcu Profesyonel Futbol Disiplin Kurulundan ceza alması halinde
72
+ ligde de mücadele edemeyecek.
73
+ - 'MHP Genel Başkanı Devlet Bahçeli, partisinin grup toplantısında konuşma yaptı. Devlet
74
+ Bahçeli, CHP''den gelen "Hakikat Komisyonu kurulsun" önerisine de sert tepki gösterdi. AK
75
+ Parti ve CHP''nin birlikte hareket ettiğini savunan Bahçeli, şunları söyledi:
76
+ "İkisinin de kafasında İmralı canisinin affı vardır. Başbakan Erdoğan''ın değişken
77
+ sözleri ve CHP lderinin sözleri birebir örtüşmektedir. Hakikat Komisyonu''nun
78
+ kurulmasıyla ilgili CHP önerisini milletimizi büyük bir kaygıyla beklemektedir.
79
+ TSK da terör örgütü de silah bıraksın diyen bir CHP zihniyeti nasıl Atatürk''ün
80
+ kurduğu bir parti olabilir? Bundan sonra CHP ne diyecektir. AKP''nin izinden yürüyen
81
+ CHP''nin kabullerden saptığı, üniter devlet yapısını fantazi olarak görmektedirler. Önde
82
+ kavga ederken arkada Türkiye''nin gizli planlarını yapmaktadırlar. Türkiye''nin
83
+ temellerinden oynama yaparak kaynaşma yapacağını sananlar milletimizden en sert
84
+ cevabı alacağından kuşkumuz yoktur."'
85
+ - source_sentence: Şırnak'ın Silopi ilçesinde iki aşirete mensup lise öğrencileri
86
+ arasında çıkan kavgaya polis biber gazıyla müdahale etti. Gazdan etkilenen öğrenciler
87
+ hastaneye kaldırılırken, çok sayıda öğrenci de gözaltına alındı.
88
+ sentences:
89
+ - Bir televizyon kanalında gündeme ilişkin değerlendirmelerde bulunan Devlet Bakanı
90
+ ve Başbakan Yardımcısı Bülent Arınç, İnegöl ve Dörtyol'da yaşanan olayları üzüntüyle
91
+ karşıladıklarını, tahrikler ve tertipler sonucu yaşanan bu tür olaylarda halkın
92
+ sağduyulu olması, siyasetçilerin de kullandıkları dile özen göstermesi gerektiğini
93
+ söyledi. Arınç, kolluk güçlerinin bu tür olayları bastıracak, sebebiyet verenleri
94
+ yargıya teslim edecek güçte olduğunu vurguladı. Olaylarla ilgili bir istihbarat
95
+ zafiyeti olup olmadığının, İçişleri Bakanlığının yapacağı araştırma sonucunda
96
+ ortaya çıkacağını ifade eden Arınç, ''olayların somut sebebi şudur'' demenin şu
97
+ sırada mümkün olmadığını, konuyla ilgili araştırma derinleştikçe tahrikçilerin
98
+ ve olayları yönlendirenlerin belirleneceğini bildirdi. ''MHP'nin bölgeye heyet
99
+ gönderecek olması tansiyonu yükseltir'' mi sorusu üzerine, dün bir TV kanalında
100
+ BDP'nin bölgeye bir heyet göndermesini ''yangına benzin dökmek olarak'' tanımladığını
101
+ hatırlatan Arınç, sözlerini şöyle sürdürdü; ''Zaten şehrin valisi girişleri yasakladı.
102
+ BDP ile yapılan görüşmelerde de onlar anlayış gösterdi. Eleştirdiler, ama itiraz
103
+ etmediler veya direnmediler. Onlar da sanıyorum hassasiyetleri görmüş olmalılar.
104
+ Eğer MHP'liler de aynı amaçla yola çıkıyor, Dörtyol'da tansiyonu yükseltebilecek
105
+ bir olayın içine gidiyorlarsa, ki bence bugünlerde bunu yapmamalılar, vazgeçmelerini
106
+ tavsiye ederim. Çünkü MHP'lilerin olaylara şu veya bu şekilde karışmaları -tahrikçi
107
+ olmasa bile milliyetçi duygularla ortada bir yanlışlık var- ve bu yanlışlığa müdahale
108
+ etmek için sokaklara çıkmışlarsa -şüphesiz bir iki ay önce İskenderun'a yakın
109
+ bir yerde bir kışlamızı basarak 6 askerin şehit olmasına yol açmışlardı- bu olayların
110
+ acısı henüz unutulmamışken, şimdi bu tür olayların hemen arkasında ve akabinde
111
+ orada boy göstermelerinin, meydan okumalarının olumlu katkısı olmaz diye düşünüyorum. Gidenler
112
+ şüphesiz sukunet çağrısında bulunacak ve olayları yatıştırmaya çalışacaklardır,
113
+ ama BDP'lilerin girmesi tahrik unsuru olarak görülmüş ve yasaklanmışken bunun
114
+ anti tezi olarak bir başka siyasi grubun 'bak onlar giremedi ama biz girdik, onlar
115
+ yasaklandı ama biz yasaklanmadık, onlar Türkiye için tehlike ama biz bu çerçeveden
116
+ meseleye bakıyoruz' demeleri de karşı tarafı da harekete geçirecek görünüyor.'' Arınç,
117
+ Başbakan Recep Tayyip Erdoğan'ın yarın Hatay'da yapacağı mitingin önemine dikkati
118
+ çekerek, Başbakan Erdoğan'ın ''birlik beraberlik, kardeşlik mesajları vereceğini,
119
+ tahriklere yol açacak hadiselerden kaçınılmasını tavsiye edeceğini dile getirdi. Şemdinli'de
120
+ dün yaşanan olaylarda küçük çocukların ön planda olduğunun hatırlatılması, ''Taş
121
+ Atan Çocuklar'' la ilgili yasal düzenlemenin ardından bu durumu nasıl değerlendirdiğinin
122
+ sorulması üzerine Arınç, PKK terör örgütünün kadın ve çocukların önde olduğu eylemlerle
123
+ bir mağduriyet yaratmaya çalıştığına işaret etti. ''Aldatılmaya, kandırılmaya
124
+ müsait yaştaki çocukların örgütün elinde bir oyuncak haline gelmesi, bizim yaptığımız
125
+ düzenlemenin ne kadar doğru ve haklı olduğunu da gösteriyor. Çocuklara sahip çıkmak
126
+ açısından çok iyi bir düzenleme yaptık'' diyen Arınç, bundan pişman olacak bir
127
+ noktada bulunmadıklarını ifade etti. PKK'nın çocukları çok kötü bir şekilde kullandığına
128
+ işaret eden Arınç, ''Barış ve demokrasi partisi ismi gibi bu olaylara engel olmaya
129
+ çalışmalı. Buna rağmen örgütün kullanması karşısında da yine halkımızın 'hayır
130
+ biz çocuklarımıza sahip olacağız' diyerek ciddi bir direnç göstermesi lazım''
131
+ diye konuştu.
132
+ - Söz konusu 8 köprülü kavşağın, 20 Şubat'ta Başbakan Tayyip Erdoğan'ın da katılması
133
+ beklenen tören ile hizmete alınması planlanıyor. Açıklamaya göre, TOKİ, İstanbul'a
134
+ inşa ettiği toplu konut alanlarında ulaşımı kolaylaştırmak için 8 ayrı bölgede
135
+ köprü, kavşak ve bağlantı yolu yaptı. Ataşehir toplu konut alanına bağlantıyı
136
+ sağlayan 2, Başakşehir Ispartakule toplu konut alanına bağlantıyı sağlayan 1 ve
137
+ Halkalı toplu konut alanlarına bağlantıyı sağlayan 5 ayrı köprülü kavşak, Başbakan
138
+ Recep Tayyip Erdoğan'ın da katılması beklenen, 20 Şubat'ta yapılacak törenle hizmete
139
+ açılacak.
140
+ - Bir lisede iki öğrenci grubu arasında başlayan tartışma kısa sürede kavgaya dönüştü.
141
+ Kavganın büyümesi üzerine, okul yönetimi, durumu polise bildirdi. Polis ekipleri,
142
+ öğrencileri ayırmakta zorlanınca, biber gazı kullandı. Okulun bahçesinden çıkarak
143
+ sokak aralarına kaçan öğrenciler, polise taşlı saldırıda bulundu. Yaşanan kovalamaca
144
+ sonucunda bazı öğrenciler gözaltına alındı. Bu arada, gazdan etkilenen öğrenciler,
145
+ olay yerine çağrılan ambulanslarla Silopi Devlet Hastanesi’ne kaldırıldı. İlçe
146
+ Milli Eğitim Müdürü Sait Uysal, yaşanan kavga olayıyla ilgili olarak, ''Kavganın
147
+ sebebini henüz öğrenemedik. Öğrenciler arasında çıkan kavga bütün okula yayıldı.
148
+ Biber gazından etkilenen öğrenciler, ambulanslarla Silopi Devlet Hastanesi'ne
149
+ götürüldü'' dedi. Kavga nedeniyle eğitime yarım gün ara verildiği bildirildi.
150
+ - source_sentence: Obezite, kalp krizinden koruyor olabilir mi? İngiltere'de bilim
151
+ dünyası bu soruya yanıt arıyor. Araştırmalara göre, damarlardaki fazla yağ, belli
152
+ bir seviyenin üstündeyken, kalbi koruyucu etki yapabiliyor.
153
+ sentences:
154
+ - 'CHP Genel Başkanı Kemal Kılıçdaroğlu, referandum sonuçlarının ardından yaptığı
155
+ açıklamada “Koşullar eşit olmamasına karşın elimizden gelen her türlü çabayı gösterdik”
156
+ diyerek, YSK’nin mühürsüz zarf ve pusulaların geçerli sayılması yönündeki kararına
157
+ tepki gösterdi. Kılıçdaroğlu, “YSK, üzülerek ifade edeyim, bu referandumu tartışmalı
158
+ hale getirdi. Maç yapılırken maçın ortasında kural değişmez” dedi. Kılıçdaroğlu’nun,
159
+ sonuçların ardından akşam saatlerinde CHP Genel Merkezi’ne gelerek kurmaylarıyla
160
+ değerlendirmede bulunduğu öğrenildi. Daha sonra bir basın toplantısı düzenleyen
161
+ Kılıçdaroğlu, “Eşit olmayan koşullarda bir referandum gerçekleştirdik. Bunu herkes
162
+ biliyor. Biz de koşullar eşit olmamasına karşın demokrasiye sahip çıkmak için
163
+ elimizden gelen her türlü çabayı gösterdik. Bu çabayı hukuk zemininde kalarak
164
+ gösterdik. Eveti savunanlar hukukun dışına çıktılar, biz özenle hukuk kurallarının
165
+ içerisinde çaba harcadık” dedi. “Anayasalar birer toplumsal uzlaşma belgesidir”
166
+ diyen Kılıçdaroğlu, “Bu referandum bir gerçeği ortaya çıkardı. Toplumun en az
167
+ yüzde 50’si buna hayır diyor. Dolayısıyla bu anayasa değişikliği ve onun oluşturduğu
168
+ bütün anayasa bir anlamda bir toplumsal uzlaşma belgesi olması niteliğini büyük
169
+ ölçüde yitirmiş durumda. Daha önemlisi bu gerçek önümüzde dururken siyaset kurumuna
170
+ bir görev düşüyor. Anayasayı bir toplumsal uzlaşma belgesi haline dönüştürmek”
171
+ diye konuştu. YSK’nin mühürsüz zarf ve pusulaların geçerli sayılması kararıyla
172
+ referandumu tartışmalı hale getirdiğini belirten Kılıçdaroğlu, şöyle konuştu:
173
+ “YSK, üzülerek ifade edeyim, bu referandumu tartışmalı hale getirdi. Hiçbir tartışmaya
174
+ yer vermeyecek şekilde size ilgili yasayı okuyorum. Seçim Kanunu’nun 98’inci maddesi:
175
+ Üzerinde ilçe seçim kurulu ve sandık kurulu mührü olmayan zarflar geçersiz sayılır.
176
+ TBMM’den geçen seçim kanunu ve onun 98’inci maddesi söylüyor. Ama YSK bu zarfları
177
+ kabul etti. Niçin? Seçim Kanunu’nun 108’inci maddesi. Arkasında sandık kurulu
178
+ mührü bulunmayan pusula geçersizdir. Hiçbir kurum kendisini parlamentonun üstünde
179
+ göremez. İktidar partisinin itirazı üzerine bunu geçerli sayıyorsunuz. Maç yapılırken
180
+ maçın ortasında kural değişmez arkadaşlar. YSK, maçın ortasında üstelik zarflar
181
+ açıldıktan sonra kuralları değiştiriyor. Bunu doğru bulmuyoruz, asla kabul etmiyoruz.
182
+ Milletin kararına saygılıyız ama YSK gölge düşürdü. Hukuksal açıdan da kamu vicdanı
183
+ açısından da referandumun meşruiyetini tartışmalı hale getirdiler. Bunu asla doğru
184
+ bulmuyoruz. Bunu sonuna kadar takip edeceğiz.”'
185
+ - Ege Üniversitesi Spor Bilimleri Fakültesi Öğretim Görevlisi Uzman , obezitenin
186
+ nedenlerini "Obezite harcanandan daha fazla enerji alınması sonucu, vücutta aşırı
187
+ miktarda yağ dokusunun olması sebebiyle gelişen,  genetik ve çevresel etkileşimli,
188
+ sağlıklı yaşam adına ciddi ve kronik sorunlara neden olabilen ve oluşum nedeni
189
+ çok sayıda faktöre bağlı, medikal tedaviye ihtiyaç duyulan metabolik bir sağlık
190
+ problemidir" şeklinde anlattı. nin risk faktörleri arasında birçok etkenin
191
+ olduğunu belirten Oral, "Obezitenin en önemli risk faktörleri arasında özellikle
192
+ genetik yatkınlık, fiziksel aktivitede azalma, beslenme alışkanlıkları, yaş, cinsiyet,
193
+ eğitim düzeyi, evlilik, doğum sayısı gibi faktörler göze çarpıyor. Erişkin ve
194
+ çocuk obezitesi tüm dünyada ama özellikle gelişmekte olan ülkelerde hızla yayılıyor.
195
+ Ülkemizde toplumun yaklaşık olarak yüzde 35’inden fazlası obezite problemiyle
196
+ karşı karşıya kalıyor. Hatta bu oran erkeklerde yüzde 7.9, kadınlar da yüzde 
197
+ 23.4" diye konuştu. Obezitenin başka hastalıklara da davetiye çıkardığını vurgulayan Dr.
198
+ Oral, "Birçok kronik hastalığın obezite ile yakından ilişkili olduğu biliniyor.
199
+ Ayrıca Dünya Sağlık Örgütü, obeziteyi en riskli 10 hastalıktan biri olarak kabul
200
+ ediyor. Bu konuda yürütülen son araştırmalarda kanserle yakın ilgisi olduğu da
201
+ belirlenmiştir" dedi. Obeziteden korunma yolları hakkında da bilgi veren Oral,
202
+ "Sağlıklı yaşam ve obezite kökenli hastalıkların önlenmesinde en akılcı önlem,
203
+ dengeli ve yeterli bir beslenme alışkanlığıyla birlikte, haftada 3 gün 30 dakika
204
+ yavaş yürüyüşle başlayıp haftada 5 gün 45 dakika tempolu yürüyüşler önem taşıyor.
205
+ Bu tip bir fiziksel aktivite sağlıklı beslenmeye ek olarak 100- 200 kalorilik
206
+ bir kayıp sağlar. Uzun süreli fiziksel aktivite için, her gün 30 dakika alışkanlığının
207
+ kazanılması, obezitenin önlem ve tedavisinde olumlu sonuçlar verdiği gözden uzak
208
+ tutulmamalıdır. Sonuç olarak, sağlıklı bir toplum için sağlıklı beslenme alışkanlığının
209
+ yanı sıra, fiziksel aktivitenin tüm bireyler için yaşamsal önem ve anlam taşımakta
210
+ olduğunu tekrar hatırlamak ve bu konuda farkındalığı arttırabilmek için ‘Dünya
211
+ Obezite Günü’ güzel bir şans olarak değerlendirilmeli" dedi.
212
+ - 'AK Parti Grup Başkanvekili Bülent Turan, Meclis''te basın mensuplarıyla bir araya
213
+ gelerek, gündeme ilişkin değerlendirmelerde bulundu. Genel Kurul''da bu hafta
214
+ Askeralma Kanunu Teklifi''nin görüşüleceğini ve tüm muhalefet partilerin grup
215
+ başkanvekillerini bugün arayarak sürece ilişkin bilgi verdiğini anlatan Turan,
216
+ AK Parti''nin yarın yapacağı kapalı grup toplantısında da Milli Savunma Komisyon
217
+ Başkanı İsmet Yılmaz''ın milletvekillerini bilgilendireceğini ifade etti. Muhalefet
218
+ partilerinin bazı maddelere ilişkin değişiklik taleplerinin olduğunu anımsatan
219
+ Turan, bu kapsamda teklifi tekrar gözden geçirdiklerini, paydaşlarla görüştüklerini
220
+ aktardı. Teklifin, tarafların görüşü alınarak hazırlandığını söyleyen Turan, "Teklifin
221
+ görüşmelerinin bu hafta bitmesini ama muhalefetin itirazı süreci uzatacak olursa
222
+ bir dahaki hafta bitmesini öngörüyoruz" diye konuştu. Muhalefetin, teklifi "Cumhurbaşkanı''na
223
+ ekstra yetki veriliyor" şeklinde eleştirdiğini anımsatan Turan, bu itirazın haklı
224
+ olmadığını dile getirdi. Bu yetkinin 1970''ten beri Bakanlar Kurulu''nda olduğunu
225
+ aktaran Turan, artık Bakanlar Kurulu olmadığı ve yürütmeyi cumhurbaşkanı temsil
226
+ ettiği için Bakanlar Kurulu''nun yetkilerinin cumhurbaşkanına verildiğine dikkati
227
+ çekti. "Zaten olan bir yetkinin devamından bahsediyoruz, yeni bir yetki yok" diyen
228
+ Turan, teklifi Meclis''ten uzlaşı ve anlaşmayla geçirmeyi planladıklarını, bu
229
+ nedenle konuyu tartışacaklarını vurguladı. Turan, teklifin her partinin ortak
230
+ kanaatiyle geçmesini istediklerinin belirterek, sözlerini şöyle sürdürdü: "Niyetimiz,
231
+ Askeralma Kanunu Teklifi''ni bu hafta bitirmek. Bitmezse haftaya biter. Cumhurbaşkanımızın
232
+ açıkladığı bir yargı paketi, strateji belgesi vardı. Bununla ilgili vekillerimiz
233
+ çalışıyorlar, teklifi hazırlıyorlar. Teklif belli bir aşamaya gelir olgunlaşırsa
234
+ onu da bu haftaya yetiştirip, bir sonraki haftaya vermeyi ümit ediyoruz.Askerlikten
235
+ sonra yargı paketini görüşmeyi istiyoruz, niyetimiz o. Bunlar kesin değil daha.
236
+ Teklif, bu hafta gelirse haftaya görüşürüz, askerlik biterse tabii. Teklifi büyük
237
+ oranla olgunlaştırdık, bugün yarın Meclis''e gönderebilirsek komisyon görüşme
238
+ takvimini takdir edecektir. Bu dediğim minvalde takvim devam ederse bir dahaki
239
+ haftaya askerlik biterse Genel Kurul''da görüşürüz olmazsa haftaya. Çalışıyoruz.
240
+ Belli bir olgunluğa eriştikten sonra Meclis''e vereceğiz." Yeni askerlik sisteminin
241
+ yasalaşmasıyla askerlik süresinin kısalacağı ve çok sayıda askerin terhis olacağı,
242
+ bu durumun güvenlik riski doğuracağına ilişkin yorumlar hatırlatılarak değerlendirmesi
243
+ sorulan Turan, "Paydaşlar, bunun Türkiye''nin, askerin, ordunun güvenliği için
244
+ sorun olmayacağı kanaatinde. Biz de bu kanaate olumlu yaklaşıyoruz. Genel Kurul''un
245
+ takdiri baş tacı, Meclis her zaman bunları revize etme hakkına sahip ama şu an
246
+ kanun yürürlüğe girdikten sonra 6 ayını bitiren askerlerimizin terhis olmasını
247
+ öngörüyoruz." diye konuştu. Bülent Turan, Askeralma Kanunu Teklifi''ne ilişkin
248
+ muhalefetten öneri gelip gelmediğinin sorulması üzerine, "Arkadaşlarımız bayram
249
+ öncesi görüştü, bazı öneriler var. Bugün bir daha görüşüyorlar" dedi. "27 yaşındaki
250
+ bir genç de 35-36 yaşında üniversitede hocalık yapan bir genç de bedelli askerliğe
251
+ başvurabilecek. Yaşı büyük olana öncelik verilmesine ilişkin yorumları nasıl değerlendiriyorsunuz
252
+ " sorusuna Turan, "Bu, tartışılan bir konu. Bugün yarın belli olacak. Konuşuyoruz,
253
+ görüşüyoruz" cevabını verdi. "Meclis, 23 Haziran seçimine kadar açık olacak mı?"
254
+ sorusu üzerine Turan, şunları söyledi: "İstanbul seçimleri Türkiye için çok önemli
255
+ ancak bir yerel seçim. Meclis''in takvimini, gündemini İstanbul seçimine göre
256
+ planlıyor olmak doğru olmaz. Türkiye, demokratik kültürüyle her türlü seçimi aşacak,
257
+ yapacak kabiliyeti olan bir ülke. Meclis çalışmalarının İstanbul seçimine göre
258
+ endekslemeyi doğru bulmayız. Halkımızın bizden beklentisi olan kanunlar var. Seçime
259
+ kadar Meclis''in çalışmasını öngörüyoruz." Cumhur İttifakı Adayı Binali Yıldırım
260
+ ve Millet İttifakı Adayı Ekrem İmamoğlu''nun 16 Haziran''da canlı yayında bir
261
+ araya geleceği hatırlatılarak değerlendirmesi sorulan Turan, "Türkiye''nin çoktan
262
+ beri beklediği bu tartışma zemininin hayat bulması kıymetli bir yaklaşım. Hem
263
+ CHP adayının hem de Sayın Yıldırım''ın konuya olumlu yaklaşmasını takdire şayan
264
+ buluyorum" ifadesini kullandı. Yıldırım''ın, canlı yayının öz güvenle "en muhalif"
265
+ diye düşünülen Uğur Dündar''ın moderatörlüğünde yapılmasını talep etmesinin kıymetli
266
+ olduğuna dikkati çeken Turan, şunları kaydetti: "Burada kimin kazandığından çok
267
+ kimin kaybettiği sorusu öne çıktı. Uğur Dündar gibi yaşını başını almış, sözüm
268
+ ona duayen gazeteci keşke böyle bir sorumluluktan kaçmamış olsaydı. Çünkü özellikle
269
+ 28 Şubat yıllarında nasıl taraflı gazetecilik yaptığı, çocukları siyasal olarak
270
+ istismar ettiği, farklı görüntüleri değerlendirdiği, hep bunlar bizi üzen habercilik
271
+ anlayışıydı. Bunları belki telafi etme imkanı olabilirdi. Ahiri ömründe iki farklı
272
+ partinin, iki kıymetli adayının çıkıp onun öncülüğünde tartışma imkanı bulması
273
+ çok kıymetliydi ama bunu reddetti. Ben bunu eline geçen tarihi fırsatın heba edilmesi
274
+ olarak düşünüyorum. Gerekçelerini izah etti ama bence kendisinden başka kimse
275
+ inanmadı. Neden vazgeçtiğini kamuoyuna açıklamak zorunda olduğunu düşünüyorum."'
276
+ - source_sentence: Antalya'da rahatsızlanan 20'den fazla asker hastaneye kaldırıldı.
277
+ sentences:
278
+ - Hatay'da, gazeteci olduklarını iddia eden 4 Rus, askeri güvenlik bölgesinde çekim
279
+ yaparken yakalandı. Alınan bilgiye göre, askeri bölgede çekim yapan 4 Rus vatandaşı,
280
+ güvenlik güçlerince gözaltına alındı. İfadelerinde gazeteci olduklarını belirten
281
+ 4 Rus, gerekli evraklara sahip olmadıkları için yasal işlemlerin ardından sınır
282
+ dışı edildi.
283
+ - "Kulübün resmi sitesinden yapılan açıklamada Mehmet Özdilek ve ekibine teşekkür\
284
+ \ edilirken, şu ifadelere yer verildi:\r\n \"Ligde son haftalarda istediği sonuç\
285
+ \ ve puanları alamayan ekibimizde, Teknik Direktör Mehmet Özdilek ile Yönetim\
286
+ \ Kurulu arasında yapılan görüşmenin ardından karşılıklı anlaşma ile yollarımız\
287
+ \ ayrıldı. Özdilek ve yardımcılarına birlikte olduğumuz süreçte gösterdikleri\
288
+ \ emeklere teşekkür ediyor bundan sonraki çalışma hayatlarında başarılar diliyoruz.\""
289
+ - Hatay'ın Altınözü ilçesine bağlı Karbeyaz Mahallesi sınır bölgesi içerisinde nöbet
290
+ değişimi için göreve çıkan askeri araç şarampole devrildi. Kazada yaralanan 19
291
+ asker olay yerine çağrılan ambulanslarla Antakya'daki çeşitli hastanelere kaldırılarak
292
+ tedavi altına alındı. Askerlerin sağlık durumlarının iyi olduğu öğrenildi.
293
+ - source_sentence: Rusya Devlet Başkanı Vladimir Putin, "Türk yönetimi, uçağımızı
294
+ düşürdü ve büyük bir hata yaptı. Dahası, korudukları kişiler de karadan pilotumuza
295
+ ateş açtı. Bu askeri suç karşısında verdiğimiz yanıt, ihtiyatlı olmaktan da öteydi"
296
+ dedi.
297
+ sentences:
298
+ - ''' Rusya Halk Cephesi 1. Bölgelerarası Forumu''nda konuşan Rus lider, Türkiye''ye
299
+ yönelik önlemlerin inşaat alanında yürürlükte olan anlaşmaları etkilemeyeceğini
300
+ belirterek, Türkiye''ye inşaat sektöründe getirilen yaptırımların ardından Rusya''da
301
+ 87 bin kişilik istihdam kontenjanının açılacağını kaydetti. Putin, şöyle konuştu:
302
+ "Şu anda 300 Türk şirketinin Rusya''da sözleşmeleri bulunuyor. Bunların toplam
303
+ tutarı yaklaşık 50 milyar dolar. Mevcut sözleşmeleri feshetmeme kararı aldık.
304
+ Çünkü bu sadece Türk iktidarının eylemine verilmiş bir yanıt olmayacak, biz de
305
+ bundan zarar görebiliriz. Ancak bundan sonra Türk şirketleriyle yeni anlaşma imzalamayacağız."
306
+ Rusya Devlet Başkanı''nın gündeminde Suriye''deki terörle mücadele çalışmaları
307
+ da vardı. Putin, "Terörle mücadelede dikkatli ancak güçlü bir şekilde hareket
308
+ edeceğiz. Verdiğiniz destek için sizlere ve gösterdikleri çabalar için Rus askerlerine
309
+ teşekkür ediyorum" dedi.'
310
+ - Bordo-mavili takımın başkanı Muharrem Usta, Galatasaray'dan Çin ekibi Pekin Guoan'a
311
+ transfer olan Burak Yılmaz'a teşekkür mesajı yayınladı. Usta mesajında, "Burak
312
+ Yılmaz... Yolun açık olsun, dönmek istersen Trabzonspor'un kapısı sana her zaman
313
+ açık olacak. Her şey için teşekkürler" dedi. 8 milyon Euro karşılığında Çin'e
314
+ giden Burak sözleşmesindeki yüzde 25'lik opsiyon sayesinde bu transferle Trabzonspor'a
315
+ da 2 milyon Euro daha kazandırmıştı.
316
+ - Habertürk’ün “Duran tavuk” başlığıyla gündeme getirdiği ve tavuk üretimini yüzde
317
+ 80 azaltan üreticiler ile firmaların sözleşme krizini aşma çabaları sürerken,
318
+ Türkiye Kanatlı Hayvan Eti Yetiştiricileri Merkez Birliği (TÜKEBİR) büyük bir
319
+ entegre tesis almak için harekete geçti. Daha önce kapanan bir entegre tesisin
320
+ sahibiyle görüşmeler başladı. Sakarya Kanatlı Hayvan Eti Yetiştiricileri Birliği
321
+ Başkan Yardımcısı İrfan Sarı, tesiste incelemelerde bulundu. Tesis, çift vardiyada
322
+ günlük 160 bin piliç kesimi yapabilecek ve yaklaşık 350 tonluk piliç eti üretilecek.
323
+ Gazete Habertürk'ten Ramiz Kaan Oktar'ın haberine göre Doğu Marmara Bölgesi’ndeki
324
+ tüm üreticiler dilediklerinde buraya piliç verebilecek. Bölgesel üretimin en fazla
325
+ yüzde 35’i bu tesise alınacak. Sistemde kapasite artırımı üretim anlamında maksimum
326
+ yüzde 25 oranında olabilecek. Eğer bu artış yetersiz gelirse yeni bir tesis alımı
327
+ ya da yapımı söz konusu olacak. Sakarya Kanatlı Hayvan Eti Yetiştiricileri Birliği
328
+ Başkanı İrfan Demiray, “Eğer firmalarla sözleşme istediğimiz şekilde imzalanamazsa
329
+ kendi tesisimiz hazır olacak. Vatandaşımız direkt üreticiden ürün alabilecek”
330
+ dedi.
331
+ pipeline_tag: sentence-similarity
332
+ library_name: sentence-transformers
333
+ metrics:
334
+ - cosine_accuracy
335
+ - cosine_accuracy_threshold
336
+ - cosine_f1
337
+ - cosine_f1_threshold
338
+ - cosine_precision
339
+ - cosine_recall
340
+ - cosine_ap
341
+ - cosine_mcc
342
+ model-index:
343
+ - name: SentenceTransformer based on intfloat/multilingual-e5-base
344
+ results:
345
+ - task:
346
+ type: binary-classification
347
+ name: Binary Classification
348
+ dataset:
349
+ name: dev
350
+ type: dev
351
+ metrics:
352
+ - type: cosine_accuracy
353
+ value: 0.8555852102590809
354
+ name: Cosine Accuracy
355
+ - type: cosine_accuracy_threshold
356
+ value: 0.6372671127319336
357
+ name: Cosine Accuracy Threshold
358
+ - type: cosine_f1
359
+ value: 0.8600484871383143
360
+ name: Cosine F1
361
+ - type: cosine_f1_threshold
362
+ value: 0.6254763007164001
363
+ name: Cosine F1 Threshold
364
+ - type: cosine_precision
365
+ value: 0.8364259905689264
366
+ name: Cosine Precision
367
+ - type: cosine_recall
368
+ value: 0.8850440642820114
369
+ name: Cosine Recall
370
+ - type: cosine_ap
371
+ value: 0.9172012841259736
372
+ name: Cosine Ap
373
+ - type: cosine_mcc
374
+ value: 0.7117817758627474
375
+ name: Cosine Mcc
376
+ - type: cosine_accuracy
377
+ value: 0.8516794688191641
378
+ name: Cosine Accuracy
379
+ - type: cosine_accuracy_threshold
380
+ value: 0.6502314805984497
381
+ name: Cosine Accuracy Threshold
382
+ - type: cosine_f1
383
+ value: 0.8540095956134338
384
+ name: Cosine F1
385
+ - type: cosine_f1_threshold
386
+ value: 0.6245771050453186
387
+ name: Cosine F1 Threshold
388
+ - type: cosine_precision
389
+ value: 0.8155420683089373
390
+ name: Cosine Precision
391
+ - type: cosine_recall
392
+ value: 0.8962856395500916
393
+ name: Cosine Recall
394
+ - type: cosine_ap
395
+ value: 0.9086649286867274
396
+ name: Cosine Ap
397
+ - type: cosine_mcc
398
+ value: 0.6984897891408454
399
+ name: Cosine Mcc
400
+ ---
401
+
402
+ # SentenceTransformer based on intfloat/multilingual-e5-base
403
+
404
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
405
+
406
+ ## Model Details
407
+
408
+ ### Model Description
409
+ - **Model Type:** Sentence Transformer
410
+ - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision 835193815a3936a24a0ee7dc9e3d48c1fbb19c55 -->
411
+ - **Maximum Sequence Length:** 512 tokens
412
+ - **Output Dimensionality:** 768 dimensions
413
+ - **Similarity Function:** Cosine Similarity
414
+ <!-- - **Training Dataset:** Unknown -->
415
+ <!-- - **Language:** Unknown -->
416
+ <!-- - **License:** Unknown -->
417
+
418
+ ### Model Sources
419
+
420
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
421
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
422
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
423
+
424
+ ### Full Model Architecture
425
+
426
+ ```
427
+ SentenceTransformer(
428
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
429
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
430
+ (2): Normalize()
431
+ )
432
+ ```
433
+
434
+ ## Usage
435
+
436
+ ### Direct Usage (Sentence Transformers)
437
+
438
+ First install the Sentence Transformers library:
439
+
440
+ ```bash
441
+ pip install -U sentence-transformers
442
+ ```
443
+
444
+ Then you can load this model and run inference.
445
+ ```python
446
+ from sentence_transformers import SentenceTransformer
447
+
448
+ # Download from the 🤗 Hub
449
+ model = SentenceTransformer("selmanbaysan/multilingual-e5-base_contrastive_loss_training")
450
+ # Run inference
451
+ sentences = [
452
+ 'Rusya Devlet Başkanı Vladimir Putin, "Türk yönetimi, uçağımızı düşürdü ve büyük bir hata yaptı. Dahası, korudukları kişiler de karadan pilotumuza ateş açtı. Bu askeri suç karşısında verdiğimiz yanıt, ihtiyatlı olmaktan da öteydi" dedi.',
453
+ '\' Rusya Halk Cephesi 1. Bölgelerarası Forumu\'nda konuşan Rus lider, Türkiye\'ye yönelik önlemlerin inşaat alanında yürürlükte olan anlaşmaları etkilemeyeceğini belirterek, Türkiye\'ye inşaat sektöründe getirilen yaptırımların ardından Rusya\'da 87 bin kişilik istihdam kontenjanının açılacağını kaydetti. Putin, şöyle konuştu: "Şu anda 300 Türk şirketinin Rusya\'da sözleşmeleri bulunuyor. Bunların toplam tutarı yaklaşık 50 milyar dolar. Mevcut sözleşmeleri feshetmeme kararı aldık. Çünkü bu sadece Türk iktidarının eylemine verilmiş bir yanıt olmayacak, biz de bundan zarar görebiliriz. Ancak bundan sonra Türk şirketleriyle yeni anlaşma imzalamayacağız." Rusya Devlet Başkanı\'nın gündeminde Suriye\'deki terörle mücadele çalışmaları da vardı. Putin, "Terörle mücadelede dikkatli ancak güçlü bir şekilde hareket edeceğiz. Verdiğiniz destek için sizlere ve gösterdikleri çabalar için Rus askerlerine teşekkür ediyorum" dedi.',
454
+ 'Bordo-mavili takımın başkanı Muharrem Usta, Galatasaray\'dan Çin ekibi Pekin Guoan\'a transfer olan Burak Yılmaz\'a teşekkür mesajı yayınladı. Usta mesajında, "Burak Yılmaz... Yolun açık olsun, dönmek istersen Trabzonspor\'un kapısı sana her zaman açık olacak. Her şey için teşekkürler" dedi. 8 milyon Euro karşılığında Çin\'e giden Burak sözleşmesindeki yüzde 25\'lik opsiyon sayesinde bu transferle Trabzonspor\'a da 2 milyon Euro daha kazandırmıştı.',
455
+ ]
456
+ embeddings = model.encode(sentences)
457
+ print(embeddings.shape)
458
+ # [3, 768]
459
+
460
+ # Get the similarity scores for the embeddings
461
+ similarities = model.similarity(embeddings, embeddings)
462
+ print(similarities.shape)
463
+ # [3, 3]
464
+ ```
465
+
466
+ <!--
467
+ ### Direct Usage (Transformers)
468
+
469
+ <details><summary>Click to see the direct usage in Transformers</summary>
470
+
471
+ </details>
472
+ -->
473
+
474
+ <!--
475
+ ### Downstream Usage (Sentence Transformers)
476
+
477
+ You can finetune this model on your own dataset.
478
+
479
+ <details><summary>Click to expand</summary>
480
+
481
+ </details>
482
+ -->
483
+
484
+ <!--
485
+ ### Out-of-Scope Use
486
+
487
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
488
+ -->
489
+
490
+ ## Evaluation
491
+
492
+ ### Metrics
493
+
494
+ #### Binary Classification
495
+
496
+ * Dataset: `dev`
497
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
498
+
499
+ | Metric | Value |
500
+ |:--------------------------|:-----------|
501
+ | cosine_accuracy | 0.8556 |
502
+ | cosine_accuracy_threshold | 0.6373 |
503
+ | cosine_f1 | 0.86 |
504
+ | cosine_f1_threshold | 0.6255 |
505
+ | cosine_precision | 0.8364 |
506
+ | cosine_recall | 0.885 |
507
+ | **cosine_ap** | **0.9172** |
508
+ | cosine_mcc | 0.7118 |
509
+
510
+ #### Binary Classification
511
+
512
+ * Dataset: `dev`
513
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
514
+
515
+ | Metric | Value |
516
+ |:--------------------------|:-----------|
517
+ | cosine_accuracy | 0.8517 |
518
+ | cosine_accuracy_threshold | 0.6502 |
519
+ | cosine_f1 | 0.854 |
520
+ | cosine_f1_threshold | 0.6246 |
521
+ | cosine_precision | 0.8155 |
522
+ | cosine_recall | 0.8963 |
523
+ | **cosine_ap** | **0.9087** |
524
+ | cosine_mcc | 0.6985 |
525
+
526
+ <!--
527
+ ## Bias, Risks and Limitations
528
+
529
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
530
+ -->
531
+
532
+ <!--
533
+ ### Recommendations
534
+
535
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
536
+ -->
537
+
538
+ ## Training Details
539
+
540
+ ### Training Dataset
541
+
542
+ #### Unnamed Dataset
543
+
544
+ * Size: 2,038,410 training samples
545
+ * Columns: <code>anchor</code> and <code>positive</code>
546
+ * Approximate statistics based on the first 1000 samples:
547
+ | | anchor | positive |
548
+ |:--------|:---------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
549
+ | type | string | string |
550
+ | details | <ul><li>min: 3 tokens</li><li>mean: 6.96 tokens</li><li>max: 18 tokens</li></ul> | <ul><li>min: 8 tokens</li><li>mean: 56.22 tokens</li><li>max: 512 tokens</li></ul> |
551
+ * Samples:
552
+ | anchor | positive |
553
+ |:---------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
554
+ | <code>Malafa</code> | <code>, Hakan Günday'ın kuyumcular (ve halıcılar) üzerinden satış dünyası ile yaşam arasında paralellikler kurarak pazarlama ve satış dünyasını anlattığı, okuyucuya değişik bir dünyanın kapılarını açan romanı. Çoğunlukla Ermenice kelimelerden oluşan kuyumcu argosunun ağırlıklı olarak kullanıldığı romanda, büyük bir kuyumcu mağazasında çalışan "tezgahtar"ların ve alışverişe ge(tiri)len "turist"lerin bir günlük macerası anlatılır.</code> |
555
+ | <code>Sarıyatak, Elbistan</code> | <code>Sarıyatak, Kahramanmaraş ilinin Elbistan ilçesine bağlı bir mahalledir.</code> |
556
+ | <code>Åsane</code> | <code>, Norveç'in Bergen şehrinin bir kasabasıdır. Şehrin kuzeyindeki bu kasaba 1972'ye kadar ayrı bir şehir idi.</code> |
557
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
558
+ ```json
559
+ {
560
+ "scale": 20.0,
561
+ "similarity_fct": "cos_sim"
562
+ }
563
+ ```
564
+
565
+ ### Evaluation Dataset
566
+
567
+ #### Unnamed Dataset
568
+
569
+ * Size: 30,724 evaluation samples
570
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
571
+ * Approximate statistics based on the first 1000 samples:
572
+ | | sentence1 | sentence2 | label |
573
+ |:--------|:-----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------|
574
+ | type | string | string | int |
575
+ | details | <ul><li>min: 7 tokens</li><li>mean: 41.43 tokens</li><li>max: 200 tokens</li></ul> | <ul><li>min: 6 tokens</li><li>mean: 310.17 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>0: ~49.40%</li><li>1: ~50.60%</li></ul> |
576
+ * Samples:
577
+ | sentence1 | sentence2 | label |
578
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
579
+ | <code>Kriz tüm dünyayı sarsarken futbol kulüpleri değerlerini yüzde 8 artırdı. En değerli kulüp yine Manchester United oldu.</code> | <code>Fenerbahçe, derbideki galibiyetinin ardından, İMKB'deki artışıyla da yatırımcısının yüzünü güldürdü. Galatasaray-Fenerbahçe derbisinin ardından, bugün İMKB'de işlem gören Fenerbahçe hisselerinde yüzde 8 oranında artış yaşandı. Hisse değeri 55,25 TL'ye kadar yükseldi. Kulübün piyasa değeri 1 milyar 381 milyon 250 bin lira değerinde bulunuyor. Derbide kaybeden Galatasaray ise en çok değer kaybeden beşinci hisse konumunda. Galatasaray hisseleri yüzde 4.9 düşüşle 213,50 TL'ye geriledi.</code> | <code>0</code> |
580
+ | <code>İstanbul Sarıyer’de ormanda bulunan yakılmış cesedin 50 yaşındaki Yusuf Işık’a ait olduğu öne sürülüyor. Işık, eş bulmak için Hatay’a giden gençleri anlaşmalı olduğu Suriyeli kadınlarla buluşturup onlarca kişiyi dolandırmakla suçlanıyor.</code> | <code>Zonguldak'ta ormanlık alanda cesedi yırtıcı hayvanlarca parçalanmış halde bulunan şahıs hakkındaki gerçek otopsi sonucu ortaya çıktı. Av tüfeğiyle öldürüldüğü tespit edilen adamın katili köyündeki komşusu çıktı.   İHA'nın haberine göre olay, 10 gün önce Çaycuma ilçesine bağlı Perşembe beldesi Koramanlar köyünde yaşandı. 55 yaşındaki Sezai Karaca'nın cesedi ormanlık alanda yabani hayvanlarca parçalanmış halde bulundu. Jandarma ekiplerince yapılan incelemenin ardından Karaca'nın cesedi otopsi için hastane morguna kaldırıldı. Otopside Sezai Karaca'nın av tüfeği ile öldürüldüğü tespit edilerek vücudundan silahtan çıktığı belirlenen saçmalara rastlandı. Soruşturmayı derinleştiren jandarma ekipleri olayla ilgili Sezai Karaca'nın komşusu Veli B.'yi gözaltına aldı. İlçe Jandarma Komutanlığı'ndaki sorgusunda uzun süre konuşmayan Veli B. bir süre sonra cinayeti itiraf etti. Veli B.'ye, çelik yelek giydirilerek olay yerinde keşif yaptırıldı. Sağlık kontrolünden geçirilen zanlı, işlemlerinin ardın...</code> | <code>0</code> |
581
+ | <code>İdlib'de merkezindeki bombalı saldırıda ilk belirlemelere göre 7 kişi hayatını kaybetti.</code> | <code>Suriye'nin kuzeyindeki İdlib il merkezinde düzenlenen bombalı saldırıda ilk belirlemelere göre 7 kişinin öldüğü, 30 kişinin yaralandığı bildirildi.  İdlib Sivil Savunma (Beyaz Baretliler) Müdürü Mustafa Hac Yusuf, öğle saatlerinde kent merkezindeki "Saat Kavşağı" bölgesine yerleştirilen bombanın patlatılması sonucu en az 7 sivilin hayatını kaybettiği ve 30 sivilin yaralandığını ifade etti. Olayı henüz üstlenen üstlenmedi. Türkiye sınırında bulunan İdlib, Kazakistan'ın başkenti Astana'da 4-5 Mayıs 2017'deki toplantıda, Türkiye, Rusya ve İran tarafından "gerginliği azaltma bölgesi" ilan edilmişti.</code> | <code>1</code> |
582
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
583
+ ```json
584
+ {
585
+ "scale": 20.0,
586
+ "similarity_fct": "cos_sim"
587
+ }
588
+ ```
589
+
590
+ ### Training Hyperparameters
591
+ #### Non-Default Hyperparameters
592
+
593
+ - `eval_strategy`: steps
594
+ - `per_device_train_batch_size`: 64
595
+ - `per_device_eval_batch_size`: 64
596
+ - `learning_rate`: 2e-05
597
+ - `num_train_epochs`: 1
598
+ - `warmup_ratio`: 0.1
599
+ - `fp16`: True
600
+ - `batch_sampler`: no_duplicates
601
+
602
+ #### All Hyperparameters
603
+ <details><summary>Click to expand</summary>
604
+
605
+ - `overwrite_output_dir`: False
606
+ - `do_predict`: False
607
+ - `eval_strategy`: steps
608
+ - `prediction_loss_only`: True
609
+ - `per_device_train_batch_size`: 64
610
+ - `per_device_eval_batch_size`: 64
611
+ - `per_gpu_train_batch_size`: None
612
+ - `per_gpu_eval_batch_size`: None
613
+ - `gradient_accumulation_steps`: 1
614
+ - `eval_accumulation_steps`: None
615
+ - `torch_empty_cache_steps`: None
616
+ - `learning_rate`: 2e-05
617
+ - `weight_decay`: 0.0
618
+ - `adam_beta1`: 0.9
619
+ - `adam_beta2`: 0.999
620
+ - `adam_epsilon`: 1e-08
621
+ - `max_grad_norm`: 1.0
622
+ - `num_train_epochs`: 1
623
+ - `max_steps`: -1
624
+ - `lr_scheduler_type`: linear
625
+ - `lr_scheduler_kwargs`: {}
626
+ - `warmup_ratio`: 0.1
627
+ - `warmup_steps`: 0
628
+ - `log_level`: passive
629
+ - `log_level_replica`: warning
630
+ - `log_on_each_node`: True
631
+ - `logging_nan_inf_filter`: True
632
+ - `save_safetensors`: True
633
+ - `save_on_each_node`: False
634
+ - `save_only_model`: False
635
+ - `restore_callback_states_from_checkpoint`: False
636
+ - `no_cuda`: False
637
+ - `use_cpu`: False
638
+ - `use_mps_device`: False
639
+ - `seed`: 42
640
+ - `data_seed`: None
641
+ - `jit_mode_eval`: False
642
+ - `use_ipex`: False
643
+ - `bf16`: False
644
+ - `fp16`: True
645
+ - `fp16_opt_level`: O1
646
+ - `half_precision_backend`: auto
647
+ - `bf16_full_eval`: False
648
+ - `fp16_full_eval`: False
649
+ - `tf32`: None
650
+ - `local_rank`: 0
651
+ - `ddp_backend`: None
652
+ - `tpu_num_cores`: None
653
+ - `tpu_metrics_debug`: False
654
+ - `debug`: []
655
+ - `dataloader_drop_last`: False
656
+ - `dataloader_num_workers`: 0
657
+ - `dataloader_prefetch_factor`: None
658
+ - `past_index`: -1
659
+ - `disable_tqdm`: False
660
+ - `remove_unused_columns`: True
661
+ - `label_names`: None
662
+ - `load_best_model_at_end`: False
663
+ - `ignore_data_skip`: False
664
+ - `fsdp`: []
665
+ - `fsdp_min_num_params`: 0
666
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
667
+ - `fsdp_transformer_layer_cls_to_wrap`: None
668
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
669
+ - `deepspeed`: None
670
+ - `label_smoothing_factor`: 0.0
671
+ - `optim`: adamw_torch
672
+ - `optim_args`: None
673
+ - `adafactor`: False
674
+ - `group_by_length`: False
675
+ - `length_column_name`: length
676
+ - `ddp_find_unused_parameters`: None
677
+ - `ddp_bucket_cap_mb`: None
678
+ - `ddp_broadcast_buffers`: False
679
+ - `dataloader_pin_memory`: True
680
+ - `dataloader_persistent_workers`: False
681
+ - `skip_memory_metrics`: True
682
+ - `use_legacy_prediction_loop`: False
683
+ - `push_to_hub`: False
684
+ - `resume_from_checkpoint`: None
685
+ - `hub_model_id`: None
686
+ - `hub_strategy`: every_save
687
+ - `hub_private_repo`: None
688
+ - `hub_always_push`: False
689
+ - `gradient_checkpointing`: False
690
+ - `gradient_checkpointing_kwargs`: None
691
+ - `include_inputs_for_metrics`: False
692
+ - `include_for_metrics`: []
693
+ - `eval_do_concat_batches`: True
694
+ - `fp16_backend`: auto
695
+ - `push_to_hub_model_id`: None
696
+ - `push_to_hub_organization`: None
697
+ - `mp_parameters`:
698
+ - `auto_find_batch_size`: False
699
+ - `full_determinism`: False
700
+ - `torchdynamo`: None
701
+ - `ray_scope`: last
702
+ - `ddp_timeout`: 1800
703
+ - `torch_compile`: False
704
+ - `torch_compile_backend`: None
705
+ - `torch_compile_mode`: None
706
+ - `dispatch_batches`: None
707
+ - `split_batches`: None
708
+ - `include_tokens_per_second`: False
709
+ - `include_num_input_tokens_seen`: False
710
+ - `neftune_noise_alpha`: None
711
+ - `optim_target_modules`: None
712
+ - `batch_eval_metrics`: False
713
+ - `eval_on_start`: False
714
+ - `use_liger_kernel`: False
715
+ - `eval_use_gather_object`: False
716
+ - `average_tokens_across_devices`: False
717
+ - `prompts`: None
718
+ - `batch_sampler`: no_duplicates
719
+ - `multi_dataset_batch_sampler`: proportional
720
+
721
+ </details>
722
+
723
+ ### Training Logs
724
+ | Epoch | Step | Training Loss | Validation Loss | dev_cosine_ap |
725
+ |:------:|:-----:|:-------------:|:---------------:|:-------------:|
726
+ | 0.4709 | 15000 | 0.1047 | 0.2651 | 0.9158 |
727
+ | 0.4866 | 15500 | 0.0953 | 0.2666 | 0.9173 |
728
+ | 0.5023 | 16000 | 0.0923 | 0.2622 | 0.9143 |
729
+ | 0.5180 | 16500 | 0.0964 | 0.2698 | 0.9147 |
730
+ | 0.5337 | 17000 | 0.0984 | 0.2643 | 0.9125 |
731
+ | 0.5494 | 17500 | 0.0968 | 0.2773 | 0.9149 |
732
+ | 0.5651 | 18000 | 0.1025 | 0.2624 | 0.9140 |
733
+ | 0.5808 | 18500 | 0.1044 | 0.2641 | 0.9082 |
734
+ | 0.5965 | 19000 | 0.106 | 0.2641 | 0.9119 |
735
+ | 0.6122 | 19500 | 0.1041 | 0.2750 | 0.9175 |
736
+ | 0.6279 | 20000 | 0.1021 | 0.2697 | 0.9165 |
737
+ | 0.6436 | 20500 | 0.1016 | 0.2804 | 0.9158 |
738
+ | 0.6593 | 21000 | 0.1025 | 0.2676 | 0.9182 |
739
+ | 0.6750 | 21500 | 0.0979 | 0.2728 | 0.9168 |
740
+ | 0.6907 | 22000 | 0.0978 | 0.2641 | 0.9168 |
741
+ | 0.7064 | 22500 | 0.0976 | 0.2725 | 0.9128 |
742
+ | 0.7221 | 23000 | 0.0968 | 0.2824 | 0.9115 |
743
+ | 0.7378 | 23500 | 0.0941 | 0.2759 | 0.9125 |
744
+ | 0.7535 | 24000 | 0.0983 | 0.2770 | 0.9130 |
745
+ | 0.7692 | 24500 | 0.0975 | 0.2577 | 0.9144 |
746
+ | 0.7849 | 25000 | 0.0939 | 0.2598 | 0.9172 |
747
+ | 0.8006 | 25500 | 0.092 | 0.2661 | 0.9151 |
748
+ | 0.8163 | 26000 | 0.0906 | 0.2657 | 0.9160 |
749
+ | 0.8320 | 26500 | 0.0931 | 0.2553 | 0.9167 |
750
+ | 0.8477 | 27000 | 0.0917 | 0.2649 | 0.9164 |
751
+ | 0.8634 | 27500 | 0.092 | 0.2643 | 0.9169 |
752
+ | 0.8791 | 28000 | 0.0931 | 0.2640 | 0.9166 |
753
+ | 0.8948 | 28500 | 0.0915 | 0.2743 | 0.9148 |
754
+ | 0.9105 | 29000 | 0.0872 | 0.2663 | 0.9197 |
755
+ | 0.9262 | 29500 | 0.0867 | 0.2668 | 0.9174 |
756
+ | 0.9419 | 30000 | 0.086 | 0.2648 | 0.9171 |
757
+ | 0.9576 | 30500 | 0.0873 | 0.2625 | 0.9127 |
758
+ | 0.9733 | 31000 | 0.0877 | 0.2643 | 0.9171 |
759
+ | 0.9890 | 31500 | 0.0916 | 0.2709 | 0.9172 |
760
+ | -1 | -1 | - | - | 0.9087 |
761
+
762
+
763
+ ### Framework Versions
764
+ - Python: 3.11.11
765
+ - Sentence Transformers: 3.4.1
766
+ - Transformers: 4.48.3
767
+ - PyTorch: 2.6.0+cu124
768
+ - Accelerate: 1.3.0
769
+ - Datasets: 3.4.1
770
+ - Tokenizers: 0.21.1
771
+
772
+ ## Citation
773
+
774
+ ### BibTeX
775
+
776
+ #### Sentence Transformers
777
+ ```bibtex
778
+ @inproceedings{reimers-2019-sentence-bert,
779
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
780
+ author = "Reimers, Nils and Gurevych, Iryna",
781
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
782
+ month = "11",
783
+ year = "2019",
784
+ publisher = "Association for Computational Linguistics",
785
+ url = "https://arxiv.org/abs/1908.10084",
786
+ }
787
+ ```
788
+
789
+ #### MultipleNegativesRankingLoss
790
+ ```bibtex
791
+ @misc{henderson2017efficient,
792
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
793
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
794
+ year={2017},
795
+ eprint={1705.00652},
796
+ archivePrefix={arXiv},
797
+ primaryClass={cs.CL}
798
+ }
799
+ ```
800
+
801
+ <!--
802
+ ## Glossary
803
+
804
+ *Clearly define terms in order to be accessible across audiences.*
805
+ -->
806
+
807
+ <!--
808
+ ## Model Card Authors
809
+
810
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
811
+ -->
812
+
813
+ <!--
814
+ ## Model Card Contact
815
+
816
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
817
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "intfloat/multilingual-e5-base",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.48.3",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.48.3",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:99b7be2b45a3e7d9743cce711bd9d116adb1a875f04a3dbcc5939fbc05bf0185
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 512,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }