TR-MTEB commited on
Commit
686e588
·
verified ·
1 Parent(s): da309c9

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,830 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:2038410
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: intfloat/multilingual-e5-base
10
+ widget:
11
+ - source_sentence: >-
12
+ “Kendilerine güveniyorlarsa teklifimi kabul etsinler, her şey ortaya
13
+ çıksın!”
14
+ sentences:
15
+ - >-
16
+ CHP Balıkesir Milletvekili ve Parti Meclisi Üyesi Mehmet Tüm, Cumhurbaşkanı
17
+ ve Başbakanın örtülü ödenek harcamalarında bir yıllık ödeneği 8 ayda
18
+ bitirdiğini belirtti ve örtülü ödeneğin TBMM tarafından denetlenmesi için
19
+ kanun teklifi verdi. Maliye Bakanlığının açıkladığı Ocak-Ağustos dönemi
20
+ bütçe gerçekleşme sonuçlarına göre, Cumhurbaşkanı Tayyip Erdoğan ile
21
+ Başbakan Binali Yıldırım'ın kullanma yetkisinde örtülü ödenekten bu yılın
22
+ ilk 8 ayında yapılan toplam harcama geçen yıla göre yüzde 60,7 oranında
23
+ artarak 1 milyar 319 milyon liradan, 2 milyar 121 milyona liraya yükseldi.
24
+ Tayyip Erdoğan’ın başbakanlığı ve cumhurbaşkanlığı döneminde kırdığı harcama
25
+ rekorlara dikkat çeken CHP’li Tüm, şu açıklamalarda bulundu: “Örtülü ödenek
26
+ harcamaları geçen yıla göre yüzde 60,7 oranında artarak 1 milyar 319 milyon
27
+ liradan 2 milyar 121 milyon liraya yükseldi. Bu hızla giderse harcamalar
28
+ yeni bir rekorla 3 milyar TL’yi de geçmiş olacak. Maliye Bakanlığının
29
+ verileri dikkate alındığında, bu rakamların TBMM, MİT ve birçok bakanlığın
30
+ bütçesini geçtiğini görüyoruz. Saray rejimi, asgari ücrete yılda %5 zammı
31
+ çok görürken, kendi örtülü ödeneğinde %65 artış yapmayı her şeyden daha
32
+ zaruri görüyor. Ödeneklerdeki bu artış, halkın parasının açık ve net bir
33
+ şekilde israf edilmesidir. Devlet bütçesini kimse babasının çiftliği
34
+ değildir. AKP Genel Başkanı ve yöneticilerinin ne için harcadığını
35
+ bilmediğimiz bu paraların denetimi şeffaf bir şekilde yapılmalıdır. Eğer
36
+ AKP’li vekiller bu konuda kendilerine güveniyorlarsa verdiğim kanun
37
+ teklifini kabul etsinler ve her şey açık ve şeffaf bir şekilde ortaya
38
+ çıksın.” CHP’li Mehmet Tüm, TBMM Başkanlığına sunduğu kanun teklifinde
39
+ örtülü ödenek harcamalarının Meclis'te kurulacak bir komisyonla
40
+ denetlenmesini ve harcamaların toplam bütçe harcamalarının binde ikisini
41
+ aşmayacak şekilde sınırlandırılmasını istedi. İşte CHP’li Tüm’ün örtülü
42
+ ödeneği denetimine ilişkin kanun teklifi: 10/12/2003 tarihli ve 5018 sayılı
43
+ Kamu Malî Yönetimi ve Kontrol Kanununun 24’üncü Maddesinde yer alan “binde
44
+ beşini” ibaresi “binde ikisini” olarak değiştirilmiştir. 10/12/2003 tarihli
45
+ ve 5018 sayılı Kamu Malî Yönetimi ve Kontrol Kanununa aşağıdaki ek madde
46
+ eklenmiştir: Bu kanunun 24’üncü Maddesi hükümlerine göre Cumhurbaşkanlığı
47
+ ve Başbakanlık bütçelerine konulan örtülü ödeneklerin harcama sonrası
48
+ denetimi, Türkiye Büyük Millet Meclisi’nde bulunan siyasi parti gruplarının
49
+ güçleri oranında temsil edileceği bir komisyon marifetiyle yapılır. Komisyon
50
+ tarafından yapılan denetim sonrası Türkiye Büyük Millet Meclisi Başkanlığına
51
+ sunulmak üzere bir rapor hazırlanır. Başkanlık, bu raporu Sayıştay Uygunluk
52
+ Bildirimi ile birlikte Plan ve Bütçe Komisyonuna havale eder. Denetim raporu
53
+ Plan ve Bütçe Komisyonunun kapalı oturumunda görüşülür. Komisyon üyeleri
54
+ üçte iki çoğunlukla alınacak kararla, raporun bazı kısımlarına ilişkin
55
+ ayrıntıların açıklanmasına gizlilik kuralları getirebilir.” Bu Kanun yayımı
56
+ tarihinde yürürlüğe girer. Bu Kanun hükümlerini Bakanlar Kurulu yürütür.​
57
+ - >-
58
+ Ligdeki son galibiyetini, 8. haftada Trabzonspor'a konuk olduğu müsabakada
59
+ 6-1 gibi farklı bir skorla alan Teleset Mobilya Akhisarspor, bu önemli
60
+ sonucun ardından yaptığı 7 karşılaşmada da 3 puan elde edemedi. Teleset
61
+ Mobilya Akhisarspor, Trabzonspor zaferinin ardından, Gençlerbirliği ile 3-3
62
+ berabere kaldıktan sonra, Medipol Başakşehir'e 2-1, Aytemiz Alanyaspor'a 4-0
63
+ yenildi. Beşiktaş'la golsüz berabere kalan ve Göztepe'ye 2-0 mağlup olan
64
+ yeşil-siyahlı ekip, geçen haftaki golsüz Evkur Yeni Malatyaspor
65
+ beraberliğinin ardından, dün de Galatasaray'a 4-2 mağlup oldu. Son 7
66
+ maçta sadece 3 puan toplayabilen Ege temsilcisi, 15. haftayı 19 puanla
67
+ tamamladı. Yeşil-siyahlılar, Galatasaray'a yenilmesine karşın, 4 maçtır
68
+ devam eden gol hasretini ise sonlandırdı. Ligin 10. haftasındaki Medipol
69
+ Başakşehir maçının 59. dakikasında Paulo Henrique ile rakip ağları
70
+ havalandırılması sonrası, ardından yapılan 4 maçta da skor üretemeyen
71
+ Teleset Mobilya Akhisarspor, Galatasaray müsabakasının 17. dakikasında
72
+ Maicon'un topu kendi filelerine göndermesiyle, 408 dakika sonra gol sevinci
73
+ yaşamış oldu. Öte yandan, eski takımı Galatasaray'a karşı takımının 2.
74
+ golünü kaydeden Olcan Adın, Süper Lig'de 50. golüne ulaştı. Daha önce
75
+ Trabzonspor formasıyla da Galatasaray'a golü bulunan Olcan Adın,
76
+ Akhisarspor'da toplam 6., bu sezon ise ilk golünü attı. Dünkü maçta
77
+ gördüğü sarı kartla cezalı duruma düşen Abdoulwahid Sissoko, 17 Aralık Pazar
78
+ günü Manisa'da oynanacak Kayserispor maçında forma giyemeyecek. Kırmızı kart
79
+ gören Miguel Lopes ise Ziraat Türkiye Kupası'nda 13 Aralık Çarşamba günü
80
+ Ankara Demirspor ile oynanacak maçta oynayamayacak. Portekizli futbolcu
81
+ Profesyonel Futbol Disiplin Kurulundan ceza alması halinde ligde de mücadele
82
+ edemeyecek.
83
+ - >-
84
+ MHP Genel Başkanı Devlet Bahçeli, partisinin grup toplantısında konuşma
85
+ yaptı. Devlet Bahçeli, CHP'den gelen "Hakikat Komisyonu kurulsun" önerisine
86
+ de sert tepki gösterdi. AK Parti ve CHP'nin birlikte hareket ettiğini
87
+ savunan Bahçeli, şunları söyledi: "İkisinin de kafasında İmralı canisinin
88
+ affı vardır. Başbakan Erdoğan'ın değişken sözleri ve CHP lderinin sözleri
89
+ birebir örtüşmektedir. Hakikat Komisyonu'nun kurulmasıyla ilgili CHP
90
+ önerisini milletimizi büyük bir kaygıyla beklemektedir. TSK da terör örgütü
91
+ de silah bıraksın diyen bir CHP zihniyeti nasıl Atatürk'ün kurduğu bir parti
92
+ olabilir? Bundan sonra CHP ne diyecektir. AKP'nin izinden yürüyen CHP'nin
93
+ kabullerden saptığı, üniter devlet yapısını fantazi olarak görmektedirler.
94
+ Önde kavga ederken arkada Türkiye'nin gizli planlarını yapmaktadırlar.
95
+ Türkiye'nin temellerinden oynama yaparak kaynaşma yapacağını sananlar
96
+ milletimizden en sert cevabı alacağından kuşkumuz yoktur."
97
+ - source_sentence: >-
98
+ Şırnak'ın Silopi ilçesinde iki aşirete mensup lise öğrencileri arasında
99
+ çıkan kavgaya polis biber gazıyla müdahale etti. Gazdan etkilenen öğrenciler
100
+ hastaneye kaldırılırken, çok sayıda öğrenci de gözaltına alındı.
101
+ sentences:
102
+ - >-
103
+ Bir televizyon kanalında gündeme ilişkin değerlendirmelerde bulunan Devlet
104
+ Bakanı ve Başbakan Yardımcısı Bülent Arınç, İnegöl ve Dörtyol'da yaşanan
105
+ olayları üzüntüyle karşıladıklarını, tahrikler ve tertipler sonucu yaşanan
106
+ bu tür olaylarda halkın sağduyulu olması, siyasetçilerin de kullandıkları
107
+ dile özen göstermesi gerektiğini söyledi. Arınç, kolluk güçlerinin bu tür
108
+ olayları bastıracak, sebebiyet verenleri yargıya teslim edecek güçte
109
+ olduğunu vurguladı. Olaylarla ilgili bir istihbarat zafiyeti olup
110
+ olmadığının, İçişleri Bakanlığının yapacağı araştırma sonucunda ortaya
111
+ çıkacağını ifade eden Arınç, ''olayların somut sebebi şudur'' demenin şu
112
+ sırada mümkün olmadığını, konuyla ilgili araştırma derinleştikçe
113
+ tahrikçilerin ve olayları yönlendirenlerin belirleneceğini bildirdi.
114
+ ''MHP'nin bölgeye heyet gönderecek olması tansiyonu yükseltir'' mi sorusu
115
+ üzerine, dün bir TV kanalında BDP'nin bölgeye bir heyet göndermesini
116
+ ''yangına benzin dökmek olarak'' tanımladığını hatırlatan Arınç, sözlerini
117
+ şöyle sürdürdü; ''Zaten şehrin valisi girişleri yasakladı. BDP ile yapılan
118
+ görüşmelerde de onlar anlayış gösterdi. Eleştirdiler, ama itiraz etmediler
119
+ veya direnmediler. Onlar da sanıyorum hassasiyetleri görmüş olmalılar. Eğer
120
+ MHP'liler de aynı amaçla yola çıkıyor, Dörtyol'da tansiyonu yükseltebilecek
121
+ bir olayın içine gidiyorlarsa, ki bence bugünlerde bunu yapmamalılar,
122
+ vazgeçmelerini tavsiye ederim. Çünkü MHP'lilerin olaylara şu veya bu
123
+ şekilde karışmaları -tahrikçi olmasa bile milliyetçi duygularla ortada bir
124
+ yanlışlık var- ve bu yanlışlığa müdahale etmek için sokaklara çıkmışlarsa
125
+ -şüphesiz bir iki ay önce İskenderun'a yakın bir yerde bir kışlamızı basarak
126
+ 6 askerin şehit olmasına yol açmışlardı- bu olayların acısı henüz
127
+ unutulmamışken, şimdi bu tür olayların hemen arkasında ve akabinde orada boy
128
+ göstermelerinin, meydan okumalarının olumlu katkısı olmaz diye düşünüyorum.
129
+ Gidenler şüphesiz sukunet çağrısında bulunacak ve olayları yatıştırmaya
130
+ çalışacaklardır, ama BDP'lilerin girmesi tahrik unsuru olarak görülmüş ve
131
+ yasaklanmışken bunun anti tezi olarak bir başka siyasi grubun 'bak onlar
132
+ giremedi ama biz girdik, onlar yasaklandı ama biz yasaklanmadık, onlar
133
+ Türkiye için tehlike ama biz bu çerçeveden meseleye bakıyoruz' demeleri de
134
+ karşı tarafı da harekete geçirecek görünüyor.'' Arınç, Başbakan Recep
135
+ Tayyip Erdoğan'ın yarın Hatay'da yapacağı mitingin önemine dikkati çekerek,
136
+ Başbakan Erdoğan'ın ''birlik beraberlik, kardeşlik mesajları vereceğini,
137
+ tahriklere yol açacak hadiselerden kaçınılmasını tavsiye edeceğini dile
138
+ getirdi. Şemdinli'de dün yaşanan olaylarda küçük çocukların ön planda
139
+ olduğunun hatırlatılması, ''Taş Atan Çocuklar'' la ilgili yasal düzenlemenin
140
+ ardından bu durumu nasıl değerlendirdiğinin sorulması üzerine Arınç, PKK
141
+ terör örgütünün kadın ve çocukların önde olduğu eylemlerle bir mağduriyet
142
+ yaratmaya çalıştığına işaret etti. ''Aldatılmaya, kandırılmaya müsait
143
+ yaştaki çocukların örgütün elinde bir oyuncak haline gelmesi, bizim
144
+ yaptığımız düzenlemenin ne kadar doğru ve haklı olduğunu da gösteriyor.
145
+ Çocuklara sahip çıkmak açısından çok iyi bir düzenleme yaptık'' diyen Arınç,
146
+ bundan pişman olacak bir noktada bulunmadıklarını ifade etti. PKK'nın
147
+ çocukları çok kötü bir şekilde kullandığına işaret eden Arınç, ''Barış ve
148
+ demokrasi partisi ismi gibi bu olaylara engel olmaya çalışmalı. Buna rağmen
149
+ örgütün kullanması karşısında da yine halkımızın 'hayır biz çocuklarımıza
150
+ sahip olacağız' diyerek ciddi bir direnç göstermesi lazım'' diye konuştu.
151
+ - >-
152
+ Söz konusu 8 köprülü kavşağın, 20 Şubat'ta Başbakan Tayyip Erdoğan'ın da
153
+ katılması beklenen tören ile hizmete alınması planlanıyor. Açıklamaya göre,
154
+ TOKİ, İstanbul'a inşa ettiği toplu konut alanlarında ulaşımı kolaylaştırmak
155
+ için 8 ayrı bölgede köprü, kavşak ve bağlantı yolu yaptı. Ataşehir toplu
156
+ konut alanına bağlantıyı sağlayan 2, Başakşehir Ispartakule toplu konut
157
+ alanına bağlantıyı sağlayan 1 ve Halkalı toplu konut alanlarına bağlantıyı
158
+ sağlayan 5 ayrı köprülü kavşak, Başbakan Recep Tayyip Erdoğan'ın da
159
+ katılması beklenen, 20 Şubat'ta yapılacak törenle hizmete açılacak.
160
+ - >-
161
+ Bir lisede iki öğrenci grubu arasında başlayan tartışma kısa sürede kavgaya
162
+ dönüştü. Kavganın büyümesi üzerine, okul yönetimi, durumu polise bildirdi.
163
+ Polis ekipleri, öğrencileri ayırmakta zorlanınca, biber gazı kullandı.
164
+ Okulun bahçesinden çıkarak sokak aralarına kaçan öğrenciler, polise taşlı
165
+ saldırıda bulundu. Yaşanan kovalamaca sonucunda bazı öğrenciler gözaltına
166
+ alındı. Bu arada, gazdan etkilenen öğrenciler, olay yerine çağrılan
167
+ ambulanslarla Silopi Devlet Hastanesi’ne kaldırıldı. İlçe Milli Eğitim
168
+ Müdürü Sait Uysal, yaşanan kavga olayıyla ilgili olarak, ''Kavganın sebebini
169
+ henüz öğrenemedik. Öğrenciler arasında çıkan kavga bütün okula yayıldı.
170
+ Biber gazından etkilenen öğrenciler, ambulanslarla Silopi Devlet
171
+ Hastanesi'ne götürüldü'' dedi. Kavga nedeniyle eğitime yarım gün ara
172
+ verildiği bildirildi.
173
+ - source_sentence: >-
174
+ Obezite, kalp krizinden koruyor olabilir mi? İngiltere'de bilim dünyası bu
175
+ soruya yanıt arıyor. Araştırmalara göre, damarlardaki fazla yağ, belli bir
176
+ seviyenin üstündeyken, kalbi koruyucu etki yapabiliyor.
177
+ sentences:
178
+ - >-
179
+ CHP Genel Başkanı Kemal Kılıçdaroğlu, referandum sonuçlarının ardından
180
+ yaptığı açıklamada “Koşullar eşit olmamasına karşın elimizden gelen her
181
+ türlü çabayı gösterdik” diyerek, YSK’nin mühürsüz zarf ve pusulaların
182
+ geçerli sayılması yönündeki kararına tepki gösterdi. Kılıçdaroğlu, “YSK,
183
+ üzülerek ifade edeyim, bu referandumu tartışmalı hale getirdi. Maç
184
+ yapılırken maçın ortasında kural değişmez” dedi. Kılıçdaroğlu’nun,
185
+ sonuçların ardından akşam saatlerinde CHP Genel Merkezi’ne gelerek
186
+ kurmaylarıyla değerlendirmede bulunduğu öğrenildi. Daha sonra bir basın
187
+ toplantısı düzenleyen Kılıçdaroğlu, “Eşit olmayan koşullarda bir referandum
188
+ gerçekleştirdik. Bunu herkes biliyor. Biz de koşullar eşit olmamasına karşın
189
+ demokrasiye sahip çıkmak için elimizden gelen her türlü çabayı gösterdik. Bu
190
+ çabayı hukuk zemininde kalarak gösterdik. Eveti savunanlar hukukun dışına
191
+ çıktılar, biz özenle hukuk kurallarının içerisinde çaba harcadık” dedi.
192
+ “Anayasalar birer toplumsal uzlaşma belgesidir” diyen Kılıçdaroğlu, “Bu
193
+ referandum bir gerçeği ortaya çıkardı. Toplumun en az yüzde 50’si buna hayır
194
+ diyor. Dolayısıyla bu anayasa değişikliği ve onun oluşturduğu bütün anayasa
195
+ bir anlamda bir toplumsal uzlaşma belgesi olması niteliğini büyük ölçüde
196
+ yitirmiş durumda. Daha önemlisi bu gerçek önümüzde dururken siyaset kurumuna
197
+ bir görev düşüyor. Anayasayı bir toplumsal uzlaşma belgesi haline
198
+ dönüştürmek” diye konuştu. YSK’nin mühürsüz zarf ve pusulaların geçerli
199
+ sayılması kararıyla referandumu tartışmalı hale getirdiğini belirten
200
+ Kılıçdaroğlu, şöyle konuştu: “YSK, üzülerek ifade edeyim, bu referandumu
201
+ tartışmalı hale getirdi. Hiçbir tartışmaya yer vermeyecek şekilde size
202
+ ilgili yasayı okuyorum. Seçim Kanunu’nun 98’inci maddesi: Üzerinde ilçe
203
+ seçim kurulu ve sandık kurulu mührü olmayan zarflar geçersiz sayılır.
204
+ TBMM’den geçen seçim kanunu ve onun 98’inci maddesi söylüyor. Ama YSK bu
205
+ zarfları kabul etti. Niçin? Seçim Kanunu’nun 108’inci maddesi. Arkasında
206
+ sandık kurulu mührü bulunmayan pusula geçersizdir. Hiçbir kurum kendisini
207
+ parlamentonun üstünde göremez. İktidar partisinin itirazı üzerine bunu
208
+ geçerli sayıyorsunuz. Maç yapılırken maçın ortasında kural değişmez
209
+ arkadaşlar. YSK, maçın ortasında üstelik zarflar açıldıktan sonra kuralları
210
+ değiştiriyor. Bunu doğru bulmuyoruz, asla kabul etmiyoruz. Milletin kararına
211
+ saygılıyız ama YSK gölge düşürdü. Hukuksal açıdan da kamu vicdanı açısından
212
+ da referandumun meşruiyetini tartışmalı hale getirdiler. Bunu asla doğru
213
+ bulmuyoruz. Bunu sonuna kadar takip edeceğiz.”
214
+ - "Ege Üniversitesi Spor Bilimleri Fakültesi Öğretim Görevlisi Uzman , obezitenin nedenlerini\_\"Obezite harcanandan daha fazla enerji alınması sonucu, vücutta aşırı miktarda yağ dokusunun olması sebebiyle gelişen,\_ genetik ve çevresel etkileşimli, sağlıklı yaşam adına ciddi ve kronik sorunlara neden olabilen ve oluşum nedeni çok sayıda faktöre bağlı, medikal tedaviye ihtiyaç duyulan metabolik bir sağlık problemidir\" şeklinde anlattı. nin risk faktörleri arasında birçok etkenin olduğunu belirten Oral, \"Obezitenin en önemli risk faktörleri arasında özellikle genetik yatkınlık, fiziksel aktivitede azalma, beslenme alışkanlıkları, yaş, cinsiyet, eğitim düzeyi, evlilik, doğum sayısı gibi faktörler göze çarpıyor. Erişkin ve çocuk obezitesi tüm dünyada ama özellikle gelişmekte olan ülkelerde hızla yayılıyor. Ülkemizde toplumun yaklaşık olarak yüzde 35’inden fazlası obezite problemiyle karşı karşıya kalıyor. Hatta bu oran erkeklerde yüzde 7.9, kadınlar da yüzde\_ 23.4\" diye konuştu. Obezitenin başka hastalıklara da davetiye çıkardığını vurgulayan\_Dr. Oral, \"Birçok kronik hastalığın obezite ile yakından ilişkili olduğu biliniyor. Ayrıca Dünya Sağlık Örgütü, obeziteyi en riskli 10 hastalıktan biri olarak kabul ediyor. Bu konuda yürütülen son araştırmalarda kanserle yakın ilgisi olduğu da belirlenmiştir\" dedi. Obeziteden korunma yolları hakkında da bilgi veren\_Oral, \"Sağlıklı yaşam ve obezite kökenli hastalıkların önlenmesinde en akılcı önlem, dengeli ve yeterli bir beslenme alışkanlığıyla birlikte, haftada 3 gün 30 dakika yavaş yürüyüşle başlayıp haftada 5 gün 45 dakika tempolu yürüyüşler önem taşıyor. Bu tip bir fiziksel aktivite sağlıklı beslenmeye ek olarak 100- 200 kalorilik bir kayıp sağlar. Uzun süreli fiziksel aktivite için, her gün 30 dakika alışkanlığının kazanılması, obezitenin önlem ve tedavisinde olumlu sonuçlar verdiği gözden uzak tutulmamalıdır. Sonuç olarak, sağlıklı bir toplum için sağlıklı beslenme alışkanlığının yanı sıra, fiziksel aktivitenin tüm bireyler için yaşamsal önem ve anlam taşımakta olduğunu tekrar hatırlamak ve bu konuda farkındalığı arttırabilmek için ‘Dünya Obezite Günü’ güzel bir şans olarak değerlendirilmeli\" dedi."
215
+ - >-
216
+ AK Parti Grup Başkanvekili Bülent Turan, Meclis'te basın mensuplarıyla bir
217
+ araya gelerek, gündeme ilişkin değerlendirmelerde bulundu. Genel Kurul'da bu
218
+ hafta Askeralma Kanunu Teklifi'nin görüşüleceğini ve tüm muhalefet
219
+ partilerin grup başkanvekillerini bugün arayarak sürece ilişkin bilgi
220
+ verdiğini anlatan Turan, AK Parti'nin yarın yapacağı kapalı grup
221
+ toplantısında da Milli Savunma Komisyon Başkanı İsmet Yılmaz'ın
222
+ milletvekillerini bilgilendireceğini ifade etti. Muhalefet partilerinin bazı
223
+ maddelere ilişkin değişiklik taleplerinin olduğunu anımsatan Turan, bu
224
+ kapsamda teklifi tekrar gözden geçirdiklerini, paydaşlarla görüştüklerini
225
+ aktardı. Teklifin, tarafların görüşü alınarak hazırlandığını söyleyen Turan,
226
+ "Teklifin görüşmelerinin bu hafta bitmesini ama muhalefetin itirazı süreci
227
+ uzatacak olursa bir dahaki hafta bitmesini öngörüyoruz" diye konuştu.
228
+ Muhalefetin, teklifi "Cumhurbaşkanı'na ekstra yetki veriliyor" şeklinde
229
+ eleştirdiğini anımsatan Turan, bu itirazın haklı olmadığını dile getirdi. Bu
230
+ yetkinin 1970'ten beri Bakanlar Kurulu'nda olduğunu aktaran Turan, artık
231
+ Bakanlar Kurulu olmadığı ve yürütmeyi cumhurbaşkanı temsil ettiği için
232
+ Bakanlar Kurulu'nun yetkilerinin cumhurbaşkanına verildiğine dikkati çekti.
233
+ "Zaten olan bir yetkinin devamından bahsediyoruz, yeni bir yetki yok" diyen
234
+ Turan, teklifi Meclis'ten uzlaşı ve anlaşmayla geçirmeyi planladıklarını, bu
235
+ nedenle konuyu tartışacaklarını vurguladı. Turan, teklifin her partinin
236
+ ortak kanaatiyle geçmesini istediklerinin belirterek, sözlerini şöyle
237
+ sürdürdü: "Niyetimiz, Askeralma Kanunu Teklifi'ni bu hafta bitirmek.
238
+ Bitmezse haftaya biter. Cumhurbaşkanımızın açıkladığı bir yargı paketi,
239
+ strateji belgesi vardı. Bununla ilgili vekillerimiz çalışıyorlar, teklifi
240
+ hazırlıyorlar. Teklif belli bir aşamaya gelir olgunlaşırsa onu da bu haftaya
241
+ yetiştirip, bir sonraki haftaya vermeyi ümit ediyoruz.Askerlikten sonra
242
+ yargı paketini görüşmeyi istiyoruz, niyetimiz o. Bunlar kesin değil daha.
243
+ Teklif, bu hafta gelirse haftaya görüşürüz, askerlik biterse tabii. Teklifi
244
+ büyük oranla olgunlaştırdık, bugün yarın Meclis'e gönderebilirsek komisyon
245
+ görüşme takvimini takdir edecektir. Bu dediğim minvalde takvim devam ederse
246
+ bir dahaki haftaya askerlik biterse Genel Kurul'da görüşürüz olmazsa
247
+ haftaya. Çalışıyoruz. Belli bir olgunluğa eriştikten sonra Meclis'e
248
+ vereceğiz." Yeni askerlik sisteminin yasalaşmasıyla askerlik süresinin
249
+ kısalacağı ve çok sayıda askerin terhis olacağı, bu durumun güvenlik riski
250
+ doğuracağına ilişkin yorumlar hatırlatılarak değerlendirmesi sorulan Turan,
251
+ "Paydaşlar, bunun Türkiye'nin, askerin, ordunun güvenliği için sorun
252
+ olmayacağı kanaatinde. Biz de bu kanaate olumlu yaklaşıyoruz. Genel Kurul'un
253
+ takdiri baş tacı, Meclis her zaman bunları revize etme hakkına sahip ama şu
254
+ an kanun yürürlüğe girdikten sonra 6 ayını bitiren askerlerimizin terhis
255
+ olmasını öngörüyoruz." diye konuştu. Bülent Turan, Askeralma Kanunu
256
+ Teklifi'ne ilişkin muhalefetten öneri gelip gelmediğinin sorulması üzerine,
257
+ "Arkadaşlarımız bayram öncesi görüştü, bazı öneriler var. Bugün bir daha
258
+ görüşüyorlar" dedi. "27 yaşındaki bir genç de 35-36 yaşında üniversitede
259
+ hocalık yapan bir genç de bedelli askerliğe başvurabilecek. Yaşı büyük olana
260
+ öncelik verilmesine ilişkin yorumları nasıl değerlendiriyorsunuz " sorusuna
261
+ Turan, "Bu, tartışılan bir konu. Bugün yarın belli olacak. Konuşuyoruz,
262
+ görüşüyoruz" cevabını verdi. "Meclis, 23 Haziran seçimine kadar açık olacak
263
+ mı?" sorusu üzerine Turan, şunları söyledi: "İstanbul seçimleri Türkiye için
264
+ çok önemli ancak bir yerel seçim. Meclis'in takvimini, gündemini İstanbul
265
+ seçimine göre planlıyor olmak doğru olmaz. Türkiye, demokratik kültürüyle
266
+ her türlü seçimi aşacak, yapacak kabiliyeti olan bir ülke. Meclis
267
+ çalışmalarının İstanbul seçimine göre endekslemeyi doğru bulmayız.
268
+ Halkımızın bizden beklentisi olan kanunlar var. Seçime kadar Meclis'in
269
+ çalışmasını öngörüyoruz." Cumhur İttifakı Adayı Binali Yıldırım ve Millet
270
+ İttifakı Adayı Ekrem İmamoğlu'nun 16 Haziran'da canlı yayında bir araya
271
+ geleceği hatırlatılarak değerlendirmesi sorulan Turan, "Türkiye'nin çoktan
272
+ beri beklediği bu tartışma zemininin hayat bulması kıymetli bir yaklaşım.
273
+ Hem CHP adayının hem de Sayın Yıldırım'ın konuya olumlu yaklaşmasını takdire
274
+ şayan buluyorum" ifadesini kullandı. Yıldırım'ın, canlı yayının öz güvenle
275
+ "en muhalif" diye düşünülen Uğur Dündar'ın moderatörlüğünde yapılmasını
276
+ talep etmesinin kıymetli olduğuna dikkati çeken Turan, şunları kaydetti:
277
+ "Burada kimin kazandığından çok kimin kaybettiği sorusu öne çıktı. Uğur
278
+ Dündar gibi yaşını başını almış, sözüm ona duayen gazeteci keşke böyle bir
279
+ sorumluluktan kaçmamış olsaydı. Çünkü özellikle 28 Şubat yıllarında nasıl
280
+ taraflı gazetecilik yaptığı, çocukları siyasal olarak istismar ettiği,
281
+ farklı görüntüleri değerlendirdiği, hep bunlar bizi üzen habercilik
282
+ anlayışıydı. Bunları belki telafi etme imkanı olabilirdi. Ahiri ömründe iki
283
+ farklı partinin, iki kıymetli adayının çıkıp onun öncülüğünde tartışma
284
+ imkanı bulması çok kıymetliydi ama bunu reddetti. Ben bunu eline geçen
285
+ tarihi fırsatın heba edilmesi olarak düşünüyorum. Gerekçelerini izah etti
286
+ ama bence kendisinden başka kimse inanmadı. Neden vazgeçtiğini kamuoyuna
287
+ açıklamak zorunda olduğunu düşünüyorum."
288
+ - source_sentence: Antalya'da rahatsızlanan 20'den fazla asker hastaneye kaldırıldı.
289
+ sentences:
290
+ - >-
291
+ Hatay'da, gazeteci olduklarını iddia eden 4 Rus, askeri güvenlik bölgesinde
292
+ çekim yaparken yakalandı. Alınan bilgiye göre, askeri bölgede çekim yapan 4
293
+ Rus vatandaşı, güvenlik güçlerince gözaltına alındı. İfadelerinde gazeteci
294
+ olduklarını belirten 4 Rus, gerekli evraklara sahip olmadıkları için yasal
295
+ işlemlerin ardından sınır dışı edildi.
296
+ - "Kulübün resmi sitesinden yapılan açıklamada Mehmet Özdilek ve ekibine teşekkür edilirken, şu ifadelere yer verildi:\r\n \"Ligde son haftalarda istediği sonuç ve puanları alamayan ekibimizde, Teknik Direktör Mehmet Özdilek ile Yönetim Kurulu arasında yapılan görüşmenin ardından karşılıklı anlaşma ile yollarımız ayrıldı. Özdilek ve yardımcılarına birlikte olduğumuz süreçte gösterdikleri emeklere teşekkür ediyor bundan sonraki çalışma hayatlarında başarılar diliyoruz.\""
297
+ - "Hatay'ın Altınözü ilçesine\_bağlı Karbeyaz Mahallesi sınır bölgesi içerisinde nöbet değişimi için göreve çıkan askeri araç şarampole devrildi. Kazada yaralanan 19 asker olay yerine çağrılan ambulanslarla Antakya'daki çeşitli hastanelere kaldırılarak tedavi altına alındı. Askerlerin sağlık durumlarının iyi olduğu öğrenildi."
298
+ - source_sentence: >-
299
+ Rusya Devlet Başkanı Vladimir Putin, "Türk yönetimi, uçağımızı düşürdü ve
300
+ büyük bir hata yaptı. Dahası, korudukları kişiler de karadan pilotumuza ateş
301
+ açtı. Bu askeri suç karşısında verdiğimiz yanıt, ihtiyatlı olmaktan da
302
+ öteydi" dedi.
303
+ sentences:
304
+ - >-
305
+ ' Rusya Halk Cephesi 1. Bölgelerarası Forumu'nda konuşan Rus lider,
306
+ Türkiye'ye yönelik önlemlerin inşaat alanında yürürlükte olan anlaşmaları
307
+ etkilemeyeceğini belirterek, Türkiye'ye inşaat sektöründe getirilen
308
+ yaptırımların ardından Rusya'da 87 bin kişilik istihdam kontenjanının
309
+ açılacağını kaydetti. Putin, şöyle konuştu: "Şu anda 300 Türk şirketinin
310
+ Rusya'da sözleşmeleri bulunuyor. Bunların toplam tutarı yaklaşık 50 milyar
311
+ dolar. Mevcut sözleşmeleri feshetmeme kararı aldık. Çünkü bu sadece Türk
312
+ iktidarının eylemine verilmiş bir yanıt olmayacak, biz de bundan zarar
313
+ görebiliriz. Ancak bundan sonra Türk şirketleriyle yeni anlaşma
314
+ imzalamayacağız." Rusya Devlet Başkanı'nın gündeminde Suriye'deki terörle
315
+ mücadele çalışmaları da vardı. Putin, "Terörle mücadelede dikkatli ancak
316
+ güçlü bir şekilde hareket edeceğiz. Verdiğiniz destek için sizlere ve
317
+ gösterdikleri çabalar için Rus askerlerine teşekkür ediyorum" dedi.
318
+ - >-
319
+ Bordo-mavili takımın başkanı Muharrem Usta, Galatasaray'dan Çin ekibi Pekin
320
+ Guoan'a transfer olan Burak Yılmaz'a teşekkür mesajı yayınladı. Usta
321
+ mesajında, "Burak Yılmaz... Yolun açık olsun, dönmek istersen Trabzonspor'un
322
+ kapısı sana her zaman açık olacak. Her şey için teşekkürler" dedi. 8 milyon
323
+ Euro karşılığında Çin'e giden Burak sözleşmesindeki yüzde 25'lik opsiyon
324
+ sayesinde bu transferle Trabzonspor'a da 2 milyon Euro daha kazandırmıştı.
325
+ - >-
326
+ Habertürk’ün “Duran tavuk” başlığıyla gündeme getirdiği ve tavuk üretimini
327
+ yüzde 80 azaltan üreticiler ile firmaların sözleşme krizini aşma çabaları
328
+ sürerken, Türkiye Kanatlı Hayvan Eti Yetiştiricileri Merkez Birliği
329
+ (TÜKEBİR) büyük bir entegre tesis almak için harekete geçti. Daha önce
330
+ kapanan bir entegre tesisin sahibiyle görüşmeler başladı. Sakarya Kanatlı
331
+ Hayvan Eti Yetiştiricileri Birliği Başkan Yardımcısı İrfan Sarı, tesiste
332
+ incelemelerde bulundu. Tesis, çift vardiyada günlük 160 bin piliç kesimi
333
+ yapabilecek ve yaklaşık 350 tonluk piliç eti üretilecek. Gazete
334
+ Habertürk'ten Ramiz Kaan Oktar'ın haberine göre Doğu Marmara Bölgesi’ndeki
335
+ tüm üreticiler dilediklerinde buraya piliç verebilecek. Bölgesel üretimin en
336
+ fazla yüzde 35’i bu tesise alınacak. Sistemde kapasite artırımı üretim
337
+ anlamında maksimum yüzde 25 oranında olabilecek. Eğer bu artış yetersiz
338
+ gelirse yeni bir tesis alımı ya da yapımı söz konusu olacak. Sakarya Kanatlı
339
+ Hayvan Eti Yetiştiricileri Birliği Başkanı İrfan Demiray, “Eğer firmalarla
340
+ sözleşme istediğimiz şekilde imzalanamazsa kendi tesisimiz hazır olacak.
341
+ Vatandaşımız direkt üreticiden ürün alabilecek” dedi.
342
+ pipeline_tag: sentence-similarity
343
+ library_name: sentence-transformers
344
+ metrics:
345
+ - cosine_accuracy
346
+ - cosine_accuracy_threshold
347
+ - cosine_f1
348
+ - cosine_f1_threshold
349
+ - cosine_precision
350
+ - cosine_recall
351
+ - cosine_ap
352
+ - cosine_mcc
353
+ model-index:
354
+ - name: SentenceTransformer based on intfloat/multilingual-e5-base
355
+ results:
356
+ - task:
357
+ type: binary-classification
358
+ name: Binary Classification
359
+ dataset:
360
+ name: dev
361
+ type: dev
362
+ metrics:
363
+ - type: cosine_accuracy
364
+ value: 0.8555852102590809
365
+ name: Cosine Accuracy
366
+ - type: cosine_accuracy_threshold
367
+ value: 0.6372671127319336
368
+ name: Cosine Accuracy Threshold
369
+ - type: cosine_f1
370
+ value: 0.8600484871383143
371
+ name: Cosine F1
372
+ - type: cosine_f1_threshold
373
+ value: 0.6254763007164001
374
+ name: Cosine F1 Threshold
375
+ - type: cosine_precision
376
+ value: 0.8364259905689264
377
+ name: Cosine Precision
378
+ - type: cosine_recall
379
+ value: 0.8850440642820114
380
+ name: Cosine Recall
381
+ - type: cosine_ap
382
+ value: 0.9172012841259736
383
+ name: Cosine Ap
384
+ - type: cosine_mcc
385
+ value: 0.7117817758627474
386
+ name: Cosine Mcc
387
+ - type: cosine_accuracy
388
+ value: 0.8516794688191641
389
+ name: Cosine Accuracy
390
+ - type: cosine_accuracy_threshold
391
+ value: 0.6502314805984497
392
+ name: Cosine Accuracy Threshold
393
+ - type: cosine_f1
394
+ value: 0.8540095956134338
395
+ name: Cosine F1
396
+ - type: cosine_f1_threshold
397
+ value: 0.6245771050453186
398
+ name: Cosine F1 Threshold
399
+ - type: cosine_precision
400
+ value: 0.8155420683089373
401
+ name: Cosine Precision
402
+ - type: cosine_recall
403
+ value: 0.8962856395500916
404
+ name: Cosine Recall
405
+ - type: cosine_ap
406
+ value: 0.9086649286867274
407
+ name: Cosine Ap
408
+ - type: cosine_mcc
409
+ value: 0.6984897891408454
410
+ name: Cosine Mcc
411
+ language:
412
+ - tr
413
+ ---
414
+
415
+ # SentenceTransformer based on intfloat/multilingual-e5-base
416
+
417
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
418
+
419
+ ## Model Details
420
+
421
+ ### Model Description
422
+ - **Model Type:** Sentence Transformer
423
+ - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision 835193815a3936a24a0ee7dc9e3d48c1fbb19c55 -->
424
+ - **Maximum Sequence Length:** 512 tokens
425
+ - **Output Dimensionality:** 768 dimensions
426
+ - **Similarity Function:** Cosine Similarity
427
+ <!-- - **Training Dataset:** Unknown -->
428
+ <!-- - **Language:** Unknown -->
429
+ <!-- - **License:** Unknown -->
430
+
431
+ ### Model Sources
432
+
433
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
434
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
435
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
436
+
437
+ ### Full Model Architecture
438
+
439
+ ```
440
+ SentenceTransformer(
441
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
442
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
443
+ (2): Normalize()
444
+ )
445
+ ```
446
+
447
+ ## Usage
448
+
449
+ ### Direct Usage (Sentence Transformers)
450
+
451
+ First install the Sentence Transformers library:
452
+
453
+ ```bash
454
+ pip install -U sentence-transformers
455
+ ```
456
+
457
+ Then you can load this model and run inference.
458
+ ```python
459
+ from sentence_transformers import SentenceTransformer
460
+
461
+ # Download from the 🤗 Hub
462
+ model = SentenceTransformer("selmanbaysan/multilingual-e5-base_contrastive_loss_training")
463
+ # Run inference
464
+ sentences = [
465
+ 'Rusya Devlet Başkanı Vladimir Putin, "Türk yönetimi, uçağımızı düşürdü ve büyük bir hata yaptı. Dahası, korudukları kişiler de karadan pilotumuza ateş açtı. Bu askeri suç karşısında verdiğimiz yanıt, ihtiyatlı olmaktan da öteydi" dedi.',
466
+ '\' Rusya Halk Cephesi 1. Bölgelerarası Forumu\'nda konuşan Rus lider, Türkiye\'ye yönelik önlemlerin inşaat alanında yürürlükte olan anlaşmaları etkilemeyeceğini belirterek, Türkiye\'ye inşaat sektöründe getirilen yaptırımların ardından Rusya\'da 87 bin kişilik istihdam kontenjanının açılacağını kaydetti. Putin, şöyle konuştu: "Şu anda 300 Türk şirketinin Rusya\'da sözleşmeleri bulunuyor. Bunların toplam tutarı yaklaşık 50 milyar dolar. Mevcut sözleşmeleri feshetmeme kararı aldık. Çünkü bu sadece Türk iktidarının eylemine verilmiş bir yanıt olmayacak, biz de bundan zarar görebiliriz. Ancak bundan sonra Türk şirketleriyle yeni anlaşma imzalamayacağız." Rusya Devlet Başkanı\'nın gündeminde Suriye\'deki terörle mücadele çalışmaları da vardı. Putin, "Terörle mücadelede dikkatli ancak güçlü bir şekilde hareket edeceğiz. Verdiğiniz destek için sizlere ve gösterdikleri çabalar için Rus askerlerine teşekkür ediyorum" dedi.',
467
+ 'Bordo-mavili takımın başkanı Muharrem Usta, Galatasaray\'dan Çin ekibi Pekin Guoan\'a transfer olan Burak Yılmaz\'a teşekkür mesajı yayınladı. Usta mesajında, "Burak Yılmaz... Yolun açık olsun, dönmek istersen Trabzonspor\'un kapısı sana her zaman açık olacak. Her şey için teşekkürler" dedi. 8 milyon Euro karşılığında Çin\'e giden Burak sözleşmesindeki yüzde 25\'lik opsiyon sayesinde bu transferle Trabzonspor\'a da 2 milyon Euro daha kazandırmıştı.',
468
+ ]
469
+ embeddings = model.encode(sentences)
470
+ print(embeddings.shape)
471
+ # [3, 768]
472
+
473
+ # Get the similarity scores for the embeddings
474
+ similarities = model.similarity(embeddings, embeddings)
475
+ print(similarities.shape)
476
+ # [3, 3]
477
+ ```
478
+
479
+ <!--
480
+ ### Direct Usage (Transformers)
481
+
482
+ <details><summary>Click to see the direct usage in Transformers</summary>
483
+
484
+ </details>
485
+ -->
486
+
487
+ <!--
488
+ ### Downstream Usage (Sentence Transformers)
489
+
490
+ You can finetune this model on your own dataset.
491
+
492
+ <details><summary>Click to expand</summary>
493
+
494
+ </details>
495
+ -->
496
+
497
+ <!--
498
+ ### Out-of-Scope Use
499
+
500
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
501
+ -->
502
+
503
+ ## Evaluation
504
+
505
+ ### Metrics
506
+
507
+ #### Binary Classification
508
+
509
+ * Dataset: `dev`
510
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
511
+
512
+ | Metric | Value |
513
+ |:--------------------------|:-----------|
514
+ | cosine_accuracy | 0.8556 |
515
+ | cosine_accuracy_threshold | 0.6373 |
516
+ | cosine_f1 | 0.86 |
517
+ | cosine_f1_threshold | 0.6255 |
518
+ | cosine_precision | 0.8364 |
519
+ | cosine_recall | 0.885 |
520
+ | **cosine_ap** | **0.9172** |
521
+ | cosine_mcc | 0.7118 |
522
+
523
+ #### Binary Classification
524
+
525
+ * Dataset: `dev`
526
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
527
+
528
+ | Metric | Value |
529
+ |:--------------------------|:-----------|
530
+ | cosine_accuracy | 0.8517 |
531
+ | cosine_accuracy_threshold | 0.6502 |
532
+ | cosine_f1 | 0.854 |
533
+ | cosine_f1_threshold | 0.6246 |
534
+ | cosine_precision | 0.8155 |
535
+ | cosine_recall | 0.8963 |
536
+ | **cosine_ap** | **0.9087** |
537
+ | cosine_mcc | 0.6985 |
538
+
539
+ <!--
540
+ ## Bias, Risks and Limitations
541
+
542
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
543
+ -->
544
+
545
+ <!--
546
+ ### Recommendations
547
+
548
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
549
+ -->
550
+
551
+ ## Training Details
552
+
553
+ ### Training Dataset
554
+
555
+ #### Unnamed Dataset
556
+
557
+ * Size: 2,038,410 training samples
558
+ * Columns: <code>anchor</code> and <code>positive</code>
559
+ * Approximate statistics based on the first 1000 samples:
560
+ | | anchor | positive |
561
+ |:--------|:---------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
562
+ | type | string | string |
563
+ | details | <ul><li>min: 3 tokens</li><li>mean: 6.96 tokens</li><li>max: 18 tokens</li></ul> | <ul><li>min: 8 tokens</li><li>mean: 56.22 tokens</li><li>max: 512 tokens</li></ul> |
564
+ * Samples:
565
+ | anchor | positive |
566
+ |:---------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
567
+ | <code>Malafa</code> | <code>, Hakan Günday'ın kuyumcular (ve halıcılar) üzerinden satış dünyası ile yaşam arasında paralellikler kurarak pazarlama ve satış dünyasını anlattığı, okuyucuya değişik bir dünyanın kapılarını açan romanı. Çoğunlukla Ermenice kelimelerden oluşan kuyumcu argosunun ağırlıklı olarak kullanıldığı romanda, büyük bir kuyumcu mağazasında çalışan "tezgahtar"ların ve alışverişe ge(tiri)len "turist"lerin bir günlük macerası anlatılır.</code> |
568
+ | <code>Sarıyatak, Elbistan</code> | <code>Sarıyatak, Kahramanmaraş ilinin Elbistan ilçesine bağlı bir mahalledir.</code> |
569
+ | <code>Åsane</code> | <code>, Norveç'in Bergen şehrinin bir kasabasıdır. Şehrin kuzeyindeki bu kasaba 1972'ye kadar ayrı bir şehir idi.</code> |
570
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
571
+ ```json
572
+ {
573
+ "scale": 20.0,
574
+ "similarity_fct": "cos_sim"
575
+ }
576
+ ```
577
+
578
+ ### Evaluation Dataset
579
+
580
+ #### Unnamed Dataset
581
+
582
+ * Size: 30,724 evaluation samples
583
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
584
+ * Approximate statistics based on the first 1000 samples:
585
+ | | sentence1 | sentence2 | label |
586
+ |:--------|:-----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------|
587
+ | type | string | string | int |
588
+ | details | <ul><li>min: 7 tokens</li><li>mean: 41.43 tokens</li><li>max: 200 tokens</li></ul> | <ul><li>min: 6 tokens</li><li>mean: 310.17 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>0: ~49.40%</li><li>1: ~50.60%</li></ul> |
589
+ * Samples:
590
+ | sentence1 | sentence2 | label |
591
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
592
+ | <code>Kriz tüm dünyayı sarsarken futbol kulüpleri değerlerini yüzde 8 artırdı. En değerli kulüp yine Manchester United oldu.</code> | <code>Fenerbahçe, derbideki galibiyetinin ardından, İMKB'deki artışıyla da yatırımcısının yüzünü güldürdü. Galatasaray-Fenerbahçe derbisinin ardından, bugün İMKB'de işlem gören Fenerbahçe hisselerinde yüzde 8 oranında artış yaşandı. Hisse değeri 55,25 TL'ye kadar yükseldi. Kulübün piyasa değeri 1 milyar 381 milyon 250 bin lira değerinde bulunuyor. Derbide kaybeden Galatasaray ise en çok değer kaybeden be��inci hisse konumunda. Galatasaray hisseleri yüzde 4.9 düşüşle 213,50 TL'ye geriledi.</code> | <code>0</code> |
593
+ | <code>İstanbul Sarıyer’de ormanda bulunan yakılmış cesedin 50 yaşındaki Yusuf Işık’a ait olduğu öne sürülüyor. Işık, eş bulmak için Hatay’a giden gençleri anlaşmalı olduğu Suriyeli kadınlarla buluşturup onlarca kişiyi dolandırmakla suçlanıyor.</code> | <code>Zonguldak'ta ormanlık alanda cesedi yırtıcı hayvanlarca parçalanmış halde bulunan şahıs hakkındaki gerçek otopsi sonucu ortaya çıktı. Av tüfeğiyle öldürüldüğü tespit edilen adamın katili köyündeki komşusu çıktı.   İHA'nın haberine göre olay, 10 gün önce Çaycuma ilçesine bağlı Perşembe beldesi Koramanlar köyünde yaşandı. 55 yaşındaki Sezai Karaca'nın cesedi ormanlık alanda yabani hayvanlarca parçalanmış halde bulundu. Jandarma ekiplerince yapılan incelemenin ardından Karaca'nın cesedi otopsi için hastane morguna kaldırıldı. Otopside Sezai Karaca'nın av tüfeği ile öldürüldüğü tespit edilerek vücudundan silahtan çıktığı belirlenen saçmalara rastlandı. Soruşturmayı derinleştiren jandarma ekipleri olayla ilgili Sezai Karaca'nın komşusu Veli B.'yi gözaltına aldı. İlçe Jandarma Komutanlığı'ndaki sorgusunda uzun süre konuşmayan Veli B. bir süre sonra cinayeti itiraf etti. Veli B.'ye, çelik yelek giydirilerek olay yerinde keşif yaptırıldı. Sağlık kontrolünden geçirilen zanlı, işlemlerinin ardın...</code> | <code>0</code> |
594
+ | <code>İdlib'de merkezindeki bombalı saldırıda ilk belirlemelere göre 7 kişi hayatını kaybetti.</code> | <code>Suriye'nin kuzeyindeki İdlib il merkezinde düzenlenen bombalı saldırıda ilk belirlemelere göre 7 kişinin öldüğü, 30 kişinin yaralandığı bildirildi.  İdlib Sivil Savunma (Beyaz Baretliler) Müdürü Mustafa Hac Yusuf, öğle saatlerinde kent merkezindeki "Saat Kavşağı" bölgesine yerleştirilen bombanın patlatılması sonucu en az 7 sivilin hayatını kaybettiği ve 30 sivilin yaralandığını ifade etti. Olayı henüz üstlenen üstlenmedi. Türkiye sınırında bulunan İdlib, Kazakistan'ın başkenti Astana'da 4-5 Mayıs 2017'deki toplantıda, Türkiye, Rusya ve İran tarafından "gerginliği azaltma bölgesi" ilan edilmişti.</code> | <code>1</code> |
595
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
596
+ ```json
597
+ {
598
+ "scale": 20.0,
599
+ "similarity_fct": "cos_sim"
600
+ }
601
+ ```
602
+
603
+ ### Training Hyperparameters
604
+ #### Non-Default Hyperparameters
605
+
606
+ - `eval_strategy`: steps
607
+ - `per_device_train_batch_size`: 64
608
+ - `per_device_eval_batch_size`: 64
609
+ - `learning_rate`: 2e-05
610
+ - `num_train_epochs`: 1
611
+ - `warmup_ratio`: 0.1
612
+ - `fp16`: True
613
+ - `batch_sampler`: no_duplicates
614
+
615
+ #### All Hyperparameters
616
+ <details><summary>Click to expand</summary>
617
+
618
+ - `overwrite_output_dir`: False
619
+ - `do_predict`: False
620
+ - `eval_strategy`: steps
621
+ - `prediction_loss_only`: True
622
+ - `per_device_train_batch_size`: 64
623
+ - `per_device_eval_batch_size`: 64
624
+ - `per_gpu_train_batch_size`: None
625
+ - `per_gpu_eval_batch_size`: None
626
+ - `gradient_accumulation_steps`: 1
627
+ - `eval_accumulation_steps`: None
628
+ - `torch_empty_cache_steps`: None
629
+ - `learning_rate`: 2e-05
630
+ - `weight_decay`: 0.0
631
+ - `adam_beta1`: 0.9
632
+ - `adam_beta2`: 0.999
633
+ - `adam_epsilon`: 1e-08
634
+ - `max_grad_norm`: 1.0
635
+ - `num_train_epochs`: 1
636
+ - `max_steps`: -1
637
+ - `lr_scheduler_type`: linear
638
+ - `lr_scheduler_kwargs`: {}
639
+ - `warmup_ratio`: 0.1
640
+ - `warmup_steps`: 0
641
+ - `log_level`: passive
642
+ - `log_level_replica`: warning
643
+ - `log_on_each_node`: True
644
+ - `logging_nan_inf_filter`: True
645
+ - `save_safetensors`: True
646
+ - `save_on_each_node`: False
647
+ - `save_only_model`: False
648
+ - `restore_callback_states_from_checkpoint`: False
649
+ - `no_cuda`: False
650
+ - `use_cpu`: False
651
+ - `use_mps_device`: False
652
+ - `seed`: 42
653
+ - `data_seed`: None
654
+ - `jit_mode_eval`: False
655
+ - `use_ipex`: False
656
+ - `bf16`: False
657
+ - `fp16`: True
658
+ - `fp16_opt_level`: O1
659
+ - `half_precision_backend`: auto
660
+ - `bf16_full_eval`: False
661
+ - `fp16_full_eval`: False
662
+ - `tf32`: None
663
+ - `local_rank`: 0
664
+ - `ddp_backend`: None
665
+ - `tpu_num_cores`: None
666
+ - `tpu_metrics_debug`: False
667
+ - `debug`: []
668
+ - `dataloader_drop_last`: False
669
+ - `dataloader_num_workers`: 0
670
+ - `dataloader_prefetch_factor`: None
671
+ - `past_index`: -1
672
+ - `disable_tqdm`: False
673
+ - `remove_unused_columns`: True
674
+ - `label_names`: None
675
+ - `load_best_model_at_end`: False
676
+ - `ignore_data_skip`: False
677
+ - `fsdp`: []
678
+ - `fsdp_min_num_params`: 0
679
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
680
+ - `fsdp_transformer_layer_cls_to_wrap`: None
681
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
682
+ - `deepspeed`: None
683
+ - `label_smoothing_factor`: 0.0
684
+ - `optim`: adamw_torch
685
+ - `optim_args`: None
686
+ - `adafactor`: False
687
+ - `group_by_length`: False
688
+ - `length_column_name`: length
689
+ - `ddp_find_unused_parameters`: None
690
+ - `ddp_bucket_cap_mb`: None
691
+ - `ddp_broadcast_buffers`: False
692
+ - `dataloader_pin_memory`: True
693
+ - `dataloader_persistent_workers`: False
694
+ - `skip_memory_metrics`: True
695
+ - `use_legacy_prediction_loop`: False
696
+ - `push_to_hub`: False
697
+ - `resume_from_checkpoint`: None
698
+ - `hub_model_id`: None
699
+ - `hub_strategy`: every_save
700
+ - `hub_private_repo`: None
701
+ - `hub_always_push`: False
702
+ - `gradient_checkpointing`: False
703
+ - `gradient_checkpointing_kwargs`: None
704
+ - `include_inputs_for_metrics`: False
705
+ - `include_for_metrics`: []
706
+ - `eval_do_concat_batches`: True
707
+ - `fp16_backend`: auto
708
+ - `push_to_hub_model_id`: None
709
+ - `push_to_hub_organization`: None
710
+ - `mp_parameters`:
711
+ - `auto_find_batch_size`: False
712
+ - `full_determinism`: False
713
+ - `torchdynamo`: None
714
+ - `ray_scope`: last
715
+ - `ddp_timeout`: 1800
716
+ - `torch_compile`: False
717
+ - `torch_compile_backend`: None
718
+ - `torch_compile_mode`: None
719
+ - `dispatch_batches`: None
720
+ - `split_batches`: None
721
+ - `include_tokens_per_second`: False
722
+ - `include_num_input_tokens_seen`: False
723
+ - `neftune_noise_alpha`: None
724
+ - `optim_target_modules`: None
725
+ - `batch_eval_metrics`: False
726
+ - `eval_on_start`: False
727
+ - `use_liger_kernel`: False
728
+ - `eval_use_gather_object`: False
729
+ - `average_tokens_across_devices`: False
730
+ - `prompts`: None
731
+ - `batch_sampler`: no_duplicates
732
+ - `multi_dataset_batch_sampler`: proportional
733
+
734
+ </details>
735
+
736
+ ### Training Logs
737
+ | Epoch | Step | Training Loss | Validation Loss | dev_cosine_ap |
738
+ |:------:|:-----:|:-------------:|:---------------:|:-------------:|
739
+ | 0.4709 | 15000 | 0.1047 | 0.2651 | 0.9158 |
740
+ | 0.4866 | 15500 | 0.0953 | 0.2666 | 0.9173 |
741
+ | 0.5023 | 16000 | 0.0923 | 0.2622 | 0.9143 |
742
+ | 0.5180 | 16500 | 0.0964 | 0.2698 | 0.9147 |
743
+ | 0.5337 | 17000 | 0.0984 | 0.2643 | 0.9125 |
744
+ | 0.5494 | 17500 | 0.0968 | 0.2773 | 0.9149 |
745
+ | 0.5651 | 18000 | 0.1025 | 0.2624 | 0.9140 |
746
+ | 0.5808 | 18500 | 0.1044 | 0.2641 | 0.9082 |
747
+ | 0.5965 | 19000 | 0.106 | 0.2641 | 0.9119 |
748
+ | 0.6122 | 19500 | 0.1041 | 0.2750 | 0.9175 |
749
+ | 0.6279 | 20000 | 0.1021 | 0.2697 | 0.9165 |
750
+ | 0.6436 | 20500 | 0.1016 | 0.2804 | 0.9158 |
751
+ | 0.6593 | 21000 | 0.1025 | 0.2676 | 0.9182 |
752
+ | 0.6750 | 21500 | 0.0979 | 0.2728 | 0.9168 |
753
+ | 0.6907 | 22000 | 0.0978 | 0.2641 | 0.9168 |
754
+ | 0.7064 | 22500 | 0.0976 | 0.2725 | 0.9128 |
755
+ | 0.7221 | 23000 | 0.0968 | 0.2824 | 0.9115 |
756
+ | 0.7378 | 23500 | 0.0941 | 0.2759 | 0.9125 |
757
+ | 0.7535 | 24000 | 0.0983 | 0.2770 | 0.9130 |
758
+ | 0.7692 | 24500 | 0.0975 | 0.2577 | 0.9144 |
759
+ | 0.7849 | 25000 | 0.0939 | 0.2598 | 0.9172 |
760
+ | 0.8006 | 25500 | 0.092 | 0.2661 | 0.9151 |
761
+ | 0.8163 | 26000 | 0.0906 | 0.2657 | 0.9160 |
762
+ | 0.8320 | 26500 | 0.0931 | 0.2553 | 0.9167 |
763
+ | 0.8477 | 27000 | 0.0917 | 0.2649 | 0.9164 |
764
+ | 0.8634 | 27500 | 0.092 | 0.2643 | 0.9169 |
765
+ | 0.8791 | 28000 | 0.0931 | 0.2640 | 0.9166 |
766
+ | 0.8948 | 28500 | 0.0915 | 0.2743 | 0.9148 |
767
+ | 0.9105 | 29000 | 0.0872 | 0.2663 | 0.9197 |
768
+ | 0.9262 | 29500 | 0.0867 | 0.2668 | 0.9174 |
769
+ | 0.9419 | 30000 | 0.086 | 0.2648 | 0.9171 |
770
+ | 0.9576 | 30500 | 0.0873 | 0.2625 | 0.9127 |
771
+ | 0.9733 | 31000 | 0.0877 | 0.2643 | 0.9171 |
772
+ | 0.9890 | 31500 | 0.0916 | 0.2709 | 0.9172 |
773
+ | -1 | -1 | - | - | 0.9087 |
774
+
775
+
776
+ ### Framework Versions
777
+ - Python: 3.11.11
778
+ - Sentence Transformers: 3.4.1
779
+ - Transformers: 4.48.3
780
+ - PyTorch: 2.6.0+cu124
781
+ - Accelerate: 1.3.0
782
+ - Datasets: 3.4.1
783
+ - Tokenizers: 0.21.1
784
+
785
+ ## Citation
786
+
787
+ ### BibTeX
788
+
789
+ #### Sentence Transformers
790
+ ```bibtex
791
+ @inproceedings{reimers-2019-sentence-bert,
792
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
793
+ author = "Reimers, Nils and Gurevych, Iryna",
794
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
795
+ month = "11",
796
+ year = "2019",
797
+ publisher = "Association for Computational Linguistics",
798
+ url = "https://arxiv.org/abs/1908.10084",
799
+ }
800
+ ```
801
+
802
+ #### MultipleNegativesRankingLoss
803
+ ```bibtex
804
+ @misc{henderson2017efficient,
805
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
806
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
807
+ year={2017},
808
+ eprint={1705.00652},
809
+ archivePrefix={arXiv},
810
+ primaryClass={cs.CL}
811
+ }
812
+ ```
813
+
814
+ <!--
815
+ ## Glossary
816
+
817
+ *Clearly define terms in order to be accessible across audiences.*
818
+ -->
819
+
820
+ <!--
821
+ ## Model Card Authors
822
+
823
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
824
+ -->
825
+
826
+ <!--
827
+ ## Model Card Contact
828
+
829
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
830
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "XLMRobertaModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "eos_token_id": 2,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 768,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 3072,
14
+ "layer_norm_eps": 1e-05,
15
+ "max_position_embeddings": 514,
16
+ "model_type": "xlm-roberta",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "output_past": true,
20
+ "pad_token_id": 1,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.51.3",
24
+ "type_vocab_size": 1,
25
+ "use_cache": true,
26
+ "vocab_size": 250002
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.51.3",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:99b7be2b45a3e7d9743cce711bd9d116adb1a875f04a3dbcc5939fbc05bf0185
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "max_length": 512,
51
+ "model_max_length": 512,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }