Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 13
How to use hakansabunis/trakad-embed-v2 with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("hakansabunis/trakad-embed-v2")
sentences = [
"Türkiye'de özelleştirme ve çalışma hayatı",
"İşe devamsızlık, şirketlerdeki çalışanların çeşitli sebepler ile gün içerisinde kısmi veya tam gün devamsızlıkları olarak tanımlanmaktadır. Devamsızlık oranı 2018 de Amerika'da %2,9, Avrupa'da %3-6 arasındadır. İşe devamsızlığın yıllık maliyeti Amerika'da 225,8 milyar dolar, Avrupa'da 420 milyar avro ile gayri safi yurt içi hasılanın %2,5'udur. İşe devamsızlık konusunda yapılan bazı araştırmalar sonucunda, işe devamsızlık yapan çalışanların kişisel özellikleri başta olmak üzere ailevi sebepleri, çalışma örgütünün yapısı veya çalışma şeklinden kaynaklı devamsızlık yaptıkları ortaya çıkmıştır. En sık devamsızlık nedeninin sağlık sorunları olması ve artan sağlık maliyetleri nedeniyle işe devamsızlık oranını %3'ün altına indirmek işverenlerin verimlilik hedefi olmuştur. Çalışanlarının yılda ortalama 4,6 gün işe devamsızlığı ile Türkiye Avrupa'nın en az işe devamsızlık yapılan ülkesidir. Bu araştırmanın amacı, Türkiye'de tam zamanında üretim yapan bir otomotiv yan sanayi firmasının mavi yaka çalışanlarının sağlık raporlarının işyeri hekimi tarafından analizi yapılarak, işe devamsızlığı etkileyen faktörlerin incelenmesidir. İş yerine özgün devamsızlık sebepleri incelenmiş ve kas iskelet sistemi hastalıklarının daha çok mazeretli işe devamsızlık nedeni olduğu gözlemlenmiştir. Bu araştırmada elde edilen deneysel sonuçlara göre yaş, kıdem, medeni hal, çocuk sahipliği ve eğitim düzeyi değişkenleri ile devamsızlık arasında anlamlı ilişki saptanırken; BMI, boy ve sigara kullanımı değişkenleri arasında anlamlı ilişki bulunamamıştır. Bu araştırmada iş yerinde sık görülen kas iskelet sistemi hastalıklarının işle ilgili kas iskelet sistemi hastalığı olduğu sonucuna varılmıştır. Sonuç olarak işe bağlı hastalıkların, meslek hastalıklarının ve bu hastalıklara bağlı işe devamsızlıkların azaltılması için işverene, iş yerinin çalışma şekli ve temposunu iyileştirmek için daha fazla görev düşmektedir.",
"1970'li yıllarda yasanan krizin Devletin ekonomik hayata müdahale etmesinin\u000bsonucunda oldugunun ileri sürülmesi ile birlikte Keynesyen ekonomi politikalarının yerini\u000bneo liberal ekonomi politikaları almıstır. Önce gelismis ülkelerde uygulanan ve daha sonra\u000btüm dünyaya yayılan bu politikalar, devleti ekonomik hayatın dısına tasıyarak verimliligi ve\u000bkâr hadlerini artırmayı amaçlamıstır.\u000bBu politikalardan en önemlisi KT'leri özel sektöre satmak ve özel sektörün\u000bönündeki tüm engelleri kaldırmak olan özellestirmedir. Yapılan özellestirmelerin ekonomiye,\u000bhukuka, yönetime, demokratiklesmeye ve çalısma hayatına çok fazla etkileri olmustur.\u000bÖzellestirmelerin çalısma hayatına olumlu ve olumsuz etkileri vardır. KT'lerin satısı\u000bgibi dar manada yapılan özellestirmeler; issizligi artırıp, sendikasızlastırmaya neden olmus,\u000bToplu s Sözlesmelerinin kapsamını daraltmıs, gelir dagılımını bozmus ve sosyal haklarda\u000bkısıtlamalar meydana getirmistir. Yasal ve kurumsal engellerin kaldırılması gibi genis manada\u000byapılan özellestirmeler ise istihdama olumlu katkı yapmıs, gelir dagılımını düzeltmistir.\u000bÜlkemizde Dünya Bankası ile birlikte özellestirmelerin olumsuz etkilerini azaltmaya\u000byönelik olarak Özellestirme Sosyal Destek Projesi gelistirilmistir. Bu projede çalısma\u000bhayatına isçi olarak devam etmek isteyenler ile kendi isini kurmak isteyenlere yönelik olarak\u000bhizmetler verilmistir.",
"Çalışmada Türkiye'de istihdam oranı ile sektörel hasıla arasındaki ilişkiler 2002-2019 dönemi kapsamında incelenmektedir. 2001 ve 2002 yıllarında yaşanan ekonomik krizler nedeniyle çalışma 2002 yılı sonrası dönem için planlanmıştır. Çalışmanın uygulama bölümünde iki model oluşturulmuş, bu modellerin tahmininde Gecikmesi Dağıtılmış Otokorelasyon Model (ARDL), Johansen Eşbütünleşme Analizi ve Hata Düzeltme Modeli yöntemleri kullanılmıştır. Birinci modelde (Model 1) bağımlı değişken istihdam oranı, bağımsız değişkenler tarım sektörü hasılası, sanayi sektörü hasılası, hizmet sektörü hasılası, işletmelereden alınan vergi gelirleri toplamı, sabit sermaye yatrım harcamaları ve ihracatın ithalatı karşılama oranıdır. İkinci modelde (Model 2) bağımlı değişken istihdam oranı, bağımsız değişkenler gayri safi yurtiçi hasıla, işletmelerden alınan vergi gelirleri toplamı, sabit sermaye yatırım harcamaları, ihracatın ithalatı karşılama oranıdır. Model 1'de değişkenlerin durağanlıkları farklı seviyede olduğu için ARDL yöntemi kullanılmıştır. Model 1'in uzun dönem ARDL sonuçlarına göre sabit sermaye yatırım harcamaları ile istihdam oranı arasında istatistiki olarak anlamlı ve pozitif yönlü ilişki vardır. Diğer değişkenler ile istihdam oranı arasında istatistiki olarak anlamlı bir ilişki bulunamamıştır. Kısa dönem ECM sonuçlarına göre, Model 1'deki kısa dönemli hatanın her bir çeyrek dönemde 0.97 azalacağı ve Model 1 uzun dönemde dengeye geleceği belirlenmiştir. Bunun yanısıra kısa dönemde istihdam oranı ile dört dönem gecikmeli reel tarım sektörü hasılası arasında istatiksel olarak anlamlı ve negatif yönlü ilişki vardır. İki dönem gecikmeli reel sanayi sektörü hasılası ile istihdam oranı arasında anlamlı ve negatif yönlü ilişki vardır. Cari reel hizmet sektörü hasılası ile istihdam oranı arasında istatistiksel olarak anlamlı ve negatif yönlü ilişki vardır. Cari ve bir dönem gecikmeli reel sabit sermaye yatırım harcamaları ile istihdam oranı arasında istatiksel olarak anlamlı ve pozitif yönlü, dört dönem gecikmeli reel sabit sermaye yatırım harcamaları ile istihdam oranı arasında istatistiksel olarak anlamlı ve negatif yönlü ilişki vardır. Cari ihracatın ithalatı karşılama oranı ile istihdam oranı arasında istatistiksel olarak anlamlı ve pozitif yönlü, birinci, ikinci ve üçüncü dönem gecikmeli değerleri ile istihdam oranı arasında istatistiki olarak anlamlı ve pozitif yönlü ilişkisi vardır. Model 2'de değişkenlerin hepsi birinci fark durağan olduğu için Johansen eşbütünleşme analizi uygulanmıştır. Model 2'nin Johansen analizi sonuçlarına göre uzun dönemde reel GSYH'da meydana gelen %1 birimlik artış istihdam oranını %0,35 oranında artırmaktadır. Reel sabit sermaye yatırım harcamalarındaki %1 lik artış istihdam oranını %0,22 oranında artırmaktadır. Vergi gelirlerindeki 1 birimlik artış istihdam oranını %4,5 oranında azaltmaktadır. Model 2'nin ECM sonucuna göre sabit sermaye yatırım harcamaları ile istihdam arasında kısa dönemli ilişki vardır. Model 2'de kısa dönemli hata her çeyrek dönemde yaklaşık 0.018 azalmakta ve model uzun dönemde dengeye gelmektedir. Çalışmanın bulgularına göre sektörel hasıla ile istihdam oranı arasında uzun dönemde ilişki olmaması, Türkiye'de hasıla ile istihdam arasındaki ilişkinin güçlendirilmesi gerektiğini ortaya koymaktadır. Türkiye'de istihdamı artıracak sektörel yatırımların desteklenmesi, işsizliği azaltacaktır. Sabit sermaye yatırımlarının artması da istihdam oranını artıracak bir diğer bulgu olarak belirlenmiştir."
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-mpnet-base-v2. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for retrieval.
SentenceTransformer(
(0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'XLMRobertaModel'})
(1): Pooling({'embedding_dimension': 768, 'pooling_mode': 'mean', 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'PLC kontrollü SILAR cihazı yapımı',
"Bu çalışmada, ince film kaplama metotlarından birisi olan Ardışık İyonik Tabaka Adsorpsiyon ve Reaksiyonu (SILAR) metodu ele alınarak bu metodu otomatik olarak uygulayacak cihaz yapımı gerçekleştirildi. SILAR metoduna etki eden parametreler; çözelti konsantrasyonu, çözelti pH'sı, çözeltilerin sıcaklığı, SILAR döngü sayısı ve bekleme süreleri gibi SILAR metoduna etki eden parametreler ayrı ayrı incelendi. Bu parametrelerden biri olan çözeltilerdeki bekleme süresi üzerinde özellikle durularak yapılan SILAR cihazının bu parametre üzerindeki olumlu etkisi anlatıldı. Yapılan bu çalışmada, SILAR metodu çok kolay bir metot olmasına rağmen tamamen insan gücü ile yapılmasının hatalara yol açacağı ve insan hatası faktörünün çok kaliteli ince film üretimine engel teşkil edeceği anlaşıldı. Üretilen bu özgün cihaz ile insan hatası faktörünü ortadan kaldırılarak zaman kaybı olmadan çok kaliteli ince filmler elde edilebilmesi amaçlandı.\nAyrıca, üretilen bu otomatik cihazın kontrolünü sağlayan mikro denetleyici ailesinden en yaygın olarak kullanılan Programlanabilir Mantıksal Denetleyici (PLC) 'de ele alınarak avantajlarından ve kullanım alanlarından bahsedilerek neden projemizde hayat bulduğu üzerinde duruldu.",
'Bu tez çalışmasında, CUK dönüştürücünün tasarımı ve kontrolü gerçekleştirilmiştir. CUK dönüştürücünün matematiksel analizi yapılmıştır. Sistemin Dinamik modelini bulmak için durum uzayı ortalama tekniği uygulanmıştır. Buradan dördüncü dereceden parametrik bir transfer fonksiyonu elde edilmiştir. Elde edilen parametreler kullanılarak CUK dönüştürücünün MATLAB/SIMULINK ortamında benzetimi yapılmış ve sonuçlar değerlendirilmiştir. MATLAB içerisinde yer alan Kullanıcı Tabanlı Ara Yüz (GUI) editörü kullanılarak transfer fonksiyonunu ve sistem için gerekli kontrol parametrelerini bulmak için ara yüz tasarımı yapılmıştır. Tasarlanan ara yüz ile dönüştürücüye ait parametreler girilerek transfer fonksiyonu oluşturulmuştur. Sisteme ait kontrol parametreleri (P, PI, PID) Ziegler-Nichols metodu kullanılarak elde edilmiştir. Sistemin kontrolsüz, PI kontrollü ve PID kontrollü olarak benzetimi yapılmış ve sonuçlar değerlendirilmiştir. Son olarak CUK dönüştürücünün farklı parametre değerlerinde PID kontrol performansı üzerindeki etkiler incelenmiştir. Sistem için en uygun kontrol değerleri gözlemlenmiştir.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.4182, 0.2907],
# [0.4182, 1.0000, 0.0681],
# [0.2907, 0.0681, 1.0000]])
sentence_0, sentence_1, and sentence_2| sentence_0 | sentence_1 | sentence_2 | |
|---|---|---|---|
| type | string | string | string |
| details |
|
|
|
| sentence_0 | sentence_1 | sentence_2 |
|---|---|---|
Pesekinovaruslu hastaların ponseti yöntemi ile tedavisi |
Biz bu çalışmada kliniğimizde 2006 ve 2010 yılları arasında Dicle Üniversitesi Ortopedi ve Travmatoloji Anabilim Dalında idiopatik PEV tanısı konan ve ponseti yöntemiyle tedavi edilen, en küçüğü 4 günlük en büyüğü 42 ay(ortalama 9,2 ay) 35 hastanın 60 ayağının sonuçlarını değerlendirdik. 35 hastanın 7'si kız, 28'i erkek idi. 10 hastada tek taraflı tutulum(2 sol- 8 sağ), 25 hastada çift taraflı tutulum vardı. Takip süresi minimum 12ay maksimum 50 ay olmak üzere ortalama 28,8 ay idi. Tedaviye başlamadan önce Dimeglio ve arkadaşlarının kullandığı PEV değerlendirme sistemi kullanıldı. Tedavi öncesi 41 ayak(%68,3) 2. derece 19 ayak(%31,7) III. derece idi.Tedavi sonrası muayenede Laaveg-Ponseti fonksiyon değerlendirme skorlaması ve Dimeglio skorlaması yapıldı. Ponseti-Laaveg Fonksiyonel değerlendirme skorlamasına göre ponseti yöntemi ile tedavi ettiğimiz 60 ayağın %96,7 `sinde iyi veya mükemmel bir sonuç alındı. Dimeglio sınıflamasına göre tedavi sonrası hastalarımızın %93,3 grade 1 idi. Has... |
ÖZET |
| Amaç: Distal radius kırıkları, ortopedi pratiğinde en sık karşılaşılan yaralanmalardan biridir. Özellikle 55 yaş üzeri kadınlar distal radius kırıklarından en çok etkilenenlerdir. Bu hastalar konservatif ve cerrahi olarak tedavi edilebilir. Çalışmamızın amacı 55 yaş üzeri kadın hastaların distal radius kırıklarında radyolojik değerler ve fonksiyonel sonuçlar arasındaki ilişkiyi değerlendirmekti. | ||
| Gereç ve Yöntem: Çalışmamızda 2018-2022 yılları arasında Ankara Eğitim ve Araştırma Hastanesi'ne başvuran, tarafımızca takibi yapılan tek taraflı distal radius kırığı bulunan 55 yaş ve üzeri konservatif takip edilen veya cerrahi uygulanan toplamda 198 hasta retrospektif olarak incelendi. Radyolojik değerler olarak; volar tilt, ulnar varyans, radial inklinasyon, radial uzunluk ve Lidström skorlaması kullanıldı. Fonksiyonel sonuçlar olarak Modifiye MAYO el bilek ve PRWE skorları | ||
| değerlendirildi. | ||
| Bulgular: Çalışmamızda minimum hasta yaşı 55 maksimum hasta yaşı 92'ydi. Hastaların yaşı arttıkça... | ||
Tüketim toplumu ve kültürü bağlamında bireyin fazla yeme davranışı |
Bu araştırmada, modern öncesi dönem ile sonraki dönemlerde yaşanılan yaşamsal ve kültürel özellikleri, özellikle de postmodern döneme tekabül eden tüketim kültürüne bağlı gıdaların üretim süreçlerindeki uygulamaların ve tüketim biçimleri olan sembolik, gösterişçiliğe ve hazcılığa yönelik tüketimin, bireyin yeme davranışına olan etkileri değerlendirilmeye çalışıldı. Tüketim kültürüyle birlikte yaşanılan bu toplumsal değişimler; endüstriyel gıdalarla ve fast food tarzı beslenme, fazla yeme davranışı ve yaygınlaşan kronik hastalıklarla bütün bu olguların birbirleriyle arasındaki ilişkiler değerlendirildi. Araştırmanın tartışma ve ilgili değerlendirmeler bölümünde ise fazla yeme davranışı sonucunda gelişen problemlere yönelik olarak diyet- diyet dışı ve hareketli yaşam yaklaşımları ele alınmaya çalışıldı. İslâm dininin temel kaynakları olan Kur'an ve Hadis ile Mevlâna, Gazâlî ve İbn-i Haldun gibi İslâm medeniyetinin önemli şahsiyetlerinin tüketim ve fazla yeme davranışı özelindeki yaklaşım... |
Beslenme şekilleri, insanların dinî düşünce ve kültür birikimini yansıtan önemli göstergeler arasındadır. Bireylerin nasıl beslendiğine bakarak dinî kimliği hakkında fikir yürütülebileceğinden, beslenme alışkanlıklarının dinî kimlik inşasında önemli bir rolü olduğu söylenebilir. Beslenme düzeni üzerinden bir kimlik inşa etmek gerek tarihi dinler gerekse Yeni Dinî Hareketlerin önemli bir boyutunu oluşturmaktadır. Birçok dinde oruç, kurban, dua gibi ritüeller, pratik olarak birbirine benzese de, beslenme düzenleri; coğrafya, ekonomik koşullar, kültürel etkileşimler gibi faktörlere göre farklılaşabilmekte, bütün bunlar modern çağdaki gelişmelerle birlikte dönüşebilmektedirler. Bu bağlamda yeryüzünde mensuplarının beslenme alışkanlıklarına müdahale etmeyen bir dinin olmadığını söylemek büyük bir iddia sayılmaz. Bu çalışmada beslenme ve din ilişkileri: beş Orta Doğu dini, beş Hint ve Uzak Doğu dini ve beş Yeni Dinî Hareket örnekleminde, literatür taramasının sağladığı formasyon çerçevesinde... |
Sağlık hukukunda diş hekimliği |
Türkiye'de sağlık hukuku alanında özellikle son dönemde birçok yeni eser çıkmakta ve gündem oluşturan haberler çerçevesinde sağlık çalışanlarının hakları ve yükümlülükleri sıkça tartışılmaktadır. Diş hekimliği alanında da farklı eserler olmakla birlikte bu eserlerin hukuki sorumluluk kapsamında genel olarak tüm sağlık çalışanlarını ilgilendiren genel örnekler ve konular üzerinden hareket ettiği, diş hekimliğine özel birtakım konuları ele almakta yetersiz kalabildiği görülmektedir. Kaldı ki diş hekimlerinin günlük uygulamada yaşadıkları sorunlar üzerinden özel örneklerle hukuki sorumluluk konusunda mesleki farkındalığın arttırılmasına da ihtiyaç vardır. Tıbbi cihaz ve ürünlerde, sağlık turizmi ile sağlıkta reklam, bilgilendirme ve tanıtım faaliyetlerinde yapılan düzenlemelerde sağlık hakkı ve sağlık hizmetlerine erişim hakkı çerçevesinde insan onurunu merkeze alan uygulamalardan giderek uzaklaşıldığı gözlemlenmektedir. Bu durumun, mezuniyet öncesi dönemde, çekilmiş dişlerde yapılan teda... |
Mesleki uygulamaları sırasında alınan kararlar ve yapılan müdahaleler açısından, tıbbi etik ve tıbbi deontolojinin yanısıra hukuk açısından da sorumluluklar taşıyan dişhekiminin tıbbi müdahalelerini doğrudan ya da dolaylı olarak düzenleyen birçok kanun, tüzük, yönetmelik, yönerge ve tebliğlerin sağlık mevzuatımız içinde yer almasına rağmen bunların hiç birinde dişhekiminin hukuki sorumluluğuna yer veren özel hükümler bulunmamaktadır. Genel hekimlik uygulamalarına ilişkin olarak kabul edilen ilkeler dişhekimleri açısından da geçerli olmakta, mesleki sorumluluklara aykırı davranışlar da yine genel yasal düzenlemeler çerçevesinde çözümlenmektedir.Son zamanlarda gittikçe artan bir şekilde hem kamuoyunun hem de hekim ve hukukçuların gündemini meşgul eden sağlık hukuku alanındaki gelişmelerin yanısıra; bu alanda daha çok hekimlerin hukuki sorumluluğu ele alınıp incelenmiş, dişhekimlerinin yasal sorumluluğu üzerinde pek fazla durulmamıştır.Bu tezde, dişhekimlerinin hastaları ile olan ilişkile... |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false,
"directions": [
"query_to_doc"
],
"partition_mode": "joint",
"hardness_mode": null,
"hardness_strength": 0.0
}
per_device_train_batch_size: 32per_device_eval_batch_size: 32num_train_epochs: 1fp16: Truemulti_dataset_batch_sampler: round_robindo_predict: Falseprediction_loss_only: Trueper_device_train_batch_size: 32per_device_eval_batch_size: 32gradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: Nonewarmup_ratio: Nonewarmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Trueenable_jit_checkpoint: Falsesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseuse_cpu: Falseseed: 42data_seed: Nonebf16: Falsefp16: Truebf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: -1ddp_backend: Nonedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonedisable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Nonegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Truepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_for_metrics: []eval_do_concat_batches: Trueauto_find_batch_size: Falsefull_determinism: Falseddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueuse_cache: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 0.0252 | 500 | 0.2429 |
| 0.0505 | 1000 | 0.1673 |
| 0.0757 | 1500 | 0.1605 |
| 0.1009 | 2000 | 0.1379 |
| 0.1262 | 2500 | 0.1358 |
| 0.1514 | 3000 | 0.1185 |
| 0.1767 | 3500 | 0.1139 |
| 0.2019 | 4000 | 0.1149 |
| 0.2271 | 4500 | 0.1153 |
| 0.2524 | 5000 | 0.1097 |
| 0.2776 | 5500 | 0.1056 |
| 0.3028 | 6000 | 0.1033 |
| 0.3281 | 6500 | 0.0937 |
| 0.3533 | 7000 | 0.0989 |
| 0.3786 | 7500 | 0.0916 |
| 0.4038 | 8000 | 0.0949 |
| 0.4290 | 8500 | 0.0944 |
| 0.4543 | 9000 | 0.0835 |
| 0.4795 | 9500 | 0.0889 |
| 0.5047 | 10000 | 0.0862 |
| 0.5300 | 10500 | 0.0775 |
| 0.5552 | 11000 | 0.0806 |
| 0.5805 | 11500 | 0.0811 |
| 0.6057 | 12000 | 0.0745 |
| 0.6309 | 12500 | 0.0811 |
| 0.6562 | 13000 | 0.0709 |
| 0.6814 | 13500 | 0.0742 |
| 0.7066 | 14000 | 0.0750 |
| 0.7319 | 14500 | 0.0759 |
| 0.7571 | 15000 | 0.0804 |
| 0.7824 | 15500 | 0.0658 |
| 0.8076 | 16000 | 0.0656 |
| 0.8328 | 16500 | 0.0688 |
| 0.8581 | 17000 | 0.0697 |
| 0.8833 | 17500 | 0.0681 |
| 0.9085 | 18000 | 0.0623 |
| 0.9338 | 18500 | 0.0645 |
| 0.9590 | 19000 | 0.0623 |
| 0.9843 | 19500 | 0.0619 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{oord2019representationlearningcontrastivepredictive,
title={Representation Learning with Contrastive Predictive Coding},
author={Aaron van den Oord and Yazhe Li and Oriol Vinyals},
year={2019},
eprint={1807.03748},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/1807.03748},
}