Upload 12 files

Browse files

Files changed (13) hide show

.gitattributes +2 -0
model/1_Pooling/config.json +10 -0
model/README.md +493 -0
model/config.json +25 -0
model/config_sentence_transformers.json +14 -0
model/eval/similarity_evaluation_val-sim_results.csv +11 -0
model/model.safetensors +3 -0
model/modules.json +14 -0
model/sentence_bert_config.json +4 -0
model/special_tokens_map.json +51 -0
model/tokenizer.json +3 -0
model/tokenizer_config.json +65 -0
model/unigram.json +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+model/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+model/unigram.json filter=lfs diff=lfs merge=lfs -text

model/1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "word_embedding_dimension": 384,
+    "pooling_mode_cls_token": false,
+    "pooling_mode_mean_tokens": true,
+    "pooling_mode_max_tokens": false,
+    "pooling_mode_mean_sqrt_len_tokens": false,
+    "pooling_mode_weightedmean_tokens": false,
+    "pooling_mode_lasttoken": false,
+    "include_prompt": true
+}

model/README.md ADDED Viewed

	@@ -0,0 +1,493 @@

+---
+tags:
+- sentence-transformers
+- sentence-similarity
+- feature-extraction
+- dense
+- generated_from_trainer
+- dataset_size:32
+- loss:MultipleNegativesRankingLoss
+- dataset_size:217
+- loss:CosineSimilarityLoss
+base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
+widget:
+- source_sentence: pendidikan minimal smk jurusan teknik mesin / sejenis. pengalaman
+    di bidang perawatan mesin industri makanan diutamakan. mampu melakukan perbaikan
+    dan perawatan mesin produksi. menguasai dasar kelistrikan industri dan perakitan
+    komponen mekanik sederhana. bertanggung jawab menjaga performa mesin agar produksi
+    berjalan lancar.
+  sentences:
+  - skills organizationstaf produksi 2022 2024 staf produksi working with the wider
+    development team. manage website design, content, and seo marketing, branding
+    and logo design 2022 staf pengemasan working with the wider development team.
+    manage website design, content, and seo marketing, branding and logo design saya
+    adalah lulusan sma yang anggota divisi perlengkapanwork experience pengemasan
+    produk silangeducation mengasah kedisiplinan dan tanggung jawab dalam pengelolaan
+    inventaris dan logistik, memastikan ketersediaan dan kerapian alat alat yang digunakan.
+  - ger russtaf pengadaan dengan 3 tahun pengalaman dalam negosiasi harga, pencarian
+    vendor alternatif, dan pengadaan bahan staf pengadaan 2021 2024 negosiasi harga
+    vendor comparison
+  - pendidikan kemampuan sertifikasilulusan teknik elektronika industri saya adalah
+    lulusan teknik elektronika industri dengan pengalaman 1 tahun dalam perawatan
+    mesin penggiling dan pengering di industri makanan. terbiasa melakukan inspeksi
+    rutin, mengganti komponen, dan mengatasi kerusakan ringan. jurusan teknik elektronika
+    industri perawatan preventif pemeriksaan mesin harian dasar troubleshooting penggantian
+    part mekaniksmk 2023operator produksi (2024 sekarang) helper mekanik mechanical
+    basic training 2022biodata diri
+- source_sentence: pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh
+    graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai
+    tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan
+    hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur
+    kontrol mutu bahan mentah.
+  sentences:
+  - sertifikasi keahlian pengalaman pelatihan hygiene sanitasi industri pangan 2022pendidikan
+    profil pribadi 2019 2023 universitas s1 teknologi pangan 2016 2019 jurusan ipasmafresh
+    graduateqc intern 2023 melakukan pengecekan bahan baku harian. mengisi formulir
+    inspeksi lot produksi. membantu analisis ph dan kadar air .
+  - 'skills hard skills: dasar pengoperasian mesin produksi pemahaman dasar k3 perakitan
+    mekanik sederhana kebersihan area produksi kontak soft skills: disiplin tanggung
+    jawab kerja sama tim dasar tentang mesin produksi dan proses perakitan mengikuti
+    instruksi kerja di area produksi. operator produksi magang (2023 2024) mengoperasikan
+    mesin produksi bahan baku. menjaga kebersihan area produksi. dasar pengoperasian
+    mesin produksi kebersihan area produksi'
+  - education universitas m aster of psikology2009 2013 skills hr operations bpjs
+    online vendor coordination ga management hr reporting sop hr ga contact languages
+    english arabic (basic) german (basic)mengatur kebutuhan operasional harian. menjaga
+    dokumen legal perusahaan. mengatur perawatan fasilitas kantor.
+- source_sentence: pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman
+    di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel,
+    word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku,
+    hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi,
+    quality control, dan warehouse.
+  sentences:
+  - work experience 2023 2024staf warehouse menerima barang masuk dan memeriksa kondisinya.
+    menyusun barang sesuai kategori bahan. melakukan cek stok mingguan. membantu membuat
+    laporan ke supervisor warehouse. education sma lulus 2021skills fifo fefo dasar
+    pencatatan stok harian penyusunan pallet rak pengecekan barang rusak bantuan loading/unloadingcertifications
+    warehouse safety basic 20232021 2023helper warehouse membantu bongkar muat barang.
+    menata barang agar mudah diambil. mencatat barang habis untuk restock. membersihkan
+    area warehouse rutin.
+  - pengalaman kerja admin warehouse produksi (maret 2024 januari 2025) menjalankan
+    peran ganda (dual role) sebagai admin warehouse dan produksi, mencakup pelaksanaan
+    stock opname bulanan dan pencatatan akurat consumption rate bahan baku . admin
+    produksi (juli 2023 maret 2024) bertanggung jawab atas tracking inventory bahan
+    baku seafood menggunakan sistem fifo, pencatatan reject rate produk (dengan target
+    di bawah 1.5%), penyusunan laporan produksi harian skala 15 20 ton, serta berkoordinasi
+    dengan cold storage untuk manajemen stok. pendidikan politeknik manufaktur astra
+    (2022) s1 manajemen keterampilan hard skills menguasai microsoft excel (termasuk
+    pivot tables dan formulas), sistem inventory fifo/fefo, production reporting,
+    dan praktik cold chain management yang krusial untuk industri. soft skills memiliki
+    kemampuan bilingual yang mendukung komunikasi e...
+  - jurusan teknik mesin.pendidikan sanitasi hygiene pengemasan penyortiran bahan
+    laporan hariankeahlian mengoperasikan mesin pengering. mengawasi kualitas proses.
+    melaporkan data produksi.operator produksi (januari 2021 maret 2024)pengalaman
+    kerja membantu pemeriksaan mutu. pencatatan hasil pemeriksaan.quality control
+    helper (juli 2020 januari 2021)
+- source_sentence: pendidikan minimal d3/s1 teknologi pangan / terkait. pengalaman
+    sebagai analis mutu diutamakan. mampu melakukan uji kadar air, kadar garam, ph,
+    warna, dan aroma produk. menguasai teknik uji laboratorium sederhana seperti titrasi
+    dan uji organoleptik. mampu bekerja sama dengan tim quality control dan produksi
+    untuk pengendalian mutu.
+  sentences:
+  - mengatur stok bahan.hard skills penyortiran bahan pengemasan produk kebersihan
+    area produksi pencatatan hasil kerja sederhana pengoperasian alat manual soft
+    skills disiplin kerja tim tanggung jawabprofil lulusan sma yang disiplin, teliti,
+    dan mampu bekerja mengikuti prosedur produksi makanan. berpengalaman magang di
+    industri kecil, terbiasa melakukan penyortiran bahan dan membantu proses produksi.sma
+    jurusan ipa 2020 2023
+  - pendidikan kemampuan sertifikatsaya adalah quality control analyst dengan pengalaman
+    10 bulan di industri makanan. terampil melakukan pengujian fisik dan kimia bahan
+    baku, memastikan standar mutu terpenuhi, serta bekerja di lingkungan produksi
+    dengan bau kuat. jurusan kimia analisis kimia pangan gmp, haccp dasar sampling
+    inspection pengujian laboratorium universitas 2023quality control staff (2023
+    2024) melakukan uji ph, kadar garam, dan kadar air. memastikan kebersihan area
+    produksi mengikuti gmp. project quality control improvement 2021 menganalisis
+    faktor penyebab ketidakstabilan mutu pada produk pangan.
+  - skills pemeriksaan verifikasi form quality control penyusunan laporan mutu berkala
+    persiapan audit internal eksternal uji kadar air/garam/ph/organoleptik penerapan
+    gmp dan dasar qa languages english (fluent) german (basic) french (fluent) w ork
+    experience 2019 2024 senior quality analyst mengawasi konsistensi hasil uji yang
+    dilakukan oleh tim analis junior. memeriksa kelengkapan dokumen mutu sebelum audit.
+    membantu qa dalam investigasi penyebab komplain mutu. memberikan masukan perbaikan
+    form dan prosedur quality control. 2016 2019 quality control analyst melakukan
+    uji rutin kadar air, kadar garam, dan ph. menguji warna dan aroma produk terasi.
+    mengarsipkan hasil uji sesuai sistem penyimpanan dokumen. mendukung audit internal
+    dengan menyiapkan dokumen terkait mutu. 2014 2016 quality control junior mengambil
+    sampel bahan baku dan produk jadi. menguji parameter mutu sederhana. education
+    2010...
+- source_sentence: pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman
+    di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel,
+    word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku,
+    hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi,
+    quality control, dan warehouse.
+  sentences:
+  - pendidikan s1 manajemen ipk 3, 20 universitas 2019 2023 ips 82,25 sma 2016 2019
+    hard skills mahir dalam forecasting dan analisis penjualan, serta memiliki keahlian
+    teknis dalam distributor management dan penyusunan strategi distribusi untuk efisiensi
+    pasar. soft skills unggul dalam presentasi dan komunikasi yang persuasif, didukung
+    oleh pemahaman mendalam (understanding) terhadap market behavior untuk pengambilan
+    keputusan strategis. bahasa bahasa indonesia, bahasa inggris , mandarin ketertarikan
+    mendalami studi mengenai supply chain management dan logistik distribusi untuk
+    mengoptimalkan ketersediaan stok, serta mengikuti tren analisis perilaku konsumen
+    (market behavior) di sektor fmcg.
+  - saya adalah seorang f resh graduate dengan pendidikan s1 administrasi perkantoran
+    . saya m emiliki pengalaman magang di pabrik makanan selama 6 bulan sebagai admin
+    produksi . saya merupakan pribadi yang c epat belajar dan teliti dalam pencatatan
+    data . pengalaman admin produksi (juli 2023 januari 2024) asistensi dalam pencatatan
+    data produksi harian . membantu membuat laporan inventory bahan baku . menginput
+    data kedalam sistem sap . membuat laporan reject produksi mingguan . pendidikan
+    universitas (2024) s1 administrasi perkantoran. smk (2020) otomatisasi dan tata
+    kelola perkantoran (otkp) . keterampilan microsoft office (word, excel, powerpoint)
+    google workspace typing 60 wpm administrasi perkantoran inventory management bahasa
+    bahasa indonesia (native), bahasa inggris (profesional) . sertifikasi microsoft
+    excel, word,...
+  - organisasi 2019 2020pendidikan universitas s1 teknologi pangan 2018 2022 sma jurusan
+    ipa 2015 2018 keahlian kemampuan memecahkan masalah dengan cepat dan tepat kemampuan
+    perencanaan yang mendekati aktual.pengalaman quality control incoming material
+pipeline_tag: sentence-similarity
+library_name: sentence-transformers
+metrics:
+- pearson_cosine
+- spearman_cosine
+model-index:
+- name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
+  results:
+  - task:
+      type: semantic-similarity
+      name: Semantic Similarity
+    dataset:
+      name: val sim
+      type: val-sim
+    metrics:
+    - type: pearson_cosine
+      value: 0.7867461289558618
+      name: Pearson Cosine
+    - type: spearman_cosine
+      value: 0.8582430324404178
+      name: Spearman Cosine
+---
+# SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
+This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
+## Model Details
+### Model Description
+- **Model Type:** Sentence Transformer
+- **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
+- **Maximum Sequence Length:** 128 tokens
+- **Output Dimensionality:** 384 dimensions
+- **Similarity Function:** Cosine Similarity
+<!-- - **Training Dataset:** Unknown -->
+<!-- - **Language:** Unknown -->
+<!-- - **License:** Unknown -->
+### Model Sources
+- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
+- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
+- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
+### Full Model Architecture
+```
+SentenceTransformer(
+  (0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
+  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
+)
+```
+## Usage
+### Direct Usage (Sentence Transformers)
+First install the Sentence Transformers library:
+```bash
+pip install -U sentence-transformers
+```
+Then you can load this model and run inference.
+```python
+from sentence_transformers import SentenceTransformer
+# Download from the 🤗 Hub
+model = SentenceTransformer("sentence_transformers_model_id")
+# Run inference
+sentences = [
+    'pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel, word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku, hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi, quality control, dan warehouse.',
+    'saya adalah seorang f resh graduate dengan pendidikan s1 administrasi perkantoran . saya m emiliki pengalaman magang di pabrik makanan selama 6 bulan sebagai admin produksi . saya merupakan pribadi yang c epat belajar dan teliti dalam pencatatan data . pengalaman admin produksi (juli 2023 januari 2024) asistensi dalam pencatatan data produksi harian . membantu membuat laporan inventory bahan baku . menginput data kedalam sistem sap . membuat laporan reject produksi mingguan . pendidikan universitas (2024) s1 administrasi perkantoran. smk (2020) otomatisasi dan tata kelola perkantoran (otkp) . keterampilan microsoft office (word, excel, powerpoint) google workspace typing 60 wpm administrasi perkantoran inventory management bahasa bahasa indonesia (native), bahasa inggris (profesional) . sertifikasi microsoft excel, word,...',
+    'organisasi 2019 2020pendidikan universitas s1 teknologi pangan 2018 2022 sma jurusan ipa 2015 2018 keahlian kemampuan memecahkan masalah dengan cepat dan tepat kemampuan perencanaan yang mendekati aktual.pengalaman quality control incoming material',
+]
+embeddings = model.encode(sentences)
+print(embeddings.shape)
+# [3, 384]
+# Get the similarity scores for the embeddings
+similarities = model.similarity(embeddings, embeddings)
+print(similarities)
+# tensor([[1.0000, 0.6263, 0.2981],
+#         [0.6263, 1.0000, 0.4317],
+#         [0.2981, 0.4317, 1.0000]])
+```
+<!--
+### Direct Usage (Transformers)
+<details><summary>Click to see the direct usage in Transformers</summary>
+</details>
+-->
+<!--
+### Downstream Usage (Sentence Transformers)
+You can finetune this model on your own dataset.
+<details><summary>Click to expand</summary>
+</details>
+-->
+<!--
+### Out-of-Scope Use
+*List how the model may foreseeably be misused and address what users ought not to do with the model.*
+-->
+## Evaluation
+### Metrics
+#### Semantic Similarity
+* Dataset: `val-sim`
+* Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
+| Metric              | Value      |
+|:--------------------|:-----------|
+| pearson_cosine      | 0.7867     |
+| **spearman_cosine** | **0.8582** |
+<!--
+## Bias, Risks and Limitations
+*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
+-->
+<!--
+### Recommendations
+*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
+-->
+## Training Details
+### Training Dataset
+#### Unnamed Dataset
+* Size: 217 training samples
+* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
+* Approximate statistics based on the first 217 samples:
+  |         | sentence_0                                                                        | sentence_1                                                                           | label                                                           |
+  |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------|
+  | type    | string                                                                            | string                                                                               | float                                                           |
+  | details | <ul><li>min: 55 tokens</li><li>mean: 65.8 tokens</li><li>max: 75 tokens</li></ul> | <ul><li>min: 38 tokens</li><li>mean: 104.02 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 0.01</li><li>mean: 0.34</li><li>max: 1.0</li></ul> |
+* Samples:
+  | sentence_0                                                                                                                                                                                                                                                                                                                                                            | sentence_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | label                           |
+  |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
+  | <code>pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur kontrol mutu bahan mentah.</code> | <code>pengalaman kerja 2024 teknisi listrik (magang) mengecek sambungan kabel dan panel ringan. membersihkan box panel terminal listrik. mengukur voltase menggunakan multitester. mendukung teknisi senior saat perbaikan mesin produksi. 2023 helper produksi mengecek stop kontak peralatan listrik kecil. memastikan ar ea produksi aman dari hubungan pendek. melakukan pembersihan alat pasca produksi. memindahkan peralatan produksi sesuai permintaan. pendidikan smk 2021 2024 smk teknik elektro nilai: 82,25 anggota osis divisi logistik keterampilan wiring dasar instalasi kontrol sederhana pemeliharaan motor listrik penggunaan multitester keselamatan kerja listrik fresh graduate</code>                                                                                                                                                                                                                                          | <code>0.3466162618930005</code> |
+  | <code>pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur kontrol mutu bahan mentah.</code> | <code>skills analis mutu dengan 5 tahun pengalaman mengelola panel uji organoleptik, baik internal maupun eksternal, untuk produk makanan fermentasi dan bumbu. mampu merancang form penilaian sederhana, mengkoordinasi panelis, serta menganalisis data penilaian sensori untuk mendukung keputusan mutu. memiliki sensitivitas tinggi terhadap perubahan rasa, aroma, dan warna produk. uji organoleptik (rasa, aroma, warna, tekstur) penyusunan form penilaian panel education mengelola sesi uji organoleptik untuk produk baru dan existing. menilai konsistensi rasa dan aroma batch ke batch. mengolah data penilaian panel menjadi laporan sederhana. berkoordinasi dengan r d untuk perbaikan formulasi. melakukan uji kadar air, kadar garam, dan ph. menguji warna dan tekstur produk jadi. menyusun laporan uji harian dan mingguan. membantu uji kecil organoleptik internal. ...</code>                                                | <code>0.3949887113923309</code> |
+  | <code>pendidikan minimal sma/smk sederajat. pengalaman sebagai staf warehouse di industri makanan diutamakan. menguasai pencatatan stok menggunakan microsoft excel. teliti dan memahami sistem penyimpanan bahan pangan (fifo/fefo). bertanggung jawab terhadap laporan stok harian dan stok opname berkala.</code>                                                  | <code>skills pemeriksaan verifikasi form quality control penyusunan laporan mutu berkala persiapan audit internal eksternal uji kadar air/garam/ph/organoleptik penerapan gmp dan dasar qa languages english (fluent) german (basic) french (fluent) w ork experience 2019 2024 senior quality analyst mengawasi konsistensi hasil uji yang dilakukan oleh tim analis junior. memeriksa kelengkapan dokumen mutu sebelum audit. membantu qa dalam investigasi penyebab komplain mutu. memberikan masukan perbaikan form dan prosedur quality control. 2016 2019 quality control analyst melakukan uji rutin kadar air, kadar garam, dan ph. menguji warna dan aroma produk terasi. mengarsipkan hasil uji sesuai sistem penyimpanan dokumen. mendukung audit internal dengan menyiapkan dokumen terkait mutu. 2014 2016 quality control junior mengambil sampel bahan baku dan produk jadi. menguji parameter mutu sederhana. education 2010...</code> | <code>0.0431926040368358</code> |
+* Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
+  ```json
+  {
+      "loss_fct": "torch.nn.modules.loss.MSELoss"
+  }
+  ```
+### Training Hyperparameters
+#### Non-Default Hyperparameters
+- `eval_strategy`: steps
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `num_train_epochs`: 10
+- `multi_dataset_batch_sampler`: round_robin
+#### All Hyperparameters
+<details><summary>Click to expand</summary>
+- `overwrite_output_dir`: False
+- `do_predict`: False
+- `eval_strategy`: steps
+- `prediction_loss_only`: True
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `per_gpu_train_batch_size`: None
+- `per_gpu_eval_batch_size`: None
+- `gradient_accumulation_steps`: 1
+- `eval_accumulation_steps`: None
+- `torch_empty_cache_steps`: None
+- `learning_rate`: 5e-05
+- `weight_decay`: 0.0
+- `adam_beta1`: 0.9
+- `adam_beta2`: 0.999
+- `adam_epsilon`: 1e-08
+- `max_grad_norm`: 1
+- `num_train_epochs`: 10
+- `max_steps`: -1
+- `lr_scheduler_type`: linear
+- `lr_scheduler_kwargs`: {}
+- `warmup_ratio`: 0.0
+- `warmup_steps`: 0
+- `log_level`: passive
+- `log_level_replica`: warning
+- `log_on_each_node`: True
+- `logging_nan_inf_filter`: True
+- `save_safetensors`: True
+- `save_on_each_node`: False
+- `save_only_model`: False
+- `restore_callback_states_from_checkpoint`: False
+- `no_cuda`: False
+- `use_cpu`: False
+- `use_mps_device`: False
+- `seed`: 42
+- `data_seed`: None
+- `jit_mode_eval`: False
+- `bf16`: False
+- `fp16`: False
+- `fp16_opt_level`: O1
+- `half_precision_backend`: auto
+- `bf16_full_eval`: False
+- `fp16_full_eval`: False
+- `tf32`: None
+- `local_rank`: 0
+- `ddp_backend`: None
+- `tpu_num_cores`: None
+- `tpu_metrics_debug`: False
+- `debug`: []
+- `dataloader_drop_last`: False
+- `dataloader_num_workers`: 0
+- `dataloader_prefetch_factor`: None
+- `past_index`: -1
+- `disable_tqdm`: False
+- `remove_unused_columns`: True
+- `label_names`: None
+- `load_best_model_at_end`: False
+- `ignore_data_skip`: False
+- `fsdp`: []
+- `fsdp_min_num_params`: 0
+- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
+- `fsdp_transformer_layer_cls_to_wrap`: None
+- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
+- `parallelism_config`: None
+- `deepspeed`: None
+- `label_smoothing_factor`: 0.0
+- `optim`: adamw_torch_fused
+- `optim_args`: None
+- `adafactor`: False
+- `group_by_length`: False
+- `length_column_name`: length
+- `project`: huggingface
+- `trackio_space_id`: trackio
+- `ddp_find_unused_parameters`: None
+- `ddp_bucket_cap_mb`: None
+- `ddp_broadcast_buffers`: False
+- `dataloader_pin_memory`: True
+- `dataloader_persistent_workers`: False
+- `skip_memory_metrics`: True
+- `use_legacy_prediction_loop`: False
+- `push_to_hub`: False
+- `resume_from_checkpoint`: None
+- `hub_model_id`: None
+- `hub_strategy`: every_save
+- `hub_private_repo`: None
+- `hub_always_push`: False
+- `hub_revision`: None
+- `gradient_checkpointing`: False
+- `gradient_checkpointing_kwargs`: None
+- `include_inputs_for_metrics`: False
+- `include_for_metrics`: []
+- `eval_do_concat_batches`: True
+- `fp16_backend`: auto
+- `push_to_hub_model_id`: None
+- `push_to_hub_organization`: None
+- `mp_parameters`:
+- `auto_find_batch_size`: False
+- `full_determinism`: False
+- `torchdynamo`: None
+- `ray_scope`: last
+- `ddp_timeout`: 1800
+- `torch_compile`: False
+- `torch_compile_backend`: None
+- `torch_compile_mode`: None
+- `include_tokens_per_second`: False
+- `include_num_input_tokens_seen`: no
+- `neftune_noise_alpha`: None
+- `optim_target_modules`: None
+- `batch_eval_metrics`: False
+- `eval_on_start`: False
+- `use_liger_kernel`: False
+- `liger_kernel_config`: None
+- `eval_use_gather_object`: False
+- `average_tokens_across_devices`: True
+- `prompts`: None
+- `batch_sampler`: batch_sampler
+- `multi_dataset_batch_sampler`: round_robin
+- `router_mapping`: {}
+- `learning_rate_mapping`: {}
+</details>
+### Training Logs
+| Epoch | Step | val-sim_spearman_cosine |
+|:-----:|:----:|:-----------------------:|
+| 0.5   | 7    | 0.8582                  |
+### Framework Versions
+- Python: 3.12.12
+- Sentence Transformers: 5.2.0
+- Transformers: 4.57.3
+- PyTorch: 2.9.0+cpu
+- Accelerate: 1.12.0
+- Datasets: 4.0.0
+- Tokenizers: 0.22.1
+## Citation
+### BibTeX
+#### Sentence Transformers
+```bibtex
+@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}
+```
+<!--
+## Glossary
+*Clearly define terms in order to be accessible across audiences.*
+-->
+<!--
+## Model Card Authors
+*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
+-->
+<!--
+## Model Card Contact
+*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
+-->

model/config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 384,
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 250037
+}

model/config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "__version__": {
+    "sentence_transformers": "5.2.0",
+    "transformers": "4.57.3",
+    "pytorch": "2.9.0+cpu"
+  },
+  "model_type": "SentenceTransformer",
+  "prompts": {
+    "query": "",
+    "document": ""
+  },
+  "default_prompt_name": null,
+  "similarity_fn_name": "cosine"
+}

model/eval/similarity_evaluation_val-sim_results.csv ADDED Viewed

	@@ -0,0 +1,11 @@

+epoch,steps,cosine_pearson,cosine_spearman
+1.0,14,0.793999598948865,0.8457293271210397
+2.0,28,0.7814103024451452,0.8139111092192509
+3.0,42,0.8212675683006192,0.8477282340976581
+4.0,56,0.8145585233770605,0.8277117820441231
+5.0,70,0.8193231187897223,0.8335715915372236
+6.0,84,0.8269653809692382,0.8418136600298557
+7.0,98,0.8299710836665999,0.840800515397871
+8.0,112,0.8327720299720598,0.8468246186150771
+9.0,126,0.832600611299027,0.8471532060632885
+10.0,140,0.8326496835248816,0.8471532060632885

model/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d1a3fa52d941ab7315580ef36c0ca8209b77d2b099a2fd37f7016723be93edb3
+size 470637416

model/modules.json ADDED Viewed

	@@ -0,0 +1,14 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.models.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.models.Pooling"
+  }
+]

model/sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+    "max_seq_length": 128,
+    "do_lower_case": false
+}

model/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

model/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
+size 17082987

model/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "<s>",
+  "do_lower_case": true,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "max_length": 128,
+  "model_max_length": 128,
+  "pad_to_multiple_of": null,
+  "pad_token": "<pad>",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "sep_token": "</s>",
+  "stride": 0,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "<unk>"
+}

model/unigram.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
+size 14763260