lilcoderi commited on
Commit
0a404dd
·
verified ·
1 Parent(s): 60b622c

Upload 12 files

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ model/tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ model/unigram.json filter=lfs diff=lfs merge=lfs -text
model/1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
model/README.md ADDED
@@ -0,0 +1,493 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:32
9
+ - loss:MultipleNegativesRankingLoss
10
+ - dataset_size:217
11
+ - loss:CosineSimilarityLoss
12
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
13
+ widget:
14
+ - source_sentence: pendidikan minimal smk jurusan teknik mesin / sejenis. pengalaman
15
+ di bidang perawatan mesin industri makanan diutamakan. mampu melakukan perbaikan
16
+ dan perawatan mesin produksi. menguasai dasar kelistrikan industri dan perakitan
17
+ komponen mekanik sederhana. bertanggung jawab menjaga performa mesin agar produksi
18
+ berjalan lancar.
19
+ sentences:
20
+ - skills organizationstaf produksi 2022 2024 staf produksi working with the wider
21
+ development team. manage website design, content, and seo marketing, branding
22
+ and logo design 2022 staf pengemasan working with the wider development team.
23
+ manage website design, content, and seo marketing, branding and logo design saya
24
+ adalah lulusan sma yang anggota divisi perlengkapanwork experience pengemasan
25
+ produk silangeducation mengasah kedisiplinan dan tanggung jawab dalam pengelolaan
26
+ inventaris dan logistik, memastikan ketersediaan dan kerapian alat alat yang digunakan.
27
+ - ger russtaf pengadaan dengan 3 tahun pengalaman dalam negosiasi harga, pencarian
28
+ vendor alternatif, dan pengadaan bahan staf pengadaan 2021 2024 negosiasi harga
29
+ vendor comparison
30
+ - pendidikan kemampuan sertifikasilulusan teknik elektronika industri saya adalah
31
+ lulusan teknik elektronika industri dengan pengalaman 1 tahun dalam perawatan
32
+ mesin penggiling dan pengering di industri makanan. terbiasa melakukan inspeksi
33
+ rutin, mengganti komponen, dan mengatasi kerusakan ringan. jurusan teknik elektronika
34
+ industri perawatan preventif pemeriksaan mesin harian dasar troubleshooting penggantian
35
+ part mekaniksmk 2023operator produksi (2024 sekarang) helper mekanik mechanical
36
+ basic training 2022biodata diri
37
+ - source_sentence: pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh
38
+ graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai
39
+ tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan
40
+ hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur
41
+ kontrol mutu bahan mentah.
42
+ sentences:
43
+ - sertifikasi keahlian pengalaman pelatihan hygiene sanitasi industri pangan 2022pendidikan
44
+ profil pribadi 2019 2023 universitas s1 teknologi pangan 2016 2019 jurusan ipasmafresh
45
+ graduateqc intern 2023 melakukan pengecekan bahan baku harian. mengisi formulir
46
+ inspeksi lot produksi. membantu analisis ph dan kadar air .
47
+ - 'skills hard skills: dasar pengoperasian mesin produksi pemahaman dasar k3 perakitan
48
+ mekanik sederhana kebersihan area produksi kontak soft skills: disiplin tanggung
49
+ jawab kerja sama tim dasar tentang mesin produksi dan proses perakitan mengikuti
50
+ instruksi kerja di area produksi. operator produksi magang (2023 2024) mengoperasikan
51
+ mesin produksi bahan baku. menjaga kebersihan area produksi. dasar pengoperasian
52
+ mesin produksi kebersihan area produksi'
53
+ - education universitas m aster of psikology2009 2013 skills hr operations bpjs
54
+ online vendor coordination ga management hr reporting sop hr ga contact languages
55
+ english arabic (basic) german (basic)mengatur kebutuhan operasional harian. menjaga
56
+ dokumen legal perusahaan. mengatur perawatan fasilitas kantor.
57
+ - source_sentence: pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman
58
+ di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel,
59
+ word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku,
60
+ hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi,
61
+ quality control, dan warehouse.
62
+ sentences:
63
+ - work experience 2023 2024staf warehouse menerima barang masuk dan memeriksa kondisinya.
64
+ menyusun barang sesuai kategori bahan. melakukan cek stok mingguan. membantu membuat
65
+ laporan ke supervisor warehouse. education sma lulus 2021skills fifo fefo dasar
66
+ pencatatan stok harian penyusunan pallet rak pengecekan barang rusak bantuan loading/unloadingcertifications
67
+ warehouse safety basic 20232021 2023helper warehouse membantu bongkar muat barang.
68
+ menata barang agar mudah diambil. mencatat barang habis untuk restock. membersihkan
69
+ area warehouse rutin.
70
+ - pengalaman kerja admin warehouse produksi (maret 2024 januari 2025) menjalankan
71
+ peran ganda (dual role) sebagai admin warehouse dan produksi, mencakup pelaksanaan
72
+ stock opname bulanan dan pencatatan akurat consumption rate bahan baku . admin
73
+ produksi (juli 2023 maret 2024) bertanggung jawab atas tracking inventory bahan
74
+ baku seafood menggunakan sistem fifo, pencatatan reject rate produk (dengan target
75
+ di bawah 1.5%), penyusunan laporan produksi harian skala 15 20 ton, serta berkoordinasi
76
+ dengan cold storage untuk manajemen stok. pendidikan politeknik manufaktur astra
77
+ (2022) s1 manajemen keterampilan hard skills menguasai microsoft excel (termasuk
78
+ pivot tables dan formulas), sistem inventory fifo/fefo, production reporting,
79
+ dan praktik cold chain management yang krusial untuk industri. soft skills memiliki
80
+ kemampuan bilingual yang mendukung komunikasi e...
81
+ - jurusan teknik mesin.pendidikan sanitasi hygiene pengemasan penyortiran bahan
82
+ laporan hariankeahlian mengoperasikan mesin pengering. mengawasi kualitas proses.
83
+ melaporkan data produksi.operator produksi (januari 2021 maret 2024)pengalaman
84
+ kerja membantu pemeriksaan mutu. pencatatan hasil pemeriksaan.quality control
85
+ helper (juli 2020 januari 2021)
86
+ - source_sentence: pendidikan minimal d3/s1 teknologi pangan / terkait. pengalaman
87
+ sebagai analis mutu diutamakan. mampu melakukan uji kadar air, kadar garam, ph,
88
+ warna, dan aroma produk. menguasai teknik uji laboratorium sederhana seperti titrasi
89
+ dan uji organoleptik. mampu bekerja sama dengan tim quality control dan produksi
90
+ untuk pengendalian mutu.
91
+ sentences:
92
+ - mengatur stok bahan.hard skills penyortiran bahan pengemasan produk kebersihan
93
+ area produksi pencatatan hasil kerja sederhana pengoperasian alat manual soft
94
+ skills disiplin kerja tim tanggung jawabprofil lulusan sma yang disiplin, teliti,
95
+ dan mampu bekerja mengikuti prosedur produksi makanan. berpengalaman magang di
96
+ industri kecil, terbiasa melakukan penyortiran bahan dan membantu proses produksi.sma
97
+ jurusan ipa 2020 2023
98
+ - pendidikan kemampuan sertifikatsaya adalah quality control analyst dengan pengalaman
99
+ 10 bulan di industri makanan. terampil melakukan pengujian fisik dan kimia bahan
100
+ baku, memastikan standar mutu terpenuhi, serta bekerja di lingkungan produksi
101
+ dengan bau kuat. jurusan kimia analisis kimia pangan gmp, haccp dasar sampling
102
+ inspection pengujian laboratorium universitas 2023quality control staff (2023
103
+ 2024) melakukan uji ph, kadar garam, dan kadar air. memastikan kebersihan area
104
+ produksi mengikuti gmp. project quality control improvement 2021 menganalisis
105
+ faktor penyebab ketidakstabilan mutu pada produk pangan.
106
+ - skills pemeriksaan verifikasi form quality control penyusunan laporan mutu berkala
107
+ persiapan audit internal eksternal uji kadar air/garam/ph/organoleptik penerapan
108
+ gmp dan dasar qa languages english (fluent) german (basic) french (fluent) w ork
109
+ experience 2019 2024 senior quality analyst mengawasi konsistensi hasil uji yang
110
+ dilakukan oleh tim analis junior. memeriksa kelengkapan dokumen mutu sebelum audit.
111
+ membantu qa dalam investigasi penyebab komplain mutu. memberikan masukan perbaikan
112
+ form dan prosedur quality control. 2016 2019 quality control analyst melakukan
113
+ uji rutin kadar air, kadar garam, dan ph. menguji warna dan aroma produk terasi.
114
+ mengarsipkan hasil uji sesuai sistem penyimpanan dokumen. mendukung audit internal
115
+ dengan menyiapkan dokumen terkait mutu. 2014 2016 quality control junior mengambil
116
+ sampel bahan baku dan produk jadi. menguji parameter mutu sederhana. education
117
+ 2010...
118
+ - source_sentence: pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman
119
+ di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel,
120
+ word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku,
121
+ hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi,
122
+ quality control, dan warehouse.
123
+ sentences:
124
+ - pendidikan s1 manajemen ipk 3, 20 universitas 2019 2023 ips 82,25 sma 2016 2019
125
+ hard skills mahir dalam forecasting dan analisis penjualan, serta memiliki keahlian
126
+ teknis dalam distributor management dan penyusunan strategi distribusi untuk efisiensi
127
+ pasar. soft skills unggul dalam presentasi dan komunikasi yang persuasif, didukung
128
+ oleh pemahaman mendalam (understanding) terhadap market behavior untuk pengambilan
129
+ keputusan strategis. bahasa bahasa indonesia, bahasa inggris , mandarin ketertarikan
130
+ mendalami studi mengenai supply chain management dan logistik distribusi untuk
131
+ mengoptimalkan ketersediaan stok, serta mengikuti tren analisis perilaku konsumen
132
+ (market behavior) di sektor fmcg.
133
+ - saya adalah seorang f resh graduate dengan pendidikan s1 administrasi perkantoran
134
+ . saya m emiliki pengalaman magang di pabrik makanan selama 6 bulan sebagai admin
135
+ produksi . saya merupakan pribadi yang c epat belajar dan teliti dalam pencatatan
136
+ data . pengalaman admin produksi (juli 2023 januari 2024) asistensi dalam pencatatan
137
+ data produksi harian . membantu membuat laporan inventory bahan baku . menginput
138
+ data kedalam sistem sap . membuat laporan reject produksi mingguan . pendidikan
139
+ universitas (2024) s1 administrasi perkantoran. smk (2020) otomatisasi dan tata
140
+ kelola perkantoran (otkp) . keterampilan microsoft office (word, excel, powerpoint)
141
+ google workspace typing 60 wpm administrasi perkantoran inventory management bahasa
142
+ bahasa indonesia (native), bahasa inggris (profesional) . sertifikasi microsoft
143
+ excel, word,...
144
+ - organisasi 2019 2020pendidikan universitas s1 teknologi pangan 2018 2022 sma jurusan
145
+ ipa 2015 2018 keahlian kemampuan memecahkan masalah dengan cepat dan tepat kemampuan
146
+ perencanaan yang mendekati aktual.pengalaman quality control incoming material
147
+ pipeline_tag: sentence-similarity
148
+ library_name: sentence-transformers
149
+ metrics:
150
+ - pearson_cosine
151
+ - spearman_cosine
152
+ model-index:
153
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
154
+ results:
155
+ - task:
156
+ type: semantic-similarity
157
+ name: Semantic Similarity
158
+ dataset:
159
+ name: val sim
160
+ type: val-sim
161
+ metrics:
162
+ - type: pearson_cosine
163
+ value: 0.7867461289558618
164
+ name: Pearson Cosine
165
+ - type: spearman_cosine
166
+ value: 0.8582430324404178
167
+ name: Spearman Cosine
168
+ ---
169
+
170
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
171
+
172
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
173
+
174
+ ## Model Details
175
+
176
+ ### Model Description
177
+ - **Model Type:** Sentence Transformer
178
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
179
+ - **Maximum Sequence Length:** 128 tokens
180
+ - **Output Dimensionality:** 384 dimensions
181
+ - **Similarity Function:** Cosine Similarity
182
+ <!-- - **Training Dataset:** Unknown -->
183
+ <!-- - **Language:** Unknown -->
184
+ <!-- - **License:** Unknown -->
185
+
186
+ ### Model Sources
187
+
188
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
189
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
190
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
191
+
192
+ ### Full Model Architecture
193
+
194
+ ```
195
+ SentenceTransformer(
196
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
197
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
198
+ )
199
+ ```
200
+
201
+ ## Usage
202
+
203
+ ### Direct Usage (Sentence Transformers)
204
+
205
+ First install the Sentence Transformers library:
206
+
207
+ ```bash
208
+ pip install -U sentence-transformers
209
+ ```
210
+
211
+ Then you can load this model and run inference.
212
+ ```python
213
+ from sentence_transformers import SentenceTransformer
214
+
215
+ # Download from the 🤗 Hub
216
+ model = SentenceTransformer("sentence_transformers_model_id")
217
+ # Run inference
218
+ sentences = [
219
+ 'pendidikan minimal d3 administrasi, manajemen / terkait. pengalaman di bidang administrasi pabrik diutamakan. mampu mengoperasikan microsoft excel, word, dan software pelaporan produksi. teliti dalam pencatatan data bahan baku, hasil produksi, dan efisiensi kerja. mampu berkoordinasi dengan bagian produksi, quality control, dan warehouse.',
220
+ 'saya adalah seorang f resh graduate dengan pendidikan s1 administrasi perkantoran . saya m emiliki pengalaman magang di pabrik makanan selama 6 bulan sebagai admin produksi . saya merupakan pribadi yang c epat belajar dan teliti dalam pencatatan data . pengalaman admin produksi (juli 2023 januari 2024) asistensi dalam pencatatan data produksi harian . membantu membuat laporan inventory bahan baku . menginput data kedalam sistem sap . membuat laporan reject produksi mingguan . pendidikan universitas (2024) s1 administrasi perkantoran. smk (2020) otomatisasi dan tata kelola perkantoran (otkp) . keterampilan microsoft office (word, excel, powerpoint) google workspace typing 60 wpm administrasi perkantoran inventory management bahasa bahasa indonesia (native), bahasa inggris (profesional) . sertifikasi microsoft excel, word,...',
221
+ 'organisasi 2019 2020pendidikan universitas s1 teknologi pangan 2018 2022 sma jurusan ipa 2015 2018 keahlian kemampuan memecahkan masalah dengan cepat dan tepat kemampuan perencanaan yang mendekati aktual.pengalaman quality control incoming material',
222
+ ]
223
+ embeddings = model.encode(sentences)
224
+ print(embeddings.shape)
225
+ # [3, 384]
226
+
227
+ # Get the similarity scores for the embeddings
228
+ similarities = model.similarity(embeddings, embeddings)
229
+ print(similarities)
230
+ # tensor([[1.0000, 0.6263, 0.2981],
231
+ # [0.6263, 1.0000, 0.4317],
232
+ # [0.2981, 0.4317, 1.0000]])
233
+ ```
234
+
235
+ <!--
236
+ ### Direct Usage (Transformers)
237
+
238
+ <details><summary>Click to see the direct usage in Transformers</summary>
239
+
240
+ </details>
241
+ -->
242
+
243
+ <!--
244
+ ### Downstream Usage (Sentence Transformers)
245
+
246
+ You can finetune this model on your own dataset.
247
+
248
+ <details><summary>Click to expand</summary>
249
+
250
+ </details>
251
+ -->
252
+
253
+ <!--
254
+ ### Out-of-Scope Use
255
+
256
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
257
+ -->
258
+
259
+ ## Evaluation
260
+
261
+ ### Metrics
262
+
263
+ #### Semantic Similarity
264
+
265
+ * Dataset: `val-sim`
266
+ * Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
267
+
268
+ | Metric | Value |
269
+ |:--------------------|:-----------|
270
+ | pearson_cosine | 0.7867 |
271
+ | **spearman_cosine** | **0.8582** |
272
+
273
+ <!--
274
+ ## Bias, Risks and Limitations
275
+
276
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
277
+ -->
278
+
279
+ <!--
280
+ ### Recommendations
281
+
282
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
283
+ -->
284
+
285
+ ## Training Details
286
+
287
+ ### Training Dataset
288
+
289
+ #### Unnamed Dataset
290
+
291
+ * Size: 217 training samples
292
+ * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
293
+ * Approximate statistics based on the first 217 samples:
294
+ | | sentence_0 | sentence_1 | label |
295
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------|
296
+ | type | string | string | float |
297
+ | details | <ul><li>min: 55 tokens</li><li>mean: 65.8 tokens</li><li>max: 75 tokens</li></ul> | <ul><li>min: 38 tokens</li><li>mean: 104.02 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 0.01</li><li>mean: 0.34</li><li>max: 1.0</li></ul> |
298
+ * Samples:
299
+ | sentence_0 | sentence_1 | label |
300
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
301
+ | <code>pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur kontrol mutu bahan mentah.</code> | <code>pengalaman kerja 2024 teknisi listrik (magang) mengecek sambungan kabel dan panel ringan. membersihkan box panel terminal listrik. mengukur voltase menggunakan multitester. mendukung teknisi senior saat perbaikan mesin produksi. 2023 helper produksi mengecek stop kontak peralatan listrik kecil. memastikan ar ea produksi aman dari hubungan pendek. melakukan pembersihan alat pasca produksi. memindahkan peralatan produksi sesuai permintaan. pendidikan smk 2021 2024 smk teknik elektro nilai: 82,25 anggota osis divisi logistik keterampilan wiring dasar instalasi kontrol sederhana pemeliharaan motor listrik penggunaan multitester keselamatan kerja listrik fresh graduate</code> | <code>0.3466162618930005</code> |
302
+ | <code>pendidikan minimal s1 teknologi pangan, kimia, atau sejenis. fresh graduate dipersilakan melamar, memiliki pengalaman di bidang terkait menjadi nilai tambah. teliti, jujur, dan mampu bekerja di lingkungan berbau kuat. terampil memastikan hasil akhir memenuhi standar mutu perusahaan. memahami gmp, haccp, dan prosedur kontrol mutu bahan mentah.</code> | <code>skills analis mutu dengan 5 tahun pengalaman mengelola panel uji organoleptik, baik internal maupun eksternal, untuk produk makanan fermentasi dan bumbu. mampu merancang form penilaian sederhana, mengkoordinasi panelis, serta menganalisis data penilaian sensori untuk mendukung keputusan mutu. memiliki sensitivitas tinggi terhadap perubahan rasa, aroma, dan warna produk. uji organoleptik (rasa, aroma, warna, tekstur) penyusunan form penilaian panel education mengelola sesi uji organoleptik untuk produk baru dan existing. menilai konsistensi rasa dan aroma batch ke batch. mengolah data penilaian panel menjadi laporan sederhana. berkoordinasi dengan r d untuk perbaikan formulasi. melakukan uji kadar air, kadar garam, dan ph. menguji warna dan tekstur produk jadi. menyusun laporan uji harian dan mingguan. membantu uji kecil organoleptik internal. ...</code> | <code>0.3949887113923309</code> |
303
+ | <code>pendidikan minimal sma/smk sederajat. pengalaman sebagai staf warehouse di industri makanan diutamakan. menguasai pencatatan stok menggunakan microsoft excel. teliti dan memahami sistem penyimpanan bahan pangan (fifo/fefo). bertanggung jawab terhadap laporan stok harian dan stok opname berkala.</code> | <code>skills pemeriksaan verifikasi form quality control penyusunan laporan mutu berkala persiapan audit internal eksternal uji kadar air/garam/ph/organoleptik penerapan gmp dan dasar qa languages english (fluent) german (basic) french (fluent) w ork experience 2019 2024 senior quality analyst mengawasi konsistensi hasil uji yang dilakukan oleh tim analis junior. memeriksa kelengkapan dokumen mutu sebelum audit. membantu qa dalam investigasi penyebab komplain mutu. memberikan masukan perbaikan form dan prosedur quality control. 2016 2019 quality control analyst melakukan uji rutin kadar air, kadar garam, dan ph. menguji warna dan aroma produk terasi. mengarsipkan hasil uji sesuai sistem penyimpanan dokumen. mendukung audit internal dengan menyiapkan dokumen terkait mutu. 2014 2016 quality control junior mengambil sampel bahan baku dan produk jadi. menguji parameter mutu sederhana. education 2010...</code> | <code>0.0431926040368358</code> |
304
+ * Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
305
+ ```json
306
+ {
307
+ "loss_fct": "torch.nn.modules.loss.MSELoss"
308
+ }
309
+ ```
310
+
311
+ ### Training Hyperparameters
312
+ #### Non-Default Hyperparameters
313
+
314
+ - `eval_strategy`: steps
315
+ - `per_device_train_batch_size`: 16
316
+ - `per_device_eval_batch_size`: 16
317
+ - `num_train_epochs`: 10
318
+ - `multi_dataset_batch_sampler`: round_robin
319
+
320
+ #### All Hyperparameters
321
+ <details><summary>Click to expand</summary>
322
+
323
+ - `overwrite_output_dir`: False
324
+ - `do_predict`: False
325
+ - `eval_strategy`: steps
326
+ - `prediction_loss_only`: True
327
+ - `per_device_train_batch_size`: 16
328
+ - `per_device_eval_batch_size`: 16
329
+ - `per_gpu_train_batch_size`: None
330
+ - `per_gpu_eval_batch_size`: None
331
+ - `gradient_accumulation_steps`: 1
332
+ - `eval_accumulation_steps`: None
333
+ - `torch_empty_cache_steps`: None
334
+ - `learning_rate`: 5e-05
335
+ - `weight_decay`: 0.0
336
+ - `adam_beta1`: 0.9
337
+ - `adam_beta2`: 0.999
338
+ - `adam_epsilon`: 1e-08
339
+ - `max_grad_norm`: 1
340
+ - `num_train_epochs`: 10
341
+ - `max_steps`: -1
342
+ - `lr_scheduler_type`: linear
343
+ - `lr_scheduler_kwargs`: {}
344
+ - `warmup_ratio`: 0.0
345
+ - `warmup_steps`: 0
346
+ - `log_level`: passive
347
+ - `log_level_replica`: warning
348
+ - `log_on_each_node`: True
349
+ - `logging_nan_inf_filter`: True
350
+ - `save_safetensors`: True
351
+ - `save_on_each_node`: False
352
+ - `save_only_model`: False
353
+ - `restore_callback_states_from_checkpoint`: False
354
+ - `no_cuda`: False
355
+ - `use_cpu`: False
356
+ - `use_mps_device`: False
357
+ - `seed`: 42
358
+ - `data_seed`: None
359
+ - `jit_mode_eval`: False
360
+ - `bf16`: False
361
+ - `fp16`: False
362
+ - `fp16_opt_level`: O1
363
+ - `half_precision_backend`: auto
364
+ - `bf16_full_eval`: False
365
+ - `fp16_full_eval`: False
366
+ - `tf32`: None
367
+ - `local_rank`: 0
368
+ - `ddp_backend`: None
369
+ - `tpu_num_cores`: None
370
+ - `tpu_metrics_debug`: False
371
+ - `debug`: []
372
+ - `dataloader_drop_last`: False
373
+ - `dataloader_num_workers`: 0
374
+ - `dataloader_prefetch_factor`: None
375
+ - `past_index`: -1
376
+ - `disable_tqdm`: False
377
+ - `remove_unused_columns`: True
378
+ - `label_names`: None
379
+ - `load_best_model_at_end`: False
380
+ - `ignore_data_skip`: False
381
+ - `fsdp`: []
382
+ - `fsdp_min_num_params`: 0
383
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
384
+ - `fsdp_transformer_layer_cls_to_wrap`: None
385
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
386
+ - `parallelism_config`: None
387
+ - `deepspeed`: None
388
+ - `label_smoothing_factor`: 0.0
389
+ - `optim`: adamw_torch_fused
390
+ - `optim_args`: None
391
+ - `adafactor`: False
392
+ - `group_by_length`: False
393
+ - `length_column_name`: length
394
+ - `project`: huggingface
395
+ - `trackio_space_id`: trackio
396
+ - `ddp_find_unused_parameters`: None
397
+ - `ddp_bucket_cap_mb`: None
398
+ - `ddp_broadcast_buffers`: False
399
+ - `dataloader_pin_memory`: True
400
+ - `dataloader_persistent_workers`: False
401
+ - `skip_memory_metrics`: True
402
+ - `use_legacy_prediction_loop`: False
403
+ - `push_to_hub`: False
404
+ - `resume_from_checkpoint`: None
405
+ - `hub_model_id`: None
406
+ - `hub_strategy`: every_save
407
+ - `hub_private_repo`: None
408
+ - `hub_always_push`: False
409
+ - `hub_revision`: None
410
+ - `gradient_checkpointing`: False
411
+ - `gradient_checkpointing_kwargs`: None
412
+ - `include_inputs_for_metrics`: False
413
+ - `include_for_metrics`: []
414
+ - `eval_do_concat_batches`: True
415
+ - `fp16_backend`: auto
416
+ - `push_to_hub_model_id`: None
417
+ - `push_to_hub_organization`: None
418
+ - `mp_parameters`:
419
+ - `auto_find_batch_size`: False
420
+ - `full_determinism`: False
421
+ - `torchdynamo`: None
422
+ - `ray_scope`: last
423
+ - `ddp_timeout`: 1800
424
+ - `torch_compile`: False
425
+ - `torch_compile_backend`: None
426
+ - `torch_compile_mode`: None
427
+ - `include_tokens_per_second`: False
428
+ - `include_num_input_tokens_seen`: no
429
+ - `neftune_noise_alpha`: None
430
+ - `optim_target_modules`: None
431
+ - `batch_eval_metrics`: False
432
+ - `eval_on_start`: False
433
+ - `use_liger_kernel`: False
434
+ - `liger_kernel_config`: None
435
+ - `eval_use_gather_object`: False
436
+ - `average_tokens_across_devices`: True
437
+ - `prompts`: None
438
+ - `batch_sampler`: batch_sampler
439
+ - `multi_dataset_batch_sampler`: round_robin
440
+ - `router_mapping`: {}
441
+ - `learning_rate_mapping`: {}
442
+
443
+ </details>
444
+
445
+ ### Training Logs
446
+ | Epoch | Step | val-sim_spearman_cosine |
447
+ |:-----:|:----:|:-----------------------:|
448
+ | 0.5 | 7 | 0.8582 |
449
+
450
+
451
+ ### Framework Versions
452
+ - Python: 3.12.12
453
+ - Sentence Transformers: 5.2.0
454
+ - Transformers: 4.57.3
455
+ - PyTorch: 2.9.0+cpu
456
+ - Accelerate: 1.12.0
457
+ - Datasets: 4.0.0
458
+ - Tokenizers: 0.22.1
459
+
460
+ ## Citation
461
+
462
+ ### BibTeX
463
+
464
+ #### Sentence Transformers
465
+ ```bibtex
466
+ @inproceedings{reimers-2019-sentence-bert,
467
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
468
+ author = "Reimers, Nils and Gurevych, Iryna",
469
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
470
+ month = "11",
471
+ year = "2019",
472
+ publisher = "Association for Computational Linguistics",
473
+ url = "https://arxiv.org/abs/1908.10084",
474
+ }
475
+ ```
476
+
477
+ <!--
478
+ ## Glossary
479
+
480
+ *Clearly define terms in order to be accessible across audiences.*
481
+ -->
482
+
483
+ <!--
484
+ ## Model Card Authors
485
+
486
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
487
+ -->
488
+
489
+ <!--
490
+ ## Model Card Contact
491
+
492
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
493
+ -->
model/config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "dtype": "float32",
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "transformers_version": "4.57.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 250037
25
+ }
model/config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "5.2.0",
4
+ "transformers": "4.57.3",
5
+ "pytorch": "2.9.0+cpu"
6
+ },
7
+ "model_type": "SentenceTransformer",
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model/eval/similarity_evaluation_val-sim_results.csv ADDED
@@ -0,0 +1,11 @@
 
 
 
 
 
 
 
 
 
 
 
 
1
+ epoch,steps,cosine_pearson,cosine_spearman
2
+ 1.0,14,0.793999598948865,0.8457293271210397
3
+ 2.0,28,0.7814103024451452,0.8139111092192509
4
+ 3.0,42,0.8212675683006192,0.8477282340976581
5
+ 4.0,56,0.8145585233770605,0.8277117820441231
6
+ 5.0,70,0.8193231187897223,0.8335715915372236
7
+ 6.0,84,0.8269653809692382,0.8418136600298557
8
+ 7.0,98,0.8299710836665999,0.840800515397871
9
+ 8.0,112,0.8327720299720598,0.8468246186150771
10
+ 9.0,126,0.832600611299027,0.8471532060632885
11
+ 10.0,140,0.8326496835248816,0.8471532060632885
model/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d1a3fa52d941ab7315580ef36c0ca8209b77d2b099a2fd37f7016723be93edb3
3
+ size 470637416
model/modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
model/sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
model/special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
model/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
model/tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "extra_special_tokens": {},
50
+ "mask_token": "<mask>",
51
+ "max_length": 128,
52
+ "model_max_length": 128,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "<pad>",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "</s>",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "<unk>"
65
+ }
model/unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260