TextModel commited on
Commit
cd81c08
·
verified ·
1 Parent(s): 666972f

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
2_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 768,
3
+ "out_features": 3072,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
2_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:50eeab9116dd480e7069c8739e7b6c7341b637b0ccc40c98048f4472f5d6dd4e
3
+ size 9437272
3_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 3072,
3
+ "out_features": 768,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
3_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2c6af6516d363fd9595260eb759565025535c3c274da8440f3dcf1c924cbf7d0
3
+ size 9437272
README.md ADDED
@@ -0,0 +1,534 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:2004
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: google/embeddinggemma-300m
11
+ widget:
12
+ - source_sentence: 'query: Seorang pria bernama Eko Santoso di Kota Semarang pada
13
+ tahun 2024 secara terang-terangan di hadapan kerumunan massa di alun-alun kota
14
+ menyampaikan orasi yang berisi hasutan untuk melakukan diskriminasi terhadap penganut
15
+ agama tertentu yang ada di Indonesia, dengan menyatakan bahwa agama tersebut adalah
16
+ ancaman dan harus dilawan. Pernyataan tersebut disampaikan secara langsung di
17
+ muka umum dan direkam oleh banyak orang. Pasal apa yang tepat dikenakan kepada
18
+ Eko Santoso?'
19
+ sentences:
20
+ - 'passage: Ya, karena mantan pejabat yang tanpa izin dari pejabat berwenang menahan
21
+ atau tetap menyimpan surat dinas yang ada padanya setelah tidak lagi menjabat
22
+ dapat dipidana penjara paling lama 6 bulan atau denda paling banyak kategori II.
23
+ (Pasal 541 KUHP)'
24
+ - 'passage: Pasal 300: Setiap Orang Di Muka Umum yang: a. melakukan perbuatan yang
25
+ bersifat permusuhan; b. menyatakan kebencian atau permusuhan; atau c. menghasut
26
+ untuk melakukan Kekerasan, atau diskriminasi, terhadap agama, kepercayaan orang
27
+ lain, golongan, atau kelompok atas dasar agama atau kepercayaan di Indonesia,
28
+ dipidana dengan pidana penjara paling lama 3 (tiga) tahun atau pidana denda paling
29
+ banyak kategori IV.. Pasal ini berlaku karena Eko Santoso secara Di Muka Umum
30
+ menyatakan kebencian dan menghasut untuk melakukan diskriminasi terhadap penganut
31
+ agama tertentu di Indonesia berdasarkan agama mereka, yang secara langsung memenuhi
32
+ unsur tindak pidana dalam Pasal 300 KUHP 2023..'
33
+ - 'passage: Pasal 301: (1) Setiap Orang yang menyiarkan, mempertunjukkan, menempelkan
34
+ tulisan atau gambar, atau memperdengarkan suatu rekaman, termasuk menyebarluaskan
35
+ melalui sarana teknologi informasi yang berisi Tindak Pidana sebagaimana dimaksud
36
+ dalam Pasal 300, dengan maksud agar isi tulisan, gambar, atau rekaman tersebut
37
+ diketahui atau lebih diketahui oleh umum, dipidana dengan pidana penjara paling
38
+ lama 5 (lima) tahun atau pidana denda paling banyak kategori V. (2) Jika Setiap
39
+ Orang sebagaimana dimaksud pada ayat (1) melakukan perbuatan tersebut dalam menjalankan
40
+ profesinya dan pada waktu itu belum lewat 2 (dua) tahun sejak adanya putusan pemidanaan
41
+ yang telah memperoleh kekuatan hukum tetap karena melakukan Tindak Pidana yang
42
+ sama, dapat dijatuhi pidana tambahan berupa pencabutan hak sebagaimana dimaksud
43
+ dalam Pasal 86 huruf f.. Pasal ini mengatur penyebarluasan melalui media konten
44
+ yang memuat tindak pidana Pasal 300, merupakan pasal turunan dari Pasal 300 bukan
45
+ pasal induk kebencian berbasis agama itu sendiri..'
46
+ - source_sentence: 'query: Dimas Pratama, seorang mantan karyawan IT perusahaan swasta
47
+ di Jakarta, pada tahun 2023 secara diam-diam memasang perangkat lunak penyadap
48
+ pada server perusahaan PT Maju Sejahtera tanpa izin. Melalui perangkat tersebut,
49
+ Dimas berhasil merekam dan mengakses transmisi email internal serta dokumen elektronik
50
+ rahasia yang tidak bersifat publik milik direksi perusahaan. Ia kemudian menyebarluaskan
51
+ rekaman percakapan tersebut kepada kompetitor bisnis. Setelah dilaporkan, penyidik
52
+ menemukan bukti kegiatan penyadapan dan penyebaran informasi rahasia yang dilakukan
53
+ Dimas. Pasal apa yang dapat dikenakan kepada Dimas Pratama?'
54
+ sentences:
55
+ - 'passage: Pasal 258: (1) Setiap Orang yang secara melawan hukum mendengarkan,
56
+ merekam, membelokkan, mengubah, menghambat, dan/atau mencatat transmisi Informasi
57
+ Elektronik dan/atau Dokumen Elektronik yang tidak bersifat publik, baik menggunakan
58
+ jaringan kabel komunikasi maupun jaringan nirkabel, dipidana dengan pidana penjara
59
+ paling lama 10 (sepuluh) tahun atau pidana denda paling banyak kategori VI. (2)
60
+ Setiap Orang yang menyiarkan atau menyebarluaskan hasil pembicaraan atau perekaman
61
+ sebagaimana dimaksud pada ayat (1), dipidana dengan pidana penjara paling lama
62
+ 10 (sepuluh) tahun atau pidana denda paling banyak kategori VI.. Pasal ini berlaku
63
+ karena Dimas Pratama telah secara melawan hukum merekam dan mencatat transmisi
64
+ Informasi Elektronik dan Dokumen Elektronik yang tidak bersifat publik milik PT
65
+ Maju Sejahtera melalui jaringan komunikasi (ayat 1), dan kemudian menyebarluaskan
66
+ hasil perekaman tersebut kepada pihak lain (ayat 2), yang keduanya merupakan perbuatan
67
+ yang dilarang dalam Pasal 258 KUHP 2023..'
68
+ - 'passage: Membuat dan menyebarluaskan pornografi melalui media sosial dapat dipidana
69
+ penjara paling singkat 6 bulan dan paling lama 10 tahun atau denda kategori IV
70
+ sampai VI. (Pasal 407 ayat (1) KUHP)'
71
+ - 'passage: Pasal 407: (1) Setiap Orang yang memproduksi, membuat, memperbanyak,
72
+ menggandakan, menyebarluaskan, menyiarkan, mengimpor, mengekspor, menawarkan,
73
+ memperjualbelikan, menyewakan, atau menyediakan Pornografi, dipidana dengan pidana
74
+ penjara paling singkat 6 (enam) Bulan dan pidana penjara paling lama 10 (sepuluh)
75
+ tahun atau pidana denda paling sedikit kategori IV dan pidana denda paling banyak
76
+ kategori VI. (2) Perbuatan sebagaimana dimaksud pada ayat (1) tidak dipidana jika
77
+ merupakan karya seni, budaya, olahraga, kesehatan, dan/atau ilmu pengetahuan..
78
+ Pasal ini mengatur produksi dan distribusi konten pornografi, yang berbeda dengan
79
+ penyadapan dan penyebaran informasi elektronik yang tidak bersifat publik..'
80
+ - source_sentence: 'query: Apa artinya menimbulkan persangkaan palsu dalam KUHP?'
81
+ sentences:
82
+ - 'passage: Pengaduan fitnah adalah mengajukan pengaduan atau pemberitahuan palsu
83
+ secara tertulis kepada pejabat yang berwenang sehingga kehormatan orang lain diserang.
84
+ (Pasal 437 ayat (1) KUHP)'
85
+ - 'passage: Menimbulkan persangkaan palsu adalah melakukan suatu perbuatan yang
86
+ menyebabkan orang lain disangka telah melakukan suatu tindak pidana, padahal sebenarnya
87
+ tidak. (Pasal 438 KUHP)'
88
+ - 'passage: Ya, karena pejabat di lembaga pengangkutan surat atau barang yang menyerahkan
89
+ surat, kartu pos, barang, atau paket kepada orang yang tidak berhak menerimanya,
90
+ atau merusak, memusnahkan, mengubah isi, maupun mengambil barang di dalamnya untuk
91
+ diri sendiri, dapat dipidana penjara paling lama 5 tahun atau denda paling banyak
92
+ kategori IV. (Pasal 537 KUHP)'
93
+ - source_sentence: 'query: Kalau saya kasih hadiah ke pejabat karena berharap dia
94
+ gunakan wewenangnya untuk bantu urusan saya, apakah saya bisa kena Pasal 606?'
95
+ sentences:
96
+ - 'passage: Bisa, karena pasal ini melarang pemberian hadiah atau janji kepada pegawai
97
+ negeri atau penyelenggara negara yang dikaitkan dengan kekuasaan atau wewenang
98
+ yang melekat pada jabatan atau kedudukannya, meski tanpa permintaan eksplisit
99
+ dari pejabat tersebut. (Pasal 606 KUHP)'
100
+ - 'passage: Pasal 471: (1) Selain penganiayaan sebagaimana dimaksud dalam Pasal
101
+ 467 dan Pasal 470, penganiayaan yang tidak menimbulkan penyakit atau halangan
102
+ untuk menjalankan profesi jabatan atau mata pencaharian, dipidana karena penganiayaan
103
+ ringan, dengan pidana penjara paling lama 6 (enam) Bulan atau pidana denda paling
104
+ banyak kategori II. (2) Jika Tindak Pidana sebagaimana dimaksud pada ayat (1)
105
+ dilakukan terhadap orang yang bekerja padanya atau menjadi bawahannya, pidananya
106
+ dapat ditambah 1/3 (satu per tiga). (3) Percobaan melakukan Tindak Pidana sebagaimana
107
+ dimaksud pada ayat (1), tidak dipidana. Pasal ini berlaku karena pukulan Ronald
108
+ yang tidak menimbulkan penyakit atau halangan bekerja, serta dilakukan terhadap
109
+ bawahan, memenuhi unsur penganiayaan ringan dengan pemberatan pidana pada ayat
110
+ (1) dan ayat (2).'
111
+ - 'passage: Bisa, pasal ini melarang setiap orang yang secara melawan hukum melakukan
112
+ tindakan memperkaya dirinya, pihak lain, maupun korporasi sehingga mengakibatkan
113
+ kerugian pada keuangan negara. (Pasal 603 KUHP)'
114
+ - source_sentence: 'query: Di Bandung, seorang dokter bedah bernama Dr. Lestari melakukan
115
+ operasi pada pasien bernama Tn. Agus. Karena kurang teliti dalam memeriksa alat
116
+ operasi, Dr. Lestari menyebabkan komplikasi serius yang mengakibatkan Tn. Agus
117
+ mengalami cacat permanen dan tidak dapat bekerja lagi sebagai tukang bangunan.
118
+ Pasal apa yang dapat dikenakan kepada Dr. Lestari?'
119
+ sentences:
120
+ - 'passage: Pasal 459: Setiap Orang yang dengan rencana terlebih dahulu merampas
121
+ nyawa orang lain, dipidana karena pembunuhan berencana, dengan pidana mati atau
122
+ pidana penjara seumur hidup atau pidana penjara paling lama 20 (dua puluh) tahun.
123
+ Pasal ini mengatur pembunuhan dengan unsur perencanaan atau premeditasi.'
124
+ - 'passage: Pasal 475: (1) Jika Tindak Pidana sebagaimana dimaksud dalam Pasal 474
125
+ dilakukan dalam menjalankan jabatan, mata pencaharian, atau profesi, pidananya
126
+ dapat ditambah 1/3 (satu per tiga). (2) Setiap Orang sebagaimana dimaksud pada
127
+ ayat (1) dapat juga dijatuhi pidana tambahan berupa pengumuman putusan hakim sebagaimana
128
+ dimaksud dalam Pasal 66 ayat (1) huruf c dan pencabutan hak sebagaimana dimaksud
129
+ dalam Pasal 86 huruf f. Pasal ini berlaku karena kasus tersebut melibatkan kelalaian
130
+ dalam menjalankan profesi medis yang mengakibatkan Luka Berat, sehingga merupakan
131
+ aggravating circumstance dari Pasal 474 yang diatur dalam Pasal 475.'
132
+ - 'passage: Pasal 448: (1) Dipidana dengan pidana penjara paling lama 1 (satu) tahun
133
+ atau pidana denda paling banyak kategori II, Setiap Orang yang: a. secara melawan
134
+ hukum memaksa orang lain supaya melakukan, tidak melakukan, atau membiarkan sesuatu,
135
+ dengan Kekerasan atau Ancaman Kekerasan, baik terhadap orang itu sendiri maupun
136
+ orang lain; atau b. memaksa orang lain supaya melakukan, tidak melakukan, atau
137
+ membiarkan sesuatu dengan ancaman pencemaran atau pencemaran tertulis. (2) Tindak
138
+ Pidana sebagaimana dimaksud pada ayat (1) huruf b hanya dapat dituntut atas pengaduan
139
+ dari Korban Tindak Pidana. Pasal ini berlaku karena Bram Sulistyo memaksa Andi
140
+ Firmansyah untuk melakukan sesuatu (mencabut laporan ketenagakerjaan) dengan ancaman
141
+ pencemaran nama baik (ancaman membocorkan aib pribadi), yang memenuhi unsur tindak
142
+ pidana dalam Pasal 448 ayat (1) huruf b KUHP 2023. Karena menggunakan ancaman
143
+ pencemaran, tindak pidana ini merupakan delik aduan sebagaimana Pasal 448 ayat
144
+ (2)'
145
+ pipeline_tag: sentence-similarity
146
+ library_name: sentence-transformers
147
+ metrics:
148
+ - cosine_accuracy
149
+ model-index:
150
+ - name: SentenceTransformer based on google/embeddinggemma-300m
151
+ results:
152
+ - task:
153
+ type: triplet
154
+ name: Triplet
155
+ dataset:
156
+ name: val
157
+ type: val
158
+ metrics:
159
+ - type: cosine_accuracy
160
+ value: 0.9608802199363708
161
+ name: Cosine Accuracy
162
+ - task:
163
+ type: triplet
164
+ name: Triplet
165
+ dataset:
166
+ name: test
167
+ type: test
168
+ metrics:
169
+ - type: cosine_accuracy
170
+ value: 0.9560975432395935
171
+ name: Cosine Accuracy
172
+ ---
173
+
174
+ # SentenceTransformer based on google/embeddinggemma-300m
175
+
176
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
177
+
178
+ ## Model Details
179
+
180
+ ### Model Description
181
+ - **Model Type:** Sentence Transformer
182
+ - **Base model:** [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m) <!-- at revision 57c266a740f537b4dc058e1b0cda161fd15afa75 -->
183
+ - **Maximum Sequence Length:** 2048 tokens
184
+ - **Output Dimensionality:** 768 dimensions
185
+ - **Similarity Function:** Cosine Similarity
186
+ <!-- - **Training Dataset:** Unknown -->
187
+ <!-- - **Language:** Unknown -->
188
+ <!-- - **License:** Unknown -->
189
+
190
+ ### Model Sources
191
+
192
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
193
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
194
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
195
+
196
+ ### Full Model Architecture
197
+
198
+ ```
199
+ SentenceTransformer(
200
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
201
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
202
+ (2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
203
+ (3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
204
+ (4): Normalize()
205
+ )
206
+ ```
207
+
208
+ ## Usage
209
+
210
+ ### Direct Usage (Sentence Transformers)
211
+
212
+ First install the Sentence Transformers library:
213
+
214
+ ```bash
215
+ pip install -U sentence-transformers
216
+ ```
217
+
218
+ Then you can load this model and run inference.
219
+ ```python
220
+ from sentence_transformers import SentenceTransformer
221
+
222
+ # Download from the 🤗 Hub
223
+ model = SentenceTransformer("TextModel/gemma-embedding-kuhp-indo")
224
+ # Run inference
225
+ queries = [
226
+ "query: Di Bandung, seorang dokter bedah bernama Dr. Lestari melakukan operasi pada pasien bernama Tn. Agus. Karena kurang teliti dalam memeriksa alat operasi, Dr. Lestari menyebabkan komplikasi serius yang mengakibatkan Tn. Agus mengalami cacat permanen dan tidak dapat bekerja lagi sebagai tukang bangunan. Pasal apa yang dapat dikenakan kepada Dr. Lestari?",
227
+ ]
228
+ documents = [
229
+ 'passage: Pasal 475: (1) Jika Tindak Pidana sebagaimana dimaksud dalam Pasal 474 dilakukan dalam menjalankan jabatan, mata pencaharian, atau profesi, pidananya dapat ditambah 1/3 (satu per tiga). (2) Setiap Orang sebagaimana dimaksud pada ayat (1) dapat juga dijatuhi pidana tambahan berupa pengumuman putusan hakim sebagaimana dimaksud dalam Pasal 66 ayat (1) huruf c dan pencabutan hak sebagaimana dimaksud dalam Pasal 86 huruf f. Pasal ini berlaku karena kasus tersebut melibatkan kelalaian dalam menjalankan profesi medis yang mengakibatkan Luka Berat, sehingga merupakan aggravating circumstance dari Pasal 474 yang diatur dalam Pasal 475.',
230
+ 'passage: Pasal 459: Setiap Orang yang dengan rencana terlebih dahulu merampas nyawa orang lain, dipidana karena pembunuhan berencana, dengan pidana mati atau pidana penjara seumur hidup atau pidana penjara paling lama 20 (dua puluh) tahun. Pasal ini mengatur pembunuhan dengan unsur perencanaan atau premeditasi.',
231
+ 'passage: Pasal 448: (1) Dipidana dengan pidana penjara paling lama 1 (satu) tahun atau pidana denda paling banyak kategori II, Setiap Orang yang: a. secara melawan hukum memaksa orang lain supaya melakukan, tidak melakukan, atau membiarkan sesuatu, dengan Kekerasan atau Ancaman Kekerasan, baik terhadap orang itu sendiri maupun orang lain; atau b. memaksa orang lain supaya melakukan, tidak melakukan, atau membiarkan sesuatu dengan ancaman pencemaran atau pencemaran tertulis. (2) Tindak Pidana sebagaimana dimaksud pada ayat (1) huruf b hanya dapat dituntut atas pengaduan dari Korban Tindak Pidana. Pasal ini berlaku karena Bram Sulistyo memaksa Andi Firmansyah untuk melakukan sesuatu (mencabut laporan ketenagakerjaan) dengan ancaman pencemaran nama baik (ancaman membocorkan aib pribadi), yang memenuhi unsur tindak pidana dalam Pasal 448 ayat (1) huruf b KUHP 2023. Karena menggunakan ancaman pencemaran, tindak pidana ini merupakan delik aduan sebagaimana Pasal 448 ayat (2)',
232
+ ]
233
+ query_embeddings = model.encode_query(queries)
234
+ document_embeddings = model.encode_document(documents)
235
+ print(query_embeddings.shape, document_embeddings.shape)
236
+ # [1, 768] [3, 768]
237
+
238
+ # Get the similarity scores for the embeddings
239
+ similarities = model.similarity(query_embeddings, document_embeddings)
240
+ print(similarities)
241
+ # tensor([[ 0.5937, -0.0470, 0.0099]])
242
+ ```
243
+
244
+ <!--
245
+ ### Direct Usage (Transformers)
246
+
247
+ <details><summary>Click to see the direct usage in Transformers</summary>
248
+
249
+ </details>
250
+ -->
251
+
252
+ <!--
253
+ ### Downstream Usage (Sentence Transformers)
254
+
255
+ You can finetune this model on your own dataset.
256
+
257
+ <details><summary>Click to expand</summary>
258
+
259
+ </details>
260
+ -->
261
+
262
+ <!--
263
+ ### Out-of-Scope Use
264
+
265
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
266
+ -->
267
+
268
+ ## Evaluation
269
+
270
+ ### Metrics
271
+
272
+ #### Triplet
273
+
274
+ * Datasets: `val` and `test`
275
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
276
+
277
+ | Metric | val | test |
278
+ |:--------------------|:-----------|:-----------|
279
+ | **cosine_accuracy** | **0.9609** | **0.9561** |
280
+
281
+ <!--
282
+ ## Bias, Risks and Limitations
283
+
284
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
285
+ -->
286
+
287
+ <!--
288
+ ### Recommendations
289
+
290
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
291
+ -->
292
+
293
+ ## Training Details
294
+
295
+ ### Training Dataset
296
+
297
+ #### Unnamed Dataset
298
+
299
+ * Size: 2,004 training samples
300
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
301
+ * Approximate statistics based on the first 1000 samples:
302
+ | | anchor | positive | negative |
303
+ |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
304
+ | type | string | string | string |
305
+ | details | <ul><li>min: 16 tokens</li><li>mean: 28.3 tokens</li><li>max: 65 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 60.41 tokens</li><li>max: 129 tokens</li></ul> | <ul><li>min: 18 tokens</li><li>mean: 50.38 tokens</li><li>max: 119 tokens</li></ul> |
306
+ * Samples:
307
+ | anchor | positive | negative |
308
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
309
+ | <code>query: Kalo mau lapor ke polisi soal pencemaran nama baik, apa emang harus nunggu korban datang lapor sendiri atau polisi bisa langsung tangkap pelakunya?</code> | <code>passage: Pasal 24: Dalam hal tertentu, pelaku Tindak Pidana hanya dapat dituntut atas dasar pengaduan. Tindak Pidana aduan harus ditentukan secara tegas dalam Undang-Undang.</code> | <code>passage: Pasal 28: Pengaduan dilakukan dengan cara menyampaikan pemberitahuan dan permohonan untuk dituntut. Pengaduan sebagaimana dimaksud diajukan secara lisan atau tertulis kepada Pejabat yang berwenang.</code> |
310
+ | <code>query: Anak saya yang masih 14 tahun kena aniaya sama tetangga, saya sebagai bapaknya yang lapor polisi. Tapi ternyata Anak saya yang masih 14 tahun kena aniaya, saya sebagai bapaknya yang mau lapor polisi. Apakah saya berhak melapor mewakili anak saya??</code> | <code>passage: Pasal 25: Dalam hal Korban Tindak Pidana aduan belum berumur 16 tahun, yang berhak mengadu merupakan Orang Tua atau walinya. Dalam hal Orang Tua atau wali tidak ada atau Orang Tua/wali itu sendiri yang harus diadukan, pengaduan dilakukan oleh keluarga sedarah dalam garis lurus.</code> | <code>passage: Pasal 26: Dalam hal Korban Tindak Pidana aduan berada di bawah pengampuan, yang berhak mengadu merupakan pengampunya, kecuali bagi Korban yang berada dalam pengampuan karena boros. Jika pengampu tidak ada atau pengampu itu sendiri yang harus diadukan, pengaduan dilakukan oleh suami/istri atau keluarga sedarah.</code> |
311
+ | <code>query: Saya kemarin udah lapor polisi soal kejadian yang menimpa saya, tapi sekarang saya udah maafin pelakunya dan mau cabut laporan. Apa yang bakal terjadi sama perkara ini?</code> | <code>passage: Pasal 30: Pengaduan dapat ditarik kembali oleh pengadu dalam waktu 3 Bulan terhitung sejak tanggal pengaduan diajukan. Pengaduan yang ditarik kembali tidak dapat diajukan lagi.</code> | <code>passage: Pasal 29: Pengaduan harus diajukan dalam tenggang waktu 6 Bulan terhitung sejak tanggal orang yang berhak mengadu mengetahui adanya Tindak Pidana jika bertempat tinggal di wilayah NKRI. Jika yang berhak mengadu lebih dari 1 orang, tenggang waktu dihitung sejak tanggal masing-masing pengadu mengetahui adanya Tindak Pidana.</code> |
312
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
313
+ ```json
314
+ {
315
+ "scale": 20.0,
316
+ "similarity_fct": "cos_sim",
317
+ "gather_across_devices": false
318
+ }
319
+ ```
320
+
321
+ ### Evaluation Dataset
322
+
323
+ #### Unnamed Dataset
324
+
325
+ * Size: 409 evaluation samples
326
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
327
+ * Approximate statistics based on the first 409 samples:
328
+ | | anchor | positive | negative |
329
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
330
+ | type | string | string | string |
331
+ | details | <ul><li>min: 14 tokens</li><li>mean: 52.59 tokens</li><li>max: 138 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 109.49 tokens</li><li>max: 643 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 86.18 tokens</li><li>max: 615 tokens</li></ul> |
332
+ * Samples:
333
+ | anchor | positive | negative |
334
+ |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
335
+ | <code>query: Berapa hukuman untuk menyatakan kebencian terhadap suku tertentu di depan orang banyak?</code> | <code>passage: Orang yang menyatakan kebencian terhadap suatu suku atau golongan penduduk di depan umum dapat dihukum penjara paling lama 3 tahun atau denda paling banyak kategori IV. (Pasal 242 KUHP)</code> | <code>passage: Orang yang menyatakan kebencian terhadap suatu golongan agama atau kepercayaan tertentu di depan umum dapat dihukum penjara paling lama 3 tahun atau denda paling banyak kategori IV. (Pasal 300 KUHP)</code> |
336
+ | <code>query: Arief Budiman, warga Kota Semarang, pada bulan Maret 2024 secara lisan menyampaikan tuduhan kepada sejumlah tetangganya bahwa DR. Santi Rahayu, seorang dokter terhormat di lingkungan mereka, terlibat dalam praktik penipuan pasien. Pernyataan tersebut diucapkan di depan warga dalam rapat RT dengan tujuan agar tuduhan tersebut diketahui umum. Pernyataan Arief tidak disertai bukti apapun dan terbukti tidak benar. DR. Santi merasa nama baiknya sangat dirugikan. Pasal apa yang dapat dikenakan kepada Arief Budiman?</code> | <code>passage: Pasal 433: (1) Setiap Orang yang dengan lisan menyerang kehormatan atau nama baik orang lain dengan cara menuduhkan suatu hal, dengan maksud supaya hal tersebut diketahui umum, dipidana karena pencemaran, dengan pidana penjara paling lama 9 (sembilan) Bulan atau pidana denda paling banyak kategori II. (2) Jika perbuatan sebagaimana dimaksud pada ayat (1) dilakukan dengan tulisan atau gambar yang disiarkan, dipertunjukkan, atau ditempelkan di tempat umum, dipidana karena pencemaran tertulis, dengan pidana penjara paling lama 1 (satu) tahun 6 (enam) Bulan atau pidana denda paling banyak kategori III.. Pasal ini berlaku karena Arief Budiman secara lisan menyerang kehormatan dan nama baik DR. Santi Rahayu dengan cara menuduhkan suatu hal (keterlibatan dalam penipuan pasien) dengan maksud agar hal tersebut diketahui umum, yang tepat masuk dalam kualifikasi pencemaran sebagaimana diatur dalam Pasal 433 ayat (1) KUHP 2023..</code> | <code>passage: Pasal 434: (1) Jika Setiap Orang sebagaimana dimaksud dalam Pasal 433 diberi kesempatan membuktikan kebenaran hal yang dituduhkan tetapi tidak dapat membuktikannya, dan tuduhan tersebut bertentangan dengan yang diketahuinya, dipidana karena fitnah, dengan pidana penjara paling lama 3 (tiga) tahun atau pidana denda paling banyak kategori IV. (2) Pembuktian kebenaran tuduhan sebagaimana dimaksud pada ayat (1), hanya dapat dilakukan dalam hal: a. hakim memandang perlu untuk memeriksa kebenaran tuduhan tersebut guna mempertimbangkan keterangan terdakwa bahwa terdakwa melakukan perbuatan tersebut untuk kepentingan umum atau karena terpaksa untuk membela diri; atau b. Pejabat dituduh melakukan suatu hal dalam menjalankan tugas jabatannya.. Pasal ini mengatur fitnah, yaitu pencemaran di mana pelaku diberikan kesempatan membuktikan kebenaran tuduhan tetapi tidak dapat membuktikannya dan tuduhan bertentangan dengan yang diketahuinya, merupakan kualifikasi lebih berat dari pencemaran bi...</code> |
337
+ | <code>query: Kalau orang yang saya tuduh dibebaskan pengadilan, apakah itu otomatis jadi bukti kalau tuduhan saya salah?</code> | <code>passage: Ya, jika putusan pengadilan yang telah berkekuatan hukum tetap menyatakan orang yang dihina dibebaskan dari hal yang dituduhkan, putusan tersebut dianggap sebagai bukti sempurna bahwa hal yang dituduhkan tidak benar. (Pasal 435 ayat (2) KUHP)</code> | <code>passage: Jika tuduhan tersebut hanya dapat dituntut atas pengaduan dan pengaduan tidak diajukan, maka pembuktian kebenaran tuduhan tidak dapat dilakukan meskipun ada bukti lain. (Pasal 434 ayat (3) KUHP)</code> |
338
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
339
+ ```json
340
+ {
341
+ "scale": 20.0,
342
+ "similarity_fct": "cos_sim",
343
+ "gather_across_devices": false
344
+ }
345
+ ```
346
+
347
+ ### Training Hyperparameters
348
+ #### Non-Default Hyperparameters
349
+
350
+ - `eval_strategy`: epoch
351
+ - `per_device_train_batch_size`: 4
352
+ - `per_device_eval_batch_size`: 4
353
+ - `gradient_accumulation_steps`: 4
354
+ - `learning_rate`: 1e-05
355
+ - `weight_decay`: 0.01
356
+ - `num_train_epochs`: 4
357
+ - `warmup_ratio`: 0.3
358
+ - `warmup_steps`: 0.3
359
+ - `fp16`: True
360
+ - `load_best_model_at_end`: True
361
+ - `dataloader_pin_memory`: False
362
+ - `gradient_checkpointing`: True
363
+ - `batch_sampler`: no_duplicates
364
+
365
+ #### All Hyperparameters
366
+ <details><summary>Click to expand</summary>
367
+
368
+ - `do_predict`: False
369
+ - `eval_strategy`: epoch
370
+ - `prediction_loss_only`: True
371
+ - `per_device_train_batch_size`: 4
372
+ - `per_device_eval_batch_size`: 4
373
+ - `gradient_accumulation_steps`: 4
374
+ - `eval_accumulation_steps`: None
375
+ - `torch_empty_cache_steps`: None
376
+ - `learning_rate`: 1e-05
377
+ - `weight_decay`: 0.01
378
+ - `adam_beta1`: 0.9
379
+ - `adam_beta2`: 0.999
380
+ - `adam_epsilon`: 1e-08
381
+ - `max_grad_norm`: 1.0
382
+ - `num_train_epochs`: 4
383
+ - `max_steps`: -1
384
+ - `lr_scheduler_type`: linear
385
+ - `lr_scheduler_kwargs`: None
386
+ - `warmup_ratio`: 0.3
387
+ - `warmup_steps`: 0.3
388
+ - `log_level`: passive
389
+ - `log_level_replica`: warning
390
+ - `log_on_each_node`: True
391
+ - `logging_nan_inf_filter`: True
392
+ - `enable_jit_checkpoint`: False
393
+ - `save_on_each_node`: False
394
+ - `save_only_model`: False
395
+ - `restore_callback_states_from_checkpoint`: False
396
+ - `use_cpu`: False
397
+ - `seed`: 42
398
+ - `data_seed`: None
399
+ - `bf16`: False
400
+ - `fp16`: True
401
+ - `bf16_full_eval`: False
402
+ - `fp16_full_eval`: False
403
+ - `tf32`: None
404
+ - `local_rank`: -1
405
+ - `ddp_backend`: None
406
+ - `debug`: []
407
+ - `dataloader_drop_last`: False
408
+ - `dataloader_num_workers`: 0
409
+ - `dataloader_prefetch_factor`: None
410
+ - `disable_tqdm`: False
411
+ - `remove_unused_columns`: True
412
+ - `label_names`: None
413
+ - `load_best_model_at_end`: True
414
+ - `ignore_data_skip`: False
415
+ - `fsdp`: []
416
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
417
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
418
+ - `parallelism_config`: None
419
+ - `deepspeed`: None
420
+ - `label_smoothing_factor`: 0.0
421
+ - `optim`: adamw_torch_fused
422
+ - `optim_args`: None
423
+ - `group_by_length`: False
424
+ - `length_column_name`: length
425
+ - `project`: huggingface
426
+ - `trackio_space_id`: trackio
427
+ - `ddp_find_unused_parameters`: None
428
+ - `ddp_bucket_cap_mb`: None
429
+ - `ddp_broadcast_buffers`: False
430
+ - `dataloader_pin_memory`: False
431
+ - `dataloader_persistent_workers`: False
432
+ - `skip_memory_metrics`: True
433
+ - `push_to_hub`: False
434
+ - `resume_from_checkpoint`: None
435
+ - `hub_model_id`: None
436
+ - `hub_strategy`: every_save
437
+ - `hub_private_repo`: None
438
+ - `hub_always_push`: False
439
+ - `hub_revision`: None
440
+ - `gradient_checkpointing`: True
441
+ - `gradient_checkpointing_kwargs`: None
442
+ - `include_for_metrics`: []
443
+ - `eval_do_concat_batches`: True
444
+ - `auto_find_batch_size`: False
445
+ - `full_determinism`: False
446
+ - `ddp_timeout`: 1800
447
+ - `torch_compile`: False
448
+ - `torch_compile_backend`: None
449
+ - `torch_compile_mode`: None
450
+ - `include_num_input_tokens_seen`: no
451
+ - `neftune_noise_alpha`: None
452
+ - `optim_target_modules`: None
453
+ - `batch_eval_metrics`: False
454
+ - `eval_on_start`: False
455
+ - `use_liger_kernel`: False
456
+ - `liger_kernel_config`: None
457
+ - `eval_use_gather_object`: False
458
+ - `average_tokens_across_devices`: True
459
+ - `use_cache`: False
460
+ - `prompts`: None
461
+ - `batch_sampler`: no_duplicates
462
+ - `multi_dataset_batch_sampler`: proportional
463
+ - `router_mapping`: {}
464
+ - `learning_rate_mapping`: {}
465
+
466
+ </details>
467
+
468
+ ### Training Logs
469
+ | Epoch | Step | Training Loss | Validation Loss | val_cosine_accuracy | test_cosine_accuracy |
470
+ |:-------:|:-------:|:-------------:|:---------------:|:-------------------:|:--------------------:|
471
+ | -1 | -1 | - | - | 0.9218 | 0.9000 |
472
+ | 1.0 | 63 | 0.3562 | 0.2100 | 0.9584 | - |
473
+ | 2.0 | 126 | 0.1233 | 0.2214 | 0.9462 | - |
474
+ | **3.0** | **189** | **0.0562** | **0.2024** | **0.9609** | **-** |
475
+ | 4.0 | 252 | 0.0221 | 0.1882 | 0.9560 | - |
476
+ | -1 | -1 | - | - | 0.9609 | 0.9561 |
477
+
478
+ * The bold row denotes the saved checkpoint.
479
+
480
+ ### Framework Versions
481
+ - Python: 3.12.12
482
+ - Sentence Transformers: 5.2.3
483
+ - Transformers: 5.0.0
484
+ - PyTorch: 2.10.0+cu128
485
+ - Accelerate: 1.12.0
486
+ - Datasets: 4.8.3
487
+ - Tokenizers: 0.22.2
488
+
489
+ ## Citation
490
+
491
+ ### BibTeX
492
+
493
+ #### Sentence Transformers
494
+ ```bibtex
495
+ @inproceedings{reimers-2019-sentence-bert,
496
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
497
+ author = "Reimers, Nils and Gurevych, Iryna",
498
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
499
+ month = "11",
500
+ year = "2019",
501
+ publisher = "Association for Computational Linguistics",
502
+ url = "https://arxiv.org/abs/1908.10084",
503
+ }
504
+ ```
505
+
506
+ #### MultipleNegativesRankingLoss
507
+ ```bibtex
508
+ @misc{henderson2017efficient,
509
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
510
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
511
+ year={2017},
512
+ eprint={1705.00652},
513
+ archivePrefix={arXiv},
514
+ primaryClass={cs.CL}
515
+ }
516
+ ```
517
+
518
+ <!--
519
+ ## Glossary
520
+
521
+ *Clearly define terms in order to be accessible across audiences.*
522
+ -->
523
+
524
+ <!--
525
+ ## Model Card Authors
526
+
527
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
528
+ -->
529
+
530
+ <!--
531
+ ## Model Card Contact
532
+
533
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
534
+ -->
config.json ADDED
@@ -0,0 +1,68 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_sliding_window_pattern": 6,
3
+ "architectures": [
4
+ "Gemma3TextModel"
5
+ ],
6
+ "attention_bias": false,
7
+ "attention_dropout": 0.0,
8
+ "attn_logit_softcapping": null,
9
+ "bos_token_id": 2,
10
+ "dtype": "float32",
11
+ "eos_token_id": 1,
12
+ "final_logit_softcapping": null,
13
+ "head_dim": 256,
14
+ "hidden_activation": "gelu_pytorch_tanh",
15
+ "hidden_size": 768,
16
+ "initializer_range": 0.02,
17
+ "intermediate_size": 1152,
18
+ "layer_types": [
19
+ "sliding_attention",
20
+ "sliding_attention",
21
+ "sliding_attention",
22
+ "sliding_attention",
23
+ "sliding_attention",
24
+ "full_attention",
25
+ "sliding_attention",
26
+ "sliding_attention",
27
+ "sliding_attention",
28
+ "sliding_attention",
29
+ "sliding_attention",
30
+ "full_attention",
31
+ "sliding_attention",
32
+ "sliding_attention",
33
+ "sliding_attention",
34
+ "sliding_attention",
35
+ "sliding_attention",
36
+ "full_attention",
37
+ "sliding_attention",
38
+ "sliding_attention",
39
+ "sliding_attention",
40
+ "sliding_attention",
41
+ "sliding_attention",
42
+ "full_attention"
43
+ ],
44
+ "max_position_embeddings": 2048,
45
+ "model_type": "gemma3_text",
46
+ "num_attention_heads": 3,
47
+ "num_hidden_layers": 24,
48
+ "num_key_value_heads": 1,
49
+ "pad_token_id": 0,
50
+ "query_pre_attn_scalar": 256,
51
+ "rms_norm_eps": 1e-06,
52
+ "rope_parameters": {
53
+ "full_attention": {
54
+ "rope_theta": 1000000.0,
55
+ "rope_type": "default"
56
+ },
57
+ "sliding_attention": {
58
+ "rope_theta": 10000.0,
59
+ "rope_type": "default"
60
+ }
61
+ },
62
+ "sliding_window": 257,
63
+ "tie_word_embeddings": true,
64
+ "transformers_version": "5.0.0",
65
+ "use_bidirectional_attention": true,
66
+ "use_cache": true,
67
+ "vocab_size": 262144
68
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.2.3",
5
+ "transformers": "5.0.0",
6
+ "pytorch": "2.10.0+cu128"
7
+ },
8
+ "prompts": {
9
+ "query": "task: search result | query: ",
10
+ "document": "title: none | text: ",
11
+ "BitextMining": "task: search result | query: ",
12
+ "Clustering": "task: clustering | query: ",
13
+ "Classification": "task: classification | query: ",
14
+ "InstructionRetrieval": "task: code retrieval | query: ",
15
+ "MultilabelClassification": "task: classification | query: ",
16
+ "PairClassification": "task: sentence similarity | query: ",
17
+ "Reranking": "task: search result | query: ",
18
+ "Retrieval": "task: search result | query: ",
19
+ "Retrieval-query": "task: search result | query: ",
20
+ "Retrieval-document": "title: none | text: ",
21
+ "STS": "task: sentence similarity | query: ",
22
+ "Summarization": "task: summarization | query: "
23
+ },
24
+ "default_prompt_name": null,
25
+ "similarity_fn_name": "cosine"
26
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f240706a64a63615cc1b973d38519a22a0c9dadd1f6b4132f468f49a946f120a
3
+ size 1211486072
modules.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Dense",
18
+ "type": "sentence_transformers.models.Dense"
19
+ },
20
+ {
21
+ "idx": 3,
22
+ "name": "3",
23
+ "path": "3_Dense",
24
+ "type": "sentence_transformers.models.Dense"
25
+ },
26
+ {
27
+ "idx": 4,
28
+ "name": "4",
29
+ "path": "4_Normalize",
30
+ "type": "sentence_transformers.models.Normalize"
31
+ }
32
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:37a36b975fbb51fe36f93e6d156cc4eefbce6d4209aee46c4575cbe9a6a1542e
3
+ size 33385137
tokenizer_config.json ADDED
@@ -0,0 +1,24 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "backend": "tokenizers",
3
+ "boi_token": "<start_of_image>",
4
+ "bos_token": "<bos>",
5
+ "clean_up_tokenization_spaces": false,
6
+ "eoi_token": "<end_of_image>",
7
+ "eos_token": "<eos>",
8
+ "image_token": "<image_soft_token>",
9
+ "is_local": false,
10
+ "mask_token": "<mask>",
11
+ "model_max_length": 2048,
12
+ "model_specific_special_tokens": {
13
+ "boi_token": "<start_of_image>",
14
+ "eoi_token": "<end_of_image>",
15
+ "image_token": "<image_soft_token>"
16
+ },
17
+ "pad_token": "<pad>",
18
+ "padding_side": "right",
19
+ "sp_model_kwargs": null,
20
+ "spaces_between_special_tokens": false,
21
+ "tokenizer_class": "GemmaTokenizer",
22
+ "unk_token": "<unk>",
23
+ "use_default_system_prompt": false
24
+ }