tikanosa commited on
Commit
a085dda
·
verified ·
1 Parent(s): a46a174

Upload folder using huggingface_hub

Browse files
Files changed (8) hide show
  1. README.md +317 -0
  2. config.json +37 -0
  3. merges.txt +0 -0
  4. model.safetensors +3 -0
  5. special_tokens_map.json +51 -0
  6. tokenizer.json +0 -0
  7. tokenizer_config.json +59 -0
  8. vocab.json +0 -0
README.md ADDED
@@ -0,0 +1,317 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - cross-encoder
5
+ - reranker
6
+ - generated_from_trainer
7
+ - dataset_size:753
8
+ - loss:BinaryCrossEntropyLoss
9
+ base_model: cross-encoder/stsb-roberta-base
10
+ pipeline_tag: text-ranking
11
+ library_name: sentence-transformers
12
+ ---
13
+
14
+ # CrossEncoder based on cross-encoder/stsb-roberta-base
15
+
16
+ This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [cross-encoder/stsb-roberta-base](https://huggingface.co/cross-encoder/stsb-roberta-base) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
17
+
18
+ ## Model Details
19
+
20
+ ### Model Description
21
+ - **Model Type:** Cross Encoder
22
+ - **Base model:** [cross-encoder/stsb-roberta-base](https://huggingface.co/cross-encoder/stsb-roberta-base) <!-- at revision d576534b67143e2c70ee9966d7fdbf5835728d13 -->
23
+ - **Maximum Sequence Length:** 512 tokens
24
+ - **Number of Output Labels:** 1 label
25
+ <!-- - **Training Dataset:** Unknown -->
26
+ <!-- - **Language:** Unknown -->
27
+ <!-- - **License:** Unknown -->
28
+
29
+ ### Model Sources
30
+
31
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
32
+ - **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
33
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
34
+ - **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)
35
+
36
+ ## Usage
37
+
38
+ ### Direct Usage (Sentence Transformers)
39
+
40
+ First install the Sentence Transformers library:
41
+
42
+ ```bash
43
+ pip install -U sentence-transformers
44
+ ```
45
+
46
+ Then you can load this model and run inference.
47
+ ```python
48
+ from sentence_transformers import CrossEncoder
49
+
50
+ # Download from the 🤗 Hub
51
+ model = CrossEncoder("cross_encoder_model_id")
52
+ # Get scores for pairs of texts
53
+ pairs = [
54
+ ['PENDIDIKAN TEKNIK INFORMATIKA - Administrasi Jaringan, Algoritma Pemrograman, Artificial Intelligence, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Basis Data, Broadcasting, Capstone Design, Cloud Computing, Fondasi Pendidikan Teknologi dan Vokasional, Grafika Komputer, Ilmu Pendidikan, Interaksi Manusia Komputer, Jaringan Komputer, Keamanan Siber, Kesehatan, Keselamatan dan Lingkungan, Komunikasi Data, Kuliah Kerja Nyata, Kurikulum dan Pembelajaran Teknik Informatika, Logika, Machine Learning, Manajemen Pendidikan, Manajemen Sistem Informasi, Matematika Diskrit, Matematika Teknik, Media Pembelajaran Teknik Informatika, Metodologi Penelitian, Model Pembelajaran Teknik Informatika, Natural Language Processing, Olahraga dan Kebugaran Jasmani, Organisasi dan Arsitektur Komputer, Pancasila, Pembelajaran Mikro, Pemrograman 1, Pemrograman 2, Pemrograman Web, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Inklusi, Pendidikan Kewarganegaraan, Pengembangan Aplikasi Mobile, Pengembangan e-learning, Pengembangan Game, Penilaian Pembelajaran Teknik Informatika, Perakitan dan Instalasi Komputer, Praktik Algoritma Pemrograman, Praktik Artificial Intelligence, Praktik Basis Data, Praktik Industri, Praktik Jaringan Komputer, Praktik Kependidikan, Praktik Komunikasi Data, Praktik Manajemen Sistem Informasi, Praktik Pemrograman 1, Praktik Pemrograman 2, Praktik Rekayasa Perangkat Lunak, Praktik Sistem Digital, Praktik Sistem Pendukung Keputusan, Praktik Struktur Data, Praktik User Interface and User Experience, Proyek Kewirausahaan, Psikologi Pendidikan, Rekayasa Perangkat Lunak, Sistem Digital, Sistem Komunikasi Serat Optik, Sistem Operasi, Sistem Pendukung Keputusan, Sosiologi dan Antropologi Pendidikan, Struktur Data, Teknologi Hijau, Tugas Akhir Sarjana', 'DESAIN KOMUNIKASI VISUAL - Animasi Dasar, Apresiasi Seni dan Budaya, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Dasar Desain Komunikasi Visual (DKV), Desain Antarmuka dan Interaktivitas Digital, Desain Game, Desain Karakter, Desain Kemasan, Desain Komunikasi Visual Citra Visual, Desain Komunikasi Visual Grafis Informasi, Desain Komunikasi Visual Media Promosi, Desain Media Pembelajaran Kreatif, Desain Pameran, Digital Media Periklanan, DKV Projek Desain, Estetika Desain, Etika Profesi, Film Animasi, Fotografi, Fotografi Desain, Gambar Anatomi, Gambar Bentuk, Gambar Proyeksi dan Perspektif, Gambar Sekuensial, Identitas Visual, Ilustrasi, Ilustrasi Desain, Kewirausahaan DKV, Komputer Desain, Kuliah Kerja Nyata, Manajemen Desain, Metodologi Desain, Metodologi Penelitian, Nirmana 2 Dimensi, Nirmana 3 Dimensi, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Pengantar Broadcasting, Perancangan Desain Berkelanjutan, Praktek Industri (Kerja Profesi), Sejarah Desain, Seminar Penelitian dan Penciptaan Desain, Semiotika, Seni Konsep, Sinematografi, Statistika, Teknik Presentasi, Teori Komunikasi, Tinjauan Desain, Tinjauan Potensi Budaya Lokal Industri Kreatif, Tipografi, Tugas Akhir Sarjana, Visual Merchandising'],
55
+ ['PENDIDIKAN TEKNIK INFORMATIKA - Administrasi Jaringan, Algoritma Pemrograman, Artificial Intelligence, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Basis Data, Broadcasting, Capstone Design, Cloud Computing, Fondasi Pendidikan Teknologi dan Vokasional, Grafika Komputer, Ilmu Pendidikan, Interaksi Manusia Komputer, Jaringan Komputer, Keamanan Siber, Kesehatan, Keselamatan dan Lingkungan, Komunikasi Data, Kuliah Kerja Nyata, Kurikulum dan Pembelajaran Teknik Informatika, Logika, Machine Learning, Manajemen Pendidikan, Manajemen Sistem Informasi, Matematika Diskrit, Matematika Teknik, Media Pembelajaran Teknik Informatika, Metodologi Penelitian, Model Pembelajaran Teknik Informatika, Natural Language Processing, Olahraga dan Kebugaran Jasmani, Organisasi dan Arsitektur Komputer, Pancasila, Pembelajaran Mikro, Pemrograman 1, Pemrograman 2, Pemrograman Web, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Inklusi, Pendidikan Kewarganegaraan, Pengembangan Aplikasi Mobile, Pengembangan e-learning, Pengembangan Game, Penilaian Pembelajaran Teknik Informatika, Perakitan dan Instalasi Komputer, Praktik Algoritma Pemrograman, Praktik Artificial Intelligence, Praktik Basis Data, Praktik Industri, Praktik Jaringan Komputer, Praktik Kependidikan, Praktik Komunikasi Data, Praktik Manajemen Sistem Informasi, Praktik Pemrograman 1, Praktik Pemrograman 2, Praktik Rekayasa Perangkat Lunak, Praktik Sistem Digital, Praktik Sistem Pendukung Keputusan, Praktik Struktur Data, Praktik User Interface and User Experience, Proyek Kewirausahaan, Psikologi Pendidikan, Rekayasa Perangkat Lunak, Sistem Digital, Sistem Komunikasi Serat Optik, Sistem Operasi, Sistem Pendukung Keputusan, Sosiologi dan Antropologi Pendidikan, Struktur Data, Teknologi Hijau, Tugas Akhir Sarjana', 'PENDIDIKAN JARAK JAUH PENELITIAN DAN EVALUASI PENDIDIKAN - Basic Growth Mindset Pendidikan, Desain Analisis Kualitatif, Desain dan Analisis Eksperimen, Desain Penelitian Noneksperimen, Evaluasi Program Pendidikan, Filsafat Ilmu, Instrumen Nonkognitif, Konstruksi Instrumen, Manajemen Pengujian, Mata Kuliah Bidang Studi, Metodologi Penelitian, Model Penelitian Evaluasi Kebijakan, Pengantar Analisis Faktor, Pengantar Statistika, Penilaian Berbasis Komputer, Penilaian Kelas, Penulisan Karya Ilmiah, Praktik Evaluasi, Praktik Pengukuran dan Pengujian Berbasis IRT, Proposal Tugas Akhir Magister, Psikologi Pendidikan, Statistika Nonparametrik, Teknik Analisis Data, Teori Tes Klasik, Tugas Akhir Magister'],
56
+ ['ILMU KEOLAHRAGAAN - Adaptasi Latihan, Administrasi Keuangan Olahraga, Aktivitas Aerobik, Aktivitas Jasmani Adaptif, Aktivitas Rekreasi Terapi, Akuatik Adaptif, Analisis Teknologi Keolahragaan, Anatomi, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Biokimia Olahraga, Biomekanika Olahraga, Bulutangkis, Dasar- dasar Terapi Manipulatif, Dasar-dasar Latihan Beban, Dasar-dasar Terapi, Data Analisa, Etika dan Perilaku Olahraga, Evaluasi dan Analisis Kebugaran Jasmani, Filsafat Ilmu, Fisiologi Manusia, Fisiologi Olahraga, Gizi Olahraga, Hukum dan Etika Olahraga, Ilmu Gizi, Ilmu Kesehatan Masyarakat, Ilmu Kesehatan Mental, Industri Olahraga, Karya Ilmiah Olahraga, Kebugaran Jasmani Komponen Motorik, Kesehatan Olahraga, Keterampilan Dasar Atletik, Keterampilan Dasar Bolabasket, Keterampilan Dasar Bolavoli, Keterampilan Dasar Pencaksilat, Keterampilan Dasar Renang, Keterampilan Dasar Senam, Keterampilan Dasar Sepakbola, Kewirausahaan, Kinesiologi, Kinesiologi Adaptif, Komunikasi Olahraga, Kuliah Kerja Nyata, Latihan Beban, Latihan Beban Lanjut, Literasi Digital, Makalah, Manajemen Fasilitas Olahraga, Manajemen Olahraga, Manajemen Olahraga Pariwisata, Manajemen Organisasi Olahraga, Manajemen Pelayanan Kesehatan, Manajemen Sumber Daya Manusia Olahraga, Masase Olahraga, Media dan Jurnalis Olahraga, Metodologi Penelitian, Olahraga dan Kebugaran Jasmani, Olahraga Kontemporer, Olahraga Lansia dan Wanita, Olahraga Rekreasi, Olahraga Terapi Cedera, Olahraga Terapi Penyakit Degeneratif, Olahraga Terapi Penyakit Degeneratif Lanjut, Olahraga Usia Dini, Panahan, Pancasila, Patofisiologi, Pemasaran Olahraga, Pencegahan dan Perawatan Cedera, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katholik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan Anak Berkebutuhan Khusus, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Perencanaan Program Aktivitas Jasmani Adaptif, Perencanaan Program Latihan Kebugaran Jasmani, Perkembangan Motorik, Perkembangan Motorik Adaptif, Praktik Kerja Lapangan, Psikologi Olahraga, Sejarah dan Filsafat Olahraga, Seminar Olahraga, Senam Kontemporer, Sistem Saraf Pusat, Sosiologi Adaptif, Sosiologi Olahraga, Telaah Literatur Olahraga, Tenis Lapangan, Tenis Meja, Teori dan Metodologi Latihan Orkes, Terapi Fisik, Terapi Manipulatif Cedera, Terapi Manipulatif Kebugaran Jasmani, Terapi Manipulatif Penyakit Degeneratif, Terapi Okupasi Anak Difabel, Tes Pengukuran dan Evaluasi Olahraga Kesehatan, Tugas Akhir Sarjana', 'TEKNIK ELEKTRONIKA - Algoritma dan Pemrograman, Analisis dan Pengujian Sistem Elektronika, Bahasa Indonesia, Bahasa Inggris Teknik, Bahasa Inggris Tujuan Khusus, Capstone Project, Computer Vision, Elektronika Dasar, Elektronika Daya dan Motor Listrik, Elektronika Digital, Etika Profesi, Keselamatan, dan Kesehatan Kerja Teknik, Fisika, Internet of Things, Kecerdasan Buatan, Komunikasi Data, Kreativitas, Inovasi dan Kewirausahaan, Manajemen Proyek, Matematika 1, Matematika 2, Metodologi Penelitian, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Pengolahan Sinyal Digital, Praktik Alat Ukur dan Pengukuran, Praktik Algoritma dan Pemrograman, Praktik Computer Vision, Praktik Desain Sistem Elektronika, Praktik Elektronika Dasar, Praktik Elektronika Daya dan Motor Listrik, Praktik Elektronika Digital, Praktik Industri Cerdas, Praktik Industri Mandiri, Praktik Industri Terbimbing, Praktik Integrasi Komputasi Awan dan IoT, Praktik Internet of Things, Praktik Internet of Things Cerdas, Praktik Jaringan Komputer, Praktik Kecerdasan Buatan, Praktik Komputasi Statistik, Praktik Metode Numerik, Praktik Mikrokontroler, Praktik Pemeliharaan Sistem Elektronika, Praktik Pemrograman Komputer, Praktik Pengolahan Sinyal Digital, Praktik Programmable Logic Controller, Praktik Robotika Cerdas, Praktik Robotika Lanjut, Praktik Sensor dan Aktuator, Praktik Sistem Kendali, Praktik Sistem Kendali Cerdas, Praktik Telemetri, Praktikum Sistem Tertanam, Proyek Sistem Elektronika Cerdas 1, Proyek Sistem Elektronika Cerdas 2, Robotika Dasar, Robotika Lanjut, Sensor dan Aktuator, Sistem Kendali, Sistem Kendali Cerdas, Sistem Tertanam, Statistika, Tugas Akhir Sarjana Terapan'],
57
+ ['ADMINISTRASI PERKANTORAN - Analisis Kebijakan Organisasi, Aplikasi Komputer Perkantoran, Bahasa Indonesia, Bahasa Inggris Bisnis, Bahasa Inggris Tujuan Khusus, Corporate Governance, Dasar-dasar Ilmu Administrasi, Ekspor Impor, Etika Bisnis, Etika Profesi Administrasi, Event Organizer, Hubungan Masyarakat, Kepemimpinan, Kesekretarisan, Kolaborasi dan Kerja Sama, Komunikasi Bisnis, Korespondensi Bahasa Indonesia, Korespondensi Bahasa Inggris, Kreativitas, Inovasi, dan Kewirausahaan, Literasi Keuangan, Lobi dan Negosiasi Bisnis, Manajemen Administratif, Manajemen Kearsipan, Manajemen Kesehatan dan Keselamatan Kerja, Manajemen Pemasaran, Manajemen Sektor Publik, Manajemen Stratejik, Manajemen Sumber Daya Manusia, Media Relation, Meetings, Incentives, Conferences, and Exhibitions Industry, Mengetik, Metodologi Penelitian, Multimedia, Olahraga dan Kebugaran Jasmani, Organisasi Manajemen Bisnis, Pancasila, Pelayanan Prima, Pemasaran Digital, Pemecahan Masalah dan Pengambilan Keputusan, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembanguan Berkelanjutan, Pendidikan Kewarganegaraan, Pengantar Administrasi Bisnis, Pengantar Akuntansi, Pengantar Hukum Bisnis, Pengantar Komunikasi, Pengembangan Diri, Pengembangan Web Dasar, Pengolahan Basis Data, Penulisan Karya Ilmiah, Perbankan, Percakapan Bahasa Inggris, Perilaku Organisasional, Perpajakan, Praktik Industri Mandiri, Praktik Industri Terbimbing, Public Speaking, Simulasi Bisnis, Simulasi Perkantoran, Sistem Informasi Manajemen, Sistem Manajemen Mutu, Statistika, Teknologi Perkantoran, Tugas Akhir Sarjana Terapan', 'ADMINISTRASI PERKANTORAN - Analisis Kebijakan Organisasi, Aplikasi Komputer Perkantoran, Bahasa Indonesia, Bahasa Inggris Bisnis, Bahasa Inggris Tujuan Khusus, Corporate Governance, Dasar-dasar Ilmu Administrasi, Ekspor Impor, Etika Bisnis, Etika Profesi Administrasi, Event Organizer, Hubungan Masyarakat, Kepemimpinan, Kesekretarisan, Kolaborasi dan Kerja Sama, Komunikasi Bisnis, Korespondensi Bahasa Indonesia, Korespondensi Bahasa Inggris, Kreativitas, Inovasi, dan Kewirausahaan, Literasi Keuangan, Lobi dan Negosiasi Bisnis, Manajemen Administratif, Manajemen Kearsipan, Manajemen Kesehatan dan Keselamatan Kerja, Manajemen Pemasaran, Manajemen Sektor Publik, Manajemen Stratejik, Manajemen Sumber Daya Manusia, Media Relation, Meetings, Incentives, Conferences, and Exhibitions Industry, Mengetik, Metodologi Penelitian, Multimedia, Olahraga dan Kebugaran Jasmani, Organisasi Manajemen Bisnis, Pancasila, Pelayanan Prima, Pemasaran Digital, Pemecahan Masalah dan Pengambilan Keputusan, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembanguan Berkelanjutan, Pendidikan Kewarganegaraan, Pengantar Administrasi Bisnis, Pengantar Akuntansi, Pengantar Hukum Bisnis, Pengantar Komunikasi, Pengembangan Diri, Pengembangan Web Dasar, Pengolahan Basis Data, Penulisan Karya Ilmiah, Perbankan, Percakapan Bahasa Inggris, Perilaku Organisasional, Perpajakan, Praktik Industri Mandiri, Praktik Industri Terbimbing, Public Speaking, Simulasi Bisnis, Simulasi Perkantoran, Sistem Informasi Manajemen, Sistem Manajemen Mutu, Statistika, Teknologi Perkantoran, Tugas Akhir Sarjana Terapan'],
58
+ ['PENDIDIKAN JASMANI SEKOLAH DASAR - Administrasi dan Organisasi Olahraga, Aktivitas Ritmik Sekolah Dasar, Anatomi Manusia, Asesmen Olahraga, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Bulutangkis, Dasar -dasar Gizi, Dasar-Dasar Pendidikan Jasmani, Desain Sarana dan Prasarana Pembelajaran, Fisiologi Manusia, Fisiologi Olahraga, Futsal, Ilmu Pendidikan, Kepramukaan dan Aktivitas Luar Kelas, Keterampilan Dasar Atletik, Keterampilan Dasar Pencak Silat, Keterampilan Dasar Renang, Keterampilan Dasar Senam, Kinesiologi, Kurikulum dan Pembelajaran PJSD, Literasi Aktivitas Fisik, Literasi Digital, Manajemen dan Praktikum UKS, Manajemen Ekstrakulikuler Olahraga Sekolah Dasar, Manajemen Pendidikan, Masase dan Pencegahan Penanganan Cidera, Media Pembelajaran PJSD, Metodologi Penelitian, Model Pembelajaran PJSD, Olahraga dan Kebugaran Jasmani, Panahan, Pancasila, Pemanduan Siswa Berbakat, Pembelajaran Akuatik Sekolah Dasar, Pembelajaran Atletik Sekolah Dasar, Pembelajaran Mikro PJSD, Pembelajaran Motorik, Pembelajaran Olahraga Permainan, Pembelajaran Senam Sekolah Dasar, Pendidikan Agama Buddha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Inklusi, Pendidikan Jasmani Adaptif dan Olahraga Disabilitas, Pendidikan Kesehatan Sekolah Dasar, Pendidikan Kewarganegaraan, Pengembangan Kemampuan Gerak Dasar, Penilaian Pembelajaran PJSD, Perencanaan Pembelajaran Penjas, Perkembangan Motorik, Permainan Bola Basket, Permainan Bola Voli, Permainan dan Olahraga Tradisional, Permainan Sepak Bola, Persiapan Profesi Guru Penjas Sekolah Dasar, Petanque, Psikologi Olahraga, Psikologi Pendidikan, Sejarah dan Filsafat Pendidikan Jasmani, Sepak Takraw, Softball, Sosiologi dan Antropologi Pendidikan, Sosiologi Olahraga, Statistika Pendidikan Jasmani, Strategi Pembelajaran PJSD, Teknologi Pembelajaran PJSD, Tenis Lapangan, Tenis Meja, Teori Bermain, Tugas Akhir Sarjana', 'PENDIDIKAN TEKNIK ELEKTRONIKA DAN INFORMATIKA - Deep Learning dan Natural Language Processing, Desain dan Pengembangan Aplikasi Web, Desain Kurikulum dan Metodologi Pembelajaran Vokasional, Evaluasi dan Asesmen Pembelajaran Vokasional, Filsafat Ilmu dan Etika Profesi, Ilmu Pendidikan, Keamanan Siber dan Blockchain, Kecerdasan Buatan, Komputasi Edge dan Cloud, Management Jaringan Komputer, Manajemen Pendidikan dan Pelatihan Vokasional, Manajemen Sistem Informasi, Metodologi Penelitian, Pemrograman Lanjut untuk Rekayasa Perangkat Lunak, Penambangan Data dan Big Data, Pengolahan Sinyal dan Citra Digital, Penulisan Karya Ilmiah, Proposal dan Seminar Tugas Akhir Magister, Psikologi Pendidikan, Robotika dan Automasi Industri, Sistem Multimedia, Sistem Ternam dan Internet of Things, Statistika, Teknologi Kesehatan dan Elektronika Medis, Teknologi Seluler dan Komunikasi Nirkabel, Teknopreneur dan Startup Digital, Tugas Akhir Magister, User Experience Design'],
59
+ ]
60
+ scores = model.predict(pairs)
61
+ print(scores.shape)
62
+ # (5,)
63
+
64
+ # Or rank different texts based on similarity to a single text
65
+ ranks = model.rank(
66
+ 'PENDIDIKAN TEKNIK INFORMATIKA - Administrasi Jaringan, Algoritma Pemrograman, Artificial Intelligence, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Basis Data, Broadcasting, Capstone Design, Cloud Computing, Fondasi Pendidikan Teknologi dan Vokasional, Grafika Komputer, Ilmu Pendidikan, Interaksi Manusia Komputer, Jaringan Komputer, Keamanan Siber, Kesehatan, Keselamatan dan Lingkungan, Komunikasi Data, Kuliah Kerja Nyata, Kurikulum dan Pembelajaran Teknik Informatika, Logika, Machine Learning, Manajemen Pendidikan, Manajemen Sistem Informasi, Matematika Diskrit, Matematika Teknik, Media Pembelajaran Teknik Informatika, Metodologi Penelitian, Model Pembelajaran Teknik Informatika, Natural Language Processing, Olahraga dan Kebugaran Jasmani, Organisasi dan Arsitektur Komputer, Pancasila, Pembelajaran Mikro, Pemrograman 1, Pemrograman 2, Pemrograman Web, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Inklusi, Pendidikan Kewarganegaraan, Pengembangan Aplikasi Mobile, Pengembangan e-learning, Pengembangan Game, Penilaian Pembelajaran Teknik Informatika, Perakitan dan Instalasi Komputer, Praktik Algoritma Pemrograman, Praktik Artificial Intelligence, Praktik Basis Data, Praktik Industri, Praktik Jaringan Komputer, Praktik Kependidikan, Praktik Komunikasi Data, Praktik Manajemen Sistem Informasi, Praktik Pemrograman 1, Praktik Pemrograman 2, Praktik Rekayasa Perangkat Lunak, Praktik Sistem Digital, Praktik Sistem Pendukung Keputusan, Praktik Struktur Data, Praktik User Interface and User Experience, Proyek Kewirausahaan, Psikologi Pendidikan, Rekayasa Perangkat Lunak, Sistem Digital, Sistem Komunikasi Serat Optik, Sistem Operasi, Sistem Pendukung Keputusan, Sosiologi dan Antropologi Pendidikan, Struktur Data, Teknologi Hijau, Tugas Akhir Sarjana',
67
+ [
68
+ 'DESAIN KOMUNIKASI VISUAL - Animasi Dasar, Apresiasi Seni dan Budaya, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Dasar Desain Komunikasi Visual (DKV), Desain Antarmuka dan Interaktivitas Digital, Desain Game, Desain Karakter, Desain Kemasan, Desain Komunikasi Visual Citra Visual, Desain Komunikasi Visual Grafis Informasi, Desain Komunikasi Visual Media Promosi, Desain Media Pembelajaran Kreatif, Desain Pameran, Digital Media Periklanan, DKV Projek Desain, Estetika Desain, Etika Profesi, Film Animasi, Fotografi, Fotografi Desain, Gambar Anatomi, Gambar Bentuk, Gambar Proyeksi dan Perspektif, Gambar Sekuensial, Identitas Visual, Ilustrasi, Ilustrasi Desain, Kewirausahaan DKV, Komputer Desain, Kuliah Kerja Nyata, Manajemen Desain, Metodologi Desain, Metodologi Penelitian, Nirmana 2 Dimensi, Nirmana 3 Dimensi, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Pengantar Broadcasting, Perancangan Desain Berkelanjutan, Praktek Industri (Kerja Profesi), Sejarah Desain, Seminar Penelitian dan Penciptaan Desain, Semiotika, Seni Konsep, Sinematografi, Statistika, Teknik Presentasi, Teori Komunikasi, Tinjauan Desain, Tinjauan Potensi Budaya Lokal Industri Kreatif, Tipografi, Tugas Akhir Sarjana, Visual Merchandising',
69
+ 'PENDIDIKAN JARAK JAUH PENELITIAN DAN EVALUASI PENDIDIKAN - Basic Growth Mindset Pendidikan, Desain Analisis Kualitatif, Desain dan Analisis Eksperimen, Desain Penelitian Noneksperimen, Evaluasi Program Pendidikan, Filsafat Ilmu, Instrumen Nonkognitif, Konstruksi Instrumen, Manajemen Pengujian, Mata Kuliah Bidang Studi, Metodologi Penelitian, Model Penelitian Evaluasi Kebijakan, Pengantar Analisis Faktor, Pengantar Statistika, Penilaian Berbasis Komputer, Penilaian Kelas, Penulisan Karya Ilmiah, Praktik Evaluasi, Praktik Pengukuran dan Pengujian Berbasis IRT, Proposal Tugas Akhir Magister, Psikologi Pendidikan, Statistika Nonparametrik, Teknik Analisis Data, Teori Tes Klasik, Tugas Akhir Magister',
70
+ 'TEKNIK ELEKTRONIKA - Algoritma dan Pemrograman, Analisis dan Pengujian Sistem Elektronika, Bahasa Indonesia, Bahasa Inggris Teknik, Bahasa Inggris Tujuan Khusus, Capstone Project, Computer Vision, Elektronika Dasar, Elektronika Daya dan Motor Listrik, Elektronika Digital, Etika Profesi, Keselamatan, dan Kesehatan Kerja Teknik, Fisika, Internet of Things, Kecerdasan Buatan, Komunikasi Data, Kreativitas, Inovasi dan Kewirausahaan, Manajemen Proyek, Matematika 1, Matematika 2, Metodologi Penelitian, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Pengolahan Sinyal Digital, Praktik Alat Ukur dan Pengukuran, Praktik Algoritma dan Pemrograman, Praktik Computer Vision, Praktik Desain Sistem Elektronika, Praktik Elektronika Dasar, Praktik Elektronika Daya dan Motor Listrik, Praktik Elektronika Digital, Praktik Industri Cerdas, Praktik Industri Mandiri, Praktik Industri Terbimbing, Praktik Integrasi Komputasi Awan dan IoT, Praktik Internet of Things, Praktik Internet of Things Cerdas, Praktik Jaringan Komputer, Praktik Kecerdasan Buatan, Praktik Komputasi Statistik, Praktik Metode Numerik, Praktik Mikrokontroler, Praktik Pemeliharaan Sistem Elektronika, Praktik Pemrograman Komputer, Praktik Pengolahan Sinyal Digital, Praktik Programmable Logic Controller, Praktik Robotika Cerdas, Praktik Robotika Lanjut, Praktik Sensor dan Aktuator, Praktik Sistem Kendali, Praktik Sistem Kendali Cerdas, Praktik Telemetri, Praktikum Sistem Tertanam, Proyek Sistem Elektronika Cerdas 1, Proyek Sistem Elektronika Cerdas 2, Robotika Dasar, Robotika Lanjut, Sensor dan Aktuator, Sistem Kendali, Sistem Kendali Cerdas, Sistem Tertanam, Statistika, Tugas Akhir Sarjana Terapan',
71
+ 'ADMINISTRASI PERKANTORAN - Analisis Kebijakan Organisasi, Aplikasi Komputer Perkantoran, Bahasa Indonesia, Bahasa Inggris Bisnis, Bahasa Inggris Tujuan Khusus, Corporate Governance, Dasar-dasar Ilmu Administrasi, Ekspor Impor, Etika Bisnis, Etika Profesi Administrasi, Event Organizer, Hubungan Masyarakat, Kepemimpinan, Kesekretarisan, Kolaborasi dan Kerja Sama, Komunikasi Bisnis, Korespondensi Bahasa Indonesia, Korespondensi Bahasa Inggris, Kreativitas, Inovasi, dan Kewirausahaan, Literasi Keuangan, Lobi dan Negosiasi Bisnis, Manajemen Administratif, Manajemen Kearsipan, Manajemen Kesehatan dan Keselamatan Kerja, Manajemen Pemasaran, Manajemen Sektor Publik, Manajemen Stratejik, Manajemen Sumber Daya Manusia, Media Relation, Meetings, Incentives, Conferences, and Exhibitions Industry, Mengetik, Metodologi Penelitian, Multimedia, Olahraga dan Kebugaran Jasmani, Organisasi Manajemen Bisnis, Pancasila, Pelayanan Prima, Pemasaran Digital, Pemecahan Masalah dan Pengambilan Keputusan, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembanguan Berkelanjutan, Pendidikan Kewarganegaraan, Pengantar Administrasi Bisnis, Pengantar Akuntansi, Pengantar Hukum Bisnis, Pengantar Komunikasi, Pengembangan Diri, Pengembangan Web Dasar, Pengolahan Basis Data, Penulisan Karya Ilmiah, Perbankan, Percakapan Bahasa Inggris, Perilaku Organisasional, Perpajakan, Praktik Industri Mandiri, Praktik Industri Terbimbing, Public Speaking, Simulasi Bisnis, Simulasi Perkantoran, Sistem Informasi Manajemen, Sistem Manajemen Mutu, Statistika, Teknologi Perkantoran, Tugas Akhir Sarjana Terapan',
72
+ 'PENDIDIKAN TEKNIK ELEKTRONIKA DAN INFORMATIKA - Deep Learning dan Natural Language Processing, Desain dan Pengembangan Aplikasi Web, Desain Kurikulum dan Metodologi Pembelajaran Vokasional, Evaluasi dan Asesmen Pembelajaran Vokasional, Filsafat Ilmu dan Etika Profesi, Ilmu Pendidikan, Keamanan Siber dan Blockchain, Kecerdasan Buatan, Komputasi Edge dan Cloud, Management Jaringan Komputer, Manajemen Pendidikan dan Pelatihan Vokasional, Manajemen Sistem Informasi, Metodologi Penelitian, Pemrograman Lanjut untuk Rekayasa Perangkat Lunak, Penambangan Data dan Big Data, Pengolahan Sinyal dan Citra Digital, Penulisan Karya Ilmiah, Proposal dan Seminar Tugas Akhir Magister, Psikologi Pendidikan, Robotika dan Automasi Industri, Sistem Multimedia, Sistem Ternam dan Internet of Things, Statistika, Teknologi Kesehatan dan Elektronika Medis, Teknologi Seluler dan Komunikasi Nirkabel, Teknopreneur dan Startup Digital, Tugas Akhir Magister, User Experience Design',
73
+ ]
74
+ )
75
+ # [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
76
+ ```
77
+
78
+ <!--
79
+ ### Direct Usage (Transformers)
80
+
81
+ <details><summary>Click to see the direct usage in Transformers</summary>
82
+
83
+ </details>
84
+ -->
85
+
86
+ <!--
87
+ ### Downstream Usage (Sentence Transformers)
88
+
89
+ You can finetune this model on your own dataset.
90
+
91
+ <details><summary>Click to expand</summary>
92
+
93
+ </details>
94
+ -->
95
+
96
+ <!--
97
+ ### Out-of-Scope Use
98
+
99
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
100
+ -->
101
+
102
+ <!--
103
+ ## Bias, Risks and Limitations
104
+
105
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
106
+ -->
107
+
108
+ <!--
109
+ ### Recommendations
110
+
111
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
112
+ -->
113
+
114
+ ## Training Details
115
+
116
+ ### Training Dataset
117
+
118
+ #### Unnamed Dataset
119
+
120
+ * Size: 753 training samples
121
+ * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
122
+ * Approximate statistics based on the first 753 samples:
123
+ | | sentence_0 | sentence_1 | label |
124
+ |:--------|:----------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:---------------------------------------------------------------|
125
+ | type | string | string | float |
126
+ | details | <ul><li>min: 314 characters</li><li>mean: 2064.59 characters</li><li>max: 6676 characters</li></ul> | <ul><li>min: 314 characters</li><li>mean: 1799.48 characters</li><li>max: 6676 characters</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.18</li><li>max: 2.0</li></ul> |
127
+ * Samples:
128
+ | sentence_0 | sentence_1 | label |
129
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
130
+ | <code>PENDIDIKAN TEKNIK INFORMATIKA - Administrasi Jaringan, Algoritma Pemrograman, Artificial Intelligence, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Basis Data, Broadcasting, Capstone Design, Cloud Computing, Fondasi Pendidikan Teknologi dan Vokasional, Grafika Komputer, Ilmu Pendidikan, Interaksi Manusia Komputer, Jaringan Komputer, Keamanan Siber, Kesehatan, Keselamatan dan Lingkungan, Komunikasi Data, Kuliah Kerja Nyata, Kurikulum dan Pembelajaran Teknik Informatika, Logika, Machine Learning, Manajemen Pendidikan, Manajemen Sistem Informasi, Matematika Diskrit, Matematika Teknik, Media Pembelajaran Teknik Informatika, Metodologi Penelitian, Model Pembelajaran Teknik Informatika, Natural Language Processing, Olahraga dan Kebugaran Jasmani, Organisasi dan Arsitektur Komputer, Pancasila, Pembelajaran Mikro, Pemrograman 1, Pemrograman 2, Pemrograman Web, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidi...</code> | <code>DESAIN KOMUNIKASI VISUAL - Animasi Dasar, Apresiasi Seni dan Budaya, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Dasar Desain Komunikasi Visual (DKV), Desain Antarmuka dan Interaktivitas Digital, Desain Game, Desain Karakter, Desain Kemasan, Desain Komunikasi Visual Citra Visual, Desain Komunikasi Visual Grafis Informasi, Desain Komunikasi Visual Media Promosi, Desain Media Pembelajaran Kreatif, Desain Pameran, Digital Media Periklanan, DKV Projek Desain, Estetika Desain, Etika Profesi, Film Animasi, Fotografi, Fotografi Desain, Gambar Anatomi, Gambar Bentuk, Gambar Proyeksi dan Perspektif, Gambar Sekuensial, Identitas Visual, Ilustrasi, Ilustrasi Desain, Kewirausahaan DKV, Komputer Desain, Kuliah Kerja Nyata, Manajemen Desain, Metodologi Desain, Metodologi Penelitian, Nirmana 2 Dimensi, Nirmana 3 Dimensi, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan...</code> | <code>0.0</code> |
131
+ | <code>PENDIDIKAN TEKNIK INFORMATIKA - Administrasi Jaringan, Algoritma Pemrograman, Artificial Intelligence, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Basis Data, Broadcasting, Capstone Design, Cloud Computing, Fondasi Pendidikan Teknologi dan Vokasional, Grafika Komputer, Ilmu Pendidikan, Interaksi Manusia Komputer, Jaringan Komputer, Keamanan Siber, Kesehatan, Keselamatan dan Lingkungan, Komunikasi Data, Kuliah Kerja Nyata, Kurikulum dan Pembelajaran Teknik Informatika, Logika, Machine Learning, Manajemen Pendidikan, Manajemen Sistem Informasi, Matematika Diskrit, Matematika Teknik, Media Pembelajaran Teknik Informatika, Metodologi Penelitian, Model Pembelajaran Teknik Informatika, Natural Language Processing, Olahraga dan Kebugaran Jasmani, Organisasi dan Arsitektur Komputer, Pancasila, Pembelajaran Mikro, Pemrograman 1, Pemrograman 2, Pemrograman Web, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidi...</code> | <code>PENDIDIKAN JARAK JAUH PENELITIAN DAN EVALUASI PENDIDIKAN - Basic Growth Mindset Pendidikan, Desain Analisis Kualitatif, Desain dan Analisis Eksperimen, Desain Penelitian Noneksperimen, Evaluasi Program Pendidikan, Filsafat Ilmu, Instrumen Nonkognitif, Konstruksi Instrumen, Manajemen Pengujian, Mata Kuliah Bidang Studi, Metodologi Penelitian, Model Penelitian Evaluasi Kebijakan, Pengantar Analisis Faktor, Pengantar Statistika, Penilaian Berbasis Komputer, Penilaian Kelas, Penulisan Karya Ilmiah, Praktik Evaluasi, Praktik Pengukuran dan Pengujian Berbasis IRT, Proposal Tugas Akhir Magister, Psikologi Pendidikan, Statistika Nonparametrik, Teknik Analisis Data, Teori Tes Klasik, Tugas Akhir Magister</code> | <code>0.0</code> |
132
+ | <code>ILMU KEOLAHRAGAAN - Adaptasi Latihan, Administrasi Keuangan Olahraga, Aktivitas Aerobik, Aktivitas Jasmani Adaptif, Aktivitas Rekreasi Terapi, Akuatik Adaptif, Analisis Teknologi Keolahragaan, Anatomi, Bahasa Indonesia, Bahasa Inggris Tujuan Khusus, Biokimia Olahraga, Biomekanika Olahraga, Bulutangkis, Dasar- dasar Terapi Manipulatif, Dasar-dasar Latihan Beban, Dasar-dasar Terapi, Data Analisa, Etika dan Perilaku Olahraga, Evaluasi dan Analisis Kebugaran Jasmani, Filsafat Ilmu, Fisiologi Manusia, Fisiologi Olahraga, Gizi Olahraga, Hukum dan Etika Olahraga, Ilmu Gizi, Ilmu Kesehatan Masyarakat, Ilmu Kesehatan Mental, Industri Olahraga, Karya Ilmiah Olahraga, Kebugaran Jasmani Komponen Motorik, Kesehatan Olahraga, Keterampilan Dasar Atletik, Keterampilan Dasar Bolabasket, Keterampilan Dasar Bolavoli, Keterampilan Dasar Pencaksilat, Keterampilan Dasar Renang, Keterampilan Dasar Senam, Keterampilan Dasar Sepakbola, Kewirausahaan, Kinesiologi, Kinesiologi Adaptif, Komunikasi Olahraga, Kulia...</code> | <code>TEKNIK ELEKTRONIKA - Algoritma dan Pemrograman, Analisis dan Pengujian Sistem Elektronika, Bahasa Indonesia, Bahasa Inggris Teknik, Bahasa Inggris Tujuan Khusus, Capstone Project, Computer Vision, Elektronika Dasar, Elektronika Daya dan Motor Listrik, Elektronika Digital, Etika Profesi, Keselamatan, dan Kesehatan Kerja Teknik, Fisika, Internet of Things, Kecerdasan Buatan, Komunikasi Data, Kreativitas, Inovasi dan Kewirausahaan, Manajemen Proyek, Matematika 1, Matematika 2, Metodologi Penelitian, Olahraga dan Kebugaran Jasmani, Pancasila, Pendidikan Agama Budha, Pendidikan Agama Hindu, Pendidikan Agama Islam, Pendidikan Agama Katolik, Pendidikan Agama Konghucu, Pendidikan Agama Kristen Protestan, Pendidikan dan Pembangunan Berkelanjutan, Pendidikan Kewarganegaraan, Pengolahan Sinyal Digital, Praktik Alat Ukur dan Pengukuran, Praktik Algoritma dan Pemrograman, Praktik Computer Vision, Praktik Desain Sistem Elektronika, Praktik Elektronika Dasar, Praktik Elektronika Daya dan Motor Listri...</code> | <code>0.0</code> |
133
+ * Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
134
+ ```json
135
+ {
136
+ "activation_fn": "torch.nn.modules.linear.Identity",
137
+ "pos_weight": null
138
+ }
139
+ ```
140
+
141
+ ### Training Hyperparameters
142
+ #### Non-Default Hyperparameters
143
+
144
+ - `num_train_epochs`: 10
145
+
146
+ #### All Hyperparameters
147
+ <details><summary>Click to expand</summary>
148
+
149
+ - `overwrite_output_dir`: False
150
+ - `do_predict`: False
151
+ - `eval_strategy`: no
152
+ - `prediction_loss_only`: True
153
+ - `per_device_train_batch_size`: 8
154
+ - `per_device_eval_batch_size`: 8
155
+ - `per_gpu_train_batch_size`: None
156
+ - `per_gpu_eval_batch_size`: None
157
+ - `gradient_accumulation_steps`: 1
158
+ - `eval_accumulation_steps`: None
159
+ - `torch_empty_cache_steps`: None
160
+ - `learning_rate`: 5e-05
161
+ - `weight_decay`: 0.0
162
+ - `adam_beta1`: 0.9
163
+ - `adam_beta2`: 0.999
164
+ - `adam_epsilon`: 1e-08
165
+ - `max_grad_norm`: 1
166
+ - `num_train_epochs`: 10
167
+ - `max_steps`: -1
168
+ - `lr_scheduler_type`: linear
169
+ - `lr_scheduler_kwargs`: {}
170
+ - `warmup_ratio`: 0.0
171
+ - `warmup_steps`: 0
172
+ - `log_level`: passive
173
+ - `log_level_replica`: warning
174
+ - `log_on_each_node`: True
175
+ - `logging_nan_inf_filter`: True
176
+ - `save_safetensors`: True
177
+ - `save_on_each_node`: False
178
+ - `save_only_model`: False
179
+ - `restore_callback_states_from_checkpoint`: False
180
+ - `no_cuda`: False
181
+ - `use_cpu`: False
182
+ - `use_mps_device`: False
183
+ - `seed`: 42
184
+ - `data_seed`: None
185
+ - `jit_mode_eval`: False
186
+ - `use_ipex`: False
187
+ - `bf16`: False
188
+ - `fp16`: False
189
+ - `fp16_opt_level`: O1
190
+ - `half_precision_backend`: auto
191
+ - `bf16_full_eval`: False
192
+ - `fp16_full_eval`: False
193
+ - `tf32`: None
194
+ - `local_rank`: 0
195
+ - `ddp_backend`: None
196
+ - `tpu_num_cores`: None
197
+ - `tpu_metrics_debug`: False
198
+ - `debug`: []
199
+ - `dataloader_drop_last`: False
200
+ - `dataloader_num_workers`: 0
201
+ - `dataloader_prefetch_factor`: None
202
+ - `past_index`: -1
203
+ - `disable_tqdm`: False
204
+ - `remove_unused_columns`: True
205
+ - `label_names`: None
206
+ - `load_best_model_at_end`: False
207
+ - `ignore_data_skip`: False
208
+ - `fsdp`: []
209
+ - `fsdp_min_num_params`: 0
210
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
211
+ - `fsdp_transformer_layer_cls_to_wrap`: None
212
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
213
+ - `deepspeed`: None
214
+ - `label_smoothing_factor`: 0.0
215
+ - `optim`: adamw_torch_fused
216
+ - `optim_args`: None
217
+ - `adafactor`: False
218
+ - `group_by_length`: False
219
+ - `length_column_name`: length
220
+ - `ddp_find_unused_parameters`: None
221
+ - `ddp_bucket_cap_mb`: None
222
+ - `ddp_broadcast_buffers`: False
223
+ - `dataloader_pin_memory`: True
224
+ - `dataloader_persistent_workers`: False
225
+ - `skip_memory_metrics`: True
226
+ - `use_legacy_prediction_loop`: False
227
+ - `push_to_hub`: False
228
+ - `resume_from_checkpoint`: None
229
+ - `hub_model_id`: None
230
+ - `hub_strategy`: every_save
231
+ - `hub_private_repo`: None
232
+ - `hub_always_push`: False
233
+ - `hub_revision`: None
234
+ - `gradient_checkpointing`: False
235
+ - `gradient_checkpointing_kwargs`: None
236
+ - `include_inputs_for_metrics`: False
237
+ - `include_for_metrics`: []
238
+ - `eval_do_concat_batches`: True
239
+ - `fp16_backend`: auto
240
+ - `push_to_hub_model_id`: None
241
+ - `push_to_hub_organization`: None
242
+ - `mp_parameters`:
243
+ - `auto_find_batch_size`: False
244
+ - `full_determinism`: False
245
+ - `torchdynamo`: None
246
+ - `ray_scope`: last
247
+ - `ddp_timeout`: 1800
248
+ - `torch_compile`: False
249
+ - `torch_compile_backend`: None
250
+ - `torch_compile_mode`: None
251
+ - `include_tokens_per_second`: False
252
+ - `include_num_input_tokens_seen`: False
253
+ - `neftune_noise_alpha`: None
254
+ - `optim_target_modules`: None
255
+ - `batch_eval_metrics`: False
256
+ - `eval_on_start`: False
257
+ - `use_liger_kernel`: False
258
+ - `liger_kernel_config`: None
259
+ - `eval_use_gather_object`: False
260
+ - `average_tokens_across_devices`: False
261
+ - `prompts`: None
262
+ - `batch_sampler`: batch_sampler
263
+ - `multi_dataset_batch_sampler`: proportional
264
+ - `router_mapping`: {}
265
+ - `learning_rate_mapping`: {}
266
+
267
+ </details>
268
+
269
+ ### Training Logs
270
+ | Epoch | Step | Training Loss |
271
+ |:------:|:----:|:-------------:|
272
+ | 5.2632 | 500 | 0.2 |
273
+
274
+
275
+ ### Framework Versions
276
+ - Python: 3.12.11
277
+ - Sentence Transformers: 5.1.0
278
+ - Transformers: 4.55.4
279
+ - PyTorch: 2.8.0+cu126
280
+ - Accelerate: 1.10.1
281
+ - Datasets: 4.0.0
282
+ - Tokenizers: 0.21.4
283
+
284
+ ## Citation
285
+
286
+ ### BibTeX
287
+
288
+ #### Sentence Transformers
289
+ ```bibtex
290
+ @inproceedings{reimers-2019-sentence-bert,
291
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
292
+ author = "Reimers, Nils and Gurevych, Iryna",
293
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
294
+ month = "11",
295
+ year = "2019",
296
+ publisher = "Association for Computational Linguistics",
297
+ url = "https://arxiv.org/abs/1908.10084",
298
+ }
299
+ ```
300
+
301
+ <!--
302
+ ## Glossary
303
+
304
+ *Clearly define terms in order to be accessible across audiences.*
305
+ -->
306
+
307
+ <!--
308
+ ## Model Card Authors
309
+
310
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
311
+ -->
312
+
313
+ <!--
314
+ ## Model Card Contact
315
+
316
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
317
+ -->
config.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "RobertaForSequenceClassification"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "eos_token_id": 2,
9
+ "gradient_checkpointing": false,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "id2label": {
14
+ "0": "LABEL_0"
15
+ },
16
+ "initializer_range": 0.02,
17
+ "intermediate_size": 3072,
18
+ "label2id": {
19
+ "LABEL_0": 0
20
+ },
21
+ "layer_norm_eps": 1e-05,
22
+ "max_position_embeddings": 514,
23
+ "model_type": "roberta",
24
+ "num_attention_heads": 12,
25
+ "num_hidden_layers": 12,
26
+ "pad_token_id": 1,
27
+ "position_embedding_type": "absolute",
28
+ "sentence_transformers": {
29
+ "activation_fn": "torch.nn.modules.activation.Sigmoid",
30
+ "version": "5.1.0"
31
+ },
32
+ "torch_dtype": "float32",
33
+ "transformers_version": "4.55.4",
34
+ "type_vocab_size": 1,
35
+ "use_cache": true,
36
+ "vocab_size": 50265
37
+ }
merges.txt ADDED
The diff for this file is too large to render. See raw diff
 
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1f9f7ebf49c910b7db9d018f14f2a69b1ff816c87f37c0e0be21b1fc8f870277
3
+ size 498609748
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": true,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": true,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": true,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": true,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": true,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": true,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": true,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,59 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": false,
3
+ "added_tokens_decoder": {
4
+ "0": {
5
+ "content": "<s>",
6
+ "lstrip": false,
7
+ "normalized": true,
8
+ "rstrip": false,
9
+ "single_word": false,
10
+ "special": true
11
+ },
12
+ "1": {
13
+ "content": "<pad>",
14
+ "lstrip": false,
15
+ "normalized": true,
16
+ "rstrip": false,
17
+ "single_word": false,
18
+ "special": true
19
+ },
20
+ "2": {
21
+ "content": "</s>",
22
+ "lstrip": false,
23
+ "normalized": true,
24
+ "rstrip": false,
25
+ "single_word": false,
26
+ "special": true
27
+ },
28
+ "3": {
29
+ "content": "<unk>",
30
+ "lstrip": false,
31
+ "normalized": true,
32
+ "rstrip": false,
33
+ "single_word": false,
34
+ "special": true
35
+ },
36
+ "50264": {
37
+ "content": "<mask>",
38
+ "lstrip": true,
39
+ "normalized": true,
40
+ "rstrip": false,
41
+ "single_word": false,
42
+ "special": true
43
+ }
44
+ },
45
+ "bos_token": "<s>",
46
+ "clean_up_tokenization_spaces": false,
47
+ "cls_token": "<s>",
48
+ "eos_token": "</s>",
49
+ "errors": "replace",
50
+ "extra_special_tokens": {},
51
+ "full_tokenizer_file": null,
52
+ "mask_token": "<mask>",
53
+ "model_max_length": 512,
54
+ "pad_token": "<pad>",
55
+ "sep_token": "</s>",
56
+ "tokenizer_class": "RobertaTokenizer",
57
+ "trim_offsets": true,
58
+ "unk_token": "<unk>"
59
+ }
vocab.json ADDED
The diff for this file is too large to render. See raw diff