Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
dense
Generated from Trainer
dataset_size:2004
loss:MultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use TextModel/E5_Law-v4-Indo with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use TextModel/E5_Law-v4-Indo with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("TextModel/E5_Law-v4-Indo") sentences = [ "query: Seorang pria bernama Eko Santoso di Kota Semarang pada tahun 2024 secara terang-terangan di hadapan kerumunan massa di alun-alun kota menyampaikan orasi yang berisi hasutan untuk melakukan diskriminasi terhadap penganut agama tertentu yang ada di Indonesia, dengan menyatakan bahwa agama tersebut adalah ancaman dan harus dilawan. Pernyataan tersebut disampaikan secara langsung di muka umum dan direkam oleh banyak orang. Pasal apa yang tepat dikenakan kepada Eko Santoso?", "passage: Ya, karena mantan pejabat yang tanpa izin dari pejabat berwenang menahan atau tetap menyimpan surat dinas yang ada padanya setelah tidak lagi menjabat dapat dipidana penjara paling lama 6 bulan atau denda paling banyak kategori II. (Pasal 541 KUHP)", "passage: Pasal 300: Setiap Orang Di Muka Umum yang: a. melakukan perbuatan yang bersifat permusuhan; b. menyatakan kebencian atau permusuhan; atau c. menghasut untuk melakukan Kekerasan, atau diskriminasi, terhadap agama, kepercayaan orang lain, golongan, atau kelompok atas dasar agama atau kepercayaan di Indonesia, dipidana dengan pidana penjara paling lama 3 (tiga) tahun atau pidana denda paling banyak kategori IV.. Pasal ini berlaku karena Eko Santoso secara Di Muka Umum menyatakan kebencian dan menghasut untuk melakukan diskriminasi terhadap penganut agama tertentu di Indonesia berdasarkan agama mereka, yang secara langsung memenuhi unsur tindak pidana dalam Pasal 300 KUHP 2023..", "passage: Pasal 301: (1) Setiap Orang yang menyiarkan, mempertunjukkan, menempelkan tulisan atau gambar, atau memperdengarkan suatu rekaman, termasuk menyebarluaskan melalui sarana teknologi informasi yang berisi Tindak Pidana sebagaimana dimaksud dalam Pasal 300, dengan maksud agar isi tulisan, gambar, atau rekaman tersebut diketahui atau lebih diketahui oleh umum, dipidana dengan pidana penjara paling lama 5 (lima) tahun atau pidana denda paling banyak kategori V. (2) Jika Setiap Orang sebagaimana dimaksud pada ayat (1) melakukan perbuatan tersebut dalam menjalankan profesinya dan pada waktu itu belum lewat 2 (dua) tahun sejak adanya putusan pemidanaan yang telah memperoleh kekuatan hukum tetap karena melakukan Tindak Pidana yang sama, dapat dijatuhi pidana tambahan berupa pencabutan hak sebagaimana dimaksud dalam Pasal 86 huruf f.. Pasal ini mengatur penyebarluasan melalui media konten yang memuat tindak pidana Pasal 300, merupakan pasal turunan dari Pasal 300 bukan pasal induk kebencian berbasis agama itu sendiri.." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
File size: 354 Bytes
70029a8 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | {
"add_prefix_space": true,
"backend": "tokenizers",
"bos_token": "<s>",
"clean_up_tokenization_spaces": true,
"cls_token": "<s>",
"eos_token": "</s>",
"is_local": false,
"mask_token": "<mask>",
"model_max_length": 512,
"pad_token": "<pad>",
"sep_token": "</s>",
"tokenizer_class": "XLMRobertaTokenizer",
"unk_token": "<unk>"
}
|