Sentence Similarity
sentence-transformers
Safetensors
modernbert
feature-extraction
Generated from Trainer
dataset_size:3000
loss:MultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use anhtuansh/ModernBERT-base-test-v2 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use anhtuansh/ModernBERT-base-test-v2 with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("anhtuansh/ModernBERT-base-test-v2") sentences = [ "pháp_luật quy_định như thế_nào về lưu_trữ và bảo_đảm tính toàn_vẹn của chứng_từ điện_tử trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ?", "a ) tổ_chức và thực_hiện xử_lý , phân_tích , tổng_hợp và cung_cấp thông_tin khoa_học và công_nghệ , thông_tin thống_kê khoa_học , công_nghệ và đổi_mới sáng_tạo phục_vụ lãnh_đạo , quản_lý , nghiên_cứu , đào_tạo , sản_xuất , kinh_doanh và phát_triển kinh_tế - xã_hội tại địa_phương ; \n b ) tổ_chức hướng_dẫn và triển_khai thực_hiện công_tác thu_thập , đăng_ký , lưu_giữ và công_bố thông_tin về nhiệm_vụ khoa_học và công_nghệ thuộc phạm_vi quản_lý của địa_phương theo quy_định ; \n c ) xây_dựng và phát_triển hạ_tầng thông_tin khoa_học và công_nghệ ; tham_gia xây_dựng , cập_nhật và khai_thác cơ_sở dữ_liệu quốc_gia về khoa_học và công_nghệ ; xây_dựng , quản_lý , kết_nối và chia_sẻ các cơ_sở dữ_liệu về khoa_học và công_nghệ của địa_phương bảo_đảm việc tích_hợp , trao_đổi , chia_sẻ dữ_liệu đồng_bộ , thống_nhất ; tham_gia khai_thác , duy_trì và phát_triển mạng nghiên_cứu và đào_tạo việt_nam ( vinaren ) và các mạng thông_tin khoa_học và công_nghệ khác ; ứng_dụng công_nghệ thông_tin và truyền_thông , phương_tiện kỹ_thuật tiên_tiến trong hoạt_động thông_tin , thống_kê khoa_học và công_nghệ ; \n d ) đầu_mối kết_nối triển_khai các dự_án của hệ tri_thức việt_số hóa tại địa_phương .", "điều 19 . nghĩa_vụ của trung_tâm dịch_vụ_việc_làm khi tham_gia giao_dịch điện_tử trong lĩnh_vực bảo_hiểm xã_hội \n 1 . thực_hiện giao_dịch điện_tử trong giải_quyết các chế_độ bảo_hiểm_thất_nghiệp . \n 2 . cung_cấp danh_sách các quyết_định bảo_hiểm_thất_nghiệp , đối_tượng không đến khai_báo việc làm_hàng tháng , đối_tượng đăng_ký học nghề và tư_vấn giới_thiệu việc_làm , đối_tượng đến đăng_ký bảo_lưu bảo_hiểm_thất_nghiệp , không nhận quyết_định ( hủy quyết_định hưởng bảo_hiểm_thất_nghiệp ) bằng phương_tiện điện_tử . \n 3 . lưu_trữ và bảo_đảm tính toàn_vẹn của toàn_bộ chứng_từ điện_tử trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ; thực_hiện các quy_định pháp_luật về bảo_đảm an_toàn , an_ninh hệ_thống dữ_liệu điện_tử . \n 4 . chấp_hành sự thanh_tra , kiểm_tra của các cơ_quan có thẩm_quyền theo quy_định của pháp_luật .", "khoản 1 . hàng năm , trước ngày 25 tháng 12 , bộ thông_tin và truyền_thông giao kế_hoạch cung_ứng dịch_vụ bưu_chính công_ích và dịch_vụ công_ích trong hoạt_động phát_hành báo_chí . nội_dung kế_hoạch bao_gồm : \n a ) sản_lượng các dịch_vụ bưu_chính công_ích quy_định tại khoản 1 , điều 2 thông_tư này . đơn_vị tính chỉ_tiêu kế_hoạch là cái ( thư ) ; \n b ) sản_lượng từng loại báo , tạp_chí theo quy_định tại điều 3 thông_tư này . đơn_vị tính chỉ_tiêu kế_hoạch là tờ ( báo ) , cuốn ( tạp_chí ) ; \n c ) chất_lượng dịch_vụ theo quy_chuẩn kỹ_thuật quốc_gia về chất_lượng dịch_vụ bưu_chính công_ích , dịch_vụ công_ích trong hoạt_động phát_hành báo_chí ; giá cước dịch_vụ theo quy_định của bộ thông_tin và truyền_thông ; \n d ) thời_gian thực_hiện kế_hoạch cung_ứng dịch_vụ : từ ngày 01 tháng 01 đến hết ngày 31 tháng 12 của năm kế_hoạch ." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Ctrl+K