Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

anhtuansh
/
ModernBERT-base-test-v2

Sentence Similarity
sentence-transformers
Safetensors
modernbert
feature-extraction
Generated from Trainer
dataset_size:3000
loss:MultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use anhtuansh/ModernBERT-base-test-v2 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use anhtuansh/ModernBERT-base-test-v2 with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("anhtuansh/ModernBERT-base-test-v2")
    
    sentences = [
        "pháp_luật quy_định như thế_nào về lưu_trữ và bảo_đảm tính toàn_vẹn của chứng_từ điện_tử trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ?",
        "a ) tổ_chức và thực_hiện xử_lý , phân_tích , tổng_hợp và cung_cấp thông_tin khoa_học và công_nghệ , thông_tin thống_kê khoa_học , công_nghệ và đổi_mới sáng_tạo phục_vụ lãnh_đạo , quản_lý , nghiên_cứu , đào_tạo , sản_xuất , kinh_doanh và phát_triển kinh_tế - xã_hội tại địa_phương ; \n b ) tổ_chức hướng_dẫn và triển_khai thực_hiện công_tác thu_thập , đăng_ký , lưu_giữ và công_bố thông_tin về nhiệm_vụ khoa_học và công_nghệ thuộc phạm_vi quản_lý của địa_phương theo quy_định ; \n c ) xây_dựng và phát_triển hạ_tầng thông_tin khoa_học và công_nghệ ; tham_gia xây_dựng , cập_nhật và khai_thác cơ_sở dữ_liệu quốc_gia về khoa_học và công_nghệ ; xây_dựng , quản_lý , kết_nối và chia_sẻ các cơ_sở dữ_liệu về khoa_học và công_nghệ của địa_phương bảo_đảm việc tích_hợp , trao_đổi , chia_sẻ dữ_liệu đồng_bộ , thống_nhất ; tham_gia khai_thác , duy_trì và phát_triển mạng nghiên_cứu và đào_tạo việt_nam ( vinaren ) và các mạng thông_tin khoa_học và công_nghệ khác ; ứng_dụng công_nghệ thông_tin và truyền_thông , phương_tiện kỹ_thuật tiên_tiến trong hoạt_động thông_tin , thống_kê khoa_học và công_nghệ ; \n d ) đầu_mối kết_nối triển_khai các dự_án của hệ tri_thức việt_số hóa tại địa_phương .",
        "điều 19 . nghĩa_vụ của trung_tâm dịch_vụ_việc_làm khi tham_gia giao_dịch điện_tử trong lĩnh_vực bảo_hiểm xã_hội \n 1 . thực_hiện giao_dịch điện_tử trong giải_quyết các chế_độ bảo_hiểm_thất_nghiệp . \n 2 . cung_cấp danh_sách các quyết_định bảo_hiểm_thất_nghiệp , đối_tượng không đến khai_báo việc làm_hàng tháng , đối_tượng đăng_ký học nghề và tư_vấn giới_thiệu việc_làm , đối_tượng đến đăng_ký bảo_lưu bảo_hiểm_thất_nghiệp , không nhận quyết_định ( hủy quyết_định hưởng bảo_hiểm_thất_nghiệp ) bằng phương_tiện điện_tử . \n 3 . lưu_trữ và bảo_đảm tính toàn_vẹn của toàn_bộ chứng_từ điện_tử trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ; thực_hiện các quy_định pháp_luật về bảo_đảm an_toàn , an_ninh hệ_thống dữ_liệu điện_tử . \n 4 . chấp_hành sự thanh_tra , kiểm_tra của các cơ_quan có thẩm_quyền theo quy_định của pháp_luật .",
        "khoản 1 . hàng năm , trước ngày 25 tháng 12 , bộ thông_tin và truyền_thông giao kế_hoạch cung_ứng dịch_vụ bưu_chính công_ích và dịch_vụ công_ích trong hoạt_động phát_hành báo_chí . nội_dung kế_hoạch bao_gồm : \n a ) sản_lượng các dịch_vụ bưu_chính công_ích quy_định tại khoản 1 , điều 2 thông_tư này . đơn_vị tính chỉ_tiêu kế_hoạch là cái ( thư ) ; \n b ) sản_lượng từng loại báo , tạp_chí theo quy_định tại điều 3 thông_tư này . đơn_vị tính chỉ_tiêu kế_hoạch là tờ ( báo ) , cuốn ( tạp_chí ) ; \n c ) chất_lượng dịch_vụ theo quy_chuẩn kỹ_thuật quốc_gia về chất_lượng dịch_vụ bưu_chính công_ích , dịch_vụ công_ích trong hoạt_động phát_hành báo_chí ; giá cước dịch_vụ theo quy_định của bộ thông_tin và truyền_thông ; \n d ) thời_gian thực_hiện kế_hoạch cung_ứng dịch_vụ : từ ngày 01 tháng 01 đến hết ngày 31 tháng 12 của năm kế_hoạch ."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
ModernBERT-base-test-v2
600 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
anhtuansh's picture
anhtuansh
Add new SentenceTransformer model
a56a5e7 verified over 1 year ago
  • 1_Pooling
    Add new SentenceTransformer model over 1 year ago
  • .gitattributes
    1.52 kB
    initial commit over 1 year ago
  • README.md
    61.9 kB
    Add new SentenceTransformer model over 1 year ago
  • config.json
    1.3 kB
    Add new SentenceTransformer model over 1 year ago
  • config_sentence_transformers.json
    210 Bytes
    Add new SentenceTransformer model over 1 year ago
  • model.safetensors
    596 MB
    xet
    Add new SentenceTransformer model over 1 year ago
  • modules.json
    229 Bytes
    Add new SentenceTransformer model over 1 year ago
  • sentence_bert_config.json
    54 Bytes
    Add new SentenceTransformer model over 1 year ago
  • special_tokens_map.json
    694 Bytes
    Add new SentenceTransformer model over 1 year ago
  • tokenizer.json
    3.58 MB
    Add new SentenceTransformer model over 1 year ago
  • tokenizer_config.json
    20.8 kB
    Add new SentenceTransformer model over 1 year ago