Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

anhtuansh
/
ModernBERT-base-2e

Sentence Similarity
sentence-transformers
Safetensors
modernbert
feature-extraction
Generated from Trainer
dataset_size:63130
loss:CachedMultipleNegativesRankingLoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use anhtuansh/ModernBERT-base-2e with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use anhtuansh/ModernBERT-base-2e with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("anhtuansh/ModernBERT-base-2e")
    
    sentences = [
        "người đã phạm_tội và đang bị truy_cứu trách_nhiệm hình_sự có được phép hành_nghề thẩm_định_giá không ?",
        "b ) kiểm_tra , giám_sát hoạt_động tài_chính và thực_hiện chế_độ tài_chính công_khai của trường . \n c ) định_kỳ thông_báo với hội_đồng trường về kết_quả hoạt_động của mình và nội_dung các báo_cáo , kết_luận , kiến_nghị của ban kiểm_soát trước khi chính_thức thông_qua hội_nghị nhà đầu_tư hoặc chủ sở_hữu . \n d ) báo_cáo hội_nghị nhà đầu_tư hoặc chủ sở_hữu về kết_quả kiểm_tra , giám_sát các hoạt_động của nhà_trường tại các kỳ họp của hội_nghị nhà đầu_tư hoặc chủ sở_hữu . \n đ ) thực_hiện các quyền và nhiệm_vụ khác theo quy_chế tổ_chức và hoạt_động của trường .",
        "điều 7 . quy_định chung về bảo_vệ môi_trường nước mặt \n 1 . chất_lượng nước , trầm_tích và môi_trường thủy_sinh của nguồn nước mặt phải được theo_dõi , đánh_giá ; khả_năng chịu_tải của môi_trường nước mặt phải được tính_toán , xác_định và công_bố . \n 2 . nguồn thải vào môi_trường nước mặt phải được quản_lý phù_hợp với mục_đích sử_dụng và khả_năng chịu_tải của môi_trường nước mặt . không phê_duyệt kết_quả thẩm_định báo_cáo đánh_giá tác_động môi_trường hoặc cấp giấy_phép môi_trường cho dự_án đầu_tư mới có hoạt_động xả nước_thải trực_tiếp vào môi_trường nước mặt không còn khả_năng chịu_tải theo công_bố của cơ_quan nhà_nước có thẩm_quyền , trừ trường_hợp chủ dự_án đầu_tư có phương_án xử_lý nước_thải đạt quy_chuẩn kỹ_thuật môi_trường về chất_lượng nước mặt trước khi thải vào môi_trường tiếp_nhận hoặc có phương_án tuần_hoàn , tái sử_dụng để không làm phát_sinh thêm nước_thải hoặc trường_hợp dự_án đầu_tư xử_lý ô_nhiễm , cải_tạo , phục_hồi , cải_thiện chất_lượng môi_trường khu_vực bị ô_nhiễm .",
        "điều 36 . những người không được hành_nghề tại doanh_nghiệp thẩm_định_giá \n 1 . người không đủ tiêu_chuẩn quy_định tại điều 34 của luật này . \n 2 . cán_bộ , công_chức theo quy_định của pháp_luật về cán_bộ , công_chức ; sĩ_quan , quân_nhân chuyên_nghiệp , công_nhân quốc_phòng trong cơ_quan , đơn_vị thuộc quân_đội nhân_dân ; sĩ_quan , hạ_sĩ_quan nghiệp_vụ , sĩ_quan , hạ_sĩ_quan chuyên_môn kỹ_thuật trong cơ_quan , đơn_vị thuộc công_an nhân_dân . \n 3 . người đang bị cấm hành_nghề thẩm_định_giá theo bản_án , quyết_định của tòa_án đã có hiệu_lực pháp_luật ; người đang bị truy_cứu trách_nhiệm hình_sự ; người đã bị kết_án một trong các tội về kinh_tế , chức_vụ liên_quan đến tài_chính , giá , thẩm_định_giá mà chưa được xóa_án tích ; người đang bị áp_dụng biện_pháp xử_lý hành_chính giáo_dục tại xã , phường , thị_trấn , người đang bị đưa vào cơ_sở cai_nghiện bắt_buộc , đưa vào cơ_sở giáo_dục bắt_buộc . \n 4 . người đã bị kết_án về tội kinh_tế từ nghiêm_trọng trở lên ."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
ModernBERT-base-2e
600 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
anhtuansh's picture
anhtuansh
Add new SentenceTransformer model
a49c6b3 verified over 1 year ago
  • 1_Pooling
    Add new SentenceTransformer model over 1 year ago
  • .gitattributes
    1.52 kB
    initial commit over 1 year ago
  • README.md
    62.3 kB
    Add new SentenceTransformer model over 1 year ago
  • config.json
    1.3 kB
    Add new SentenceTransformer model over 1 year ago
  • config_sentence_transformers.json
    210 Bytes
    Add new SentenceTransformer model over 1 year ago
  • model.safetensors
    596 MB
    xet
    Add new SentenceTransformer model over 1 year ago
  • modules.json
    229 Bytes
    Add new SentenceTransformer model over 1 year ago
  • sentence_bert_config.json
    54 Bytes
    Add new SentenceTransformer model over 1 year ago
  • special_tokens_map.json
    694 Bytes
    Add new SentenceTransformer model over 1 year ago
  • tokenizer.json
    3.58 MB
    Add new SentenceTransformer model over 1 year ago
  • tokenizer_config.json
    20.8 kB
    Add new SentenceTransformer model over 1 year ago