vietnamese-sbert-v3 / README.md
Cloyne's picture
Add new SentenceTransformer model
d4eff87 verified
metadata
base_model: keepitreal/vietnamese-sbert
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:132997
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: >-
      Ai có trách_nhiệm cập_nhật , công_bố thông_tin về tài_sản thế_chấp sau khi
      thực_hiện đăng_ký thay_đổi nội_dung thế_chấp đã đăng_ký , sửa_chữa sai_sót
      ?
    sentences:
      - >-
        1 . Chuẩn chương_trình phải quy_định những yêu_cầu tối_thiểu về số_lượng
        , cơ_cấu , trình_độ , năng_lực , kinh_nghiệm của đội_ngũ giảng_viên và
        nhân_lực hỗ_trợ để tổ_chức giảng_dạy và hỗ_trợ người học nhằm đạt được
        chuẩn đầu_ra của chương_trình đào_tạo . 2 . Yêu_cầu đối_với đội_ngũ
        giảng_viên giảng_dạy chương_trình đại_học , giảng_dạy chương_trình
        đào_tạo chuyên_sâu đặc_thù trình_độ bậc 7 : a ) Giảng_viên có trình_độ
        thạc_sĩ trở lên , trợ_giảng có trình_độ đại_học trở lên ; b ) Có ít_nhất
        01 tiến_sĩ ngành phù_hợp là giảng_viên cơ_hữu để chủ_trì xây_dựng ,
        tổ_chức thực_hiện chương_trình đào_tạo ; c ) Có ít_nhất 05 tiến_sĩ có
        chuyên_môn phù_hợp là giảng_viên cơ_hữu để chủ_trì giảng_dạy
        chương_trình , trong đó mỗi thành_phần của chương_trình phải có
        giảng_viên với chuyên_môn phù_hợp chủ_trì giảng_dạy ; d ) Có đủ số_lượng
        giảng_viên để đảm_bảo tỉ_lệ sinh_viên trên giảng_viên không vượt quá mức
        quy_định cho từng lĩnh_vực , nhóm ngành hoặc ngành đào_tạo . 3 . Yêu_cầu
        đối_với đội_ngũ giảng_viên giảng_dạy chương_trình thạc_sĩ : a )
        Giảng_viên có trình_độ tiến_sĩ ; b ) Có ít_nhất 05 tiến_sĩ ngành phù_hợp
        là giảng_viên cơ_hữu , trong đó có một giáo_sư hoặc phó_giáo_sư chủ_trì
        xây_dựng , tổ_chức thực_hiện chương_trình đào_tạo ; c ) Có giảng_viên
        cơ_hữu với chuyên_môn phù_hợp chủ_trì giảng_dạy đối_với từng môn_học ,
        học phần của chương_trình ; d ) Có đủ người hướng_dẫn để đảm_bảo tỷ_lệ
        tối_đa 05 học_viên trên một người hướng_dẫn . 4 . Yêu_cầu đối_với
        đội_ngũ giảng_viên giảng_dạy chương_trình tiến_sĩ : a ) Giảng_viên có
        chức_danh giáo_sư hoặc phó giáo_sư ; hoặc có trình_độ tiến_sĩ với
        năng_lực nghiên_cứu tốt ; b ) Có ít_nhất 01 giáo_sư ( hoặc 02 phó
        giáo_sư ) ngành phù_hợp và 03 tiến_sĩ ngành phù_hợp là giảng_viên cơ_hữu
        ; c ) Có đủ người hướng_dẫn để đảm_bảo tỉ_lệ tối_đa 07 nghiên_cứu_sinh /
        giáo_sư , 05 nghiên_cứu_sinh / phó giáo_sư và 03 nghiên_cứu_sinh /
        tiến_sĩ . 5 . Chuẩn chương_trình cho các ngành , nhóm ngành quy_định
        yêu_cầu cụ_thể về đội_ngũ giảng_viên không thấp hơn quy_định tại các
        khoản 2 , 3 và 4 của Điều này ; yêu_cầu cụ_thể về tỉ_lệ người học trên
        giảng_viên ; yêu_cầu về đội_ngũ nhân_lực hỗ_trợ đào_tạo ( nếu cần_thiết
        ) , phù_hợp với đặc_điểm của từng lĩnh_vực nhóm ngành hoặc ngành đào_tạo
        .
      - >-
        Trách_nhiệm của các cơ_quan có liên_quan đến đăng_ký thế_chấp quyền
        sử_dụng đất , tài_sản gắn liền với đất 1 . Văn_phòng đăng_ký đất_đai có
        trách_nhiệm gửi thông_tin cho Sở Tài_nguyên_và_Môi_trường để cập_nhật ,
        công_bố thông_tin về tài_sản thế_chấp sau khi thực_hiện đăng_ký thay_đổi
        nội_dung thế_chấp đã đăng_ký , sửa_chữa sai_sót , xóa đăng_ký thế_chấp
        liên_quan đến việc thế_chấp dự_án đầu_tư xây_dựng nhà ở , dự_án đầu_tư
        xây_dựng công_trình xây_dựng không phải là nhà ở theo quy_định tại Điều
        64 của Nghị_định số 102 / 2017 / NĐ-CP . ...
      - >-
        Xóa kỷ_luật , giảm thời_hạn chấp_hành kỷ_luật lao_động 1 . Người
        lao_động bị khiển_trách sau 03 tháng , hoặc bị xử_lý kỷ_luật kéo_dài
        thời_hạn nâng lương sau 06 tháng , kể từ ngày bị xử_lý , nếu không
        tái_phạm thì đương_nhiên được xóa kỷ_luật . Trường_hợp bị xử_lý kỷ_luật
        lao_động bằng hình_thức cách_chức thì sau thời_hạn 03 năm , nếu tiếp_tục
        vi_phạm kỷ_luật lao_động thì không bị coi là tái_phạm . 2 . Người
        lao_động bị xử_lý kỷ_luật kéo_dài thời_gian nâng lương sau khi chấp_hành
        được một_nửa thời_hạn nếu sửa_chữa tiến_bộ , có_thể được người sử_dụng
        lao_động xét giảm thời_hạn .
  - source_sentence: Mức trích nộp phí công_đoàn của doanh_nghiệp  bao_nhiêu phần_trăm ?
    sentences:
      - >-
        " Điều 5 . Mức đóng và căn_cứ đóng kinh_phí công_đoàn Mức đóng bằng 2 %
        quỹ tiền_lương làm căn_cứ đóng bảo_hiểm_xã_hội cho người lao_động . Quỹ
        tiền_lương này là tổng mức tiền_lương của những người lao_động thuộc
        đối_tượng phải đóng bảo_hiểm_xã_hội theo quy_định của pháp_luật về
        bảo_hiểm_xã_hội . Riêng đối_với đơn_vị thuộc lực_lượng_vũ_trang quy_định
        tại Khoản 1 Điều 4 Nghị_định này , quỹ tiền_lương là tổng mức tiền_lương
        của những cán_bộ , công_nhân viên_chức quốc_phòng , lao_động làm_việc
        hưởng lương trong các nhà_máy , doanh_nghiệp , đơn_vị cơ_sở trong
        Quân_đội nhân_dân ; cán_bộ , công_nhân , viên_chức , lao_động làm_việc
        hưởng lương trong các doanh_nghiệp , cơ_quan , đơn_vị khoa học-kỹ_thuật
        , sự_nghiệp và phục_vụ trong Công_an nhân_dân . "
      - >-
        " Điều 41 . Điều_chỉnh dự_án đầu_tư 3 . Nhà_đầu_tư có dự_án đầu_tư đã
        được chấp_thuận chủ_trương đầu_tư phải thực_hiện thủ_tục chấp_thuận
        điều_chỉnh chủ_trương đầu_tư nếu thuộc một trong các trường_hợp sau đây
        : a ) Thay_đổi mục_tiêu đã được quy_định tại văn_bản chấp_thuận
        chủ_trương đầu_tư ; bổ_sung mục_tiêu thuộc diện chấp_thuận chủ_trương
        đầu_tư ; 4 . Đối_với dự_án đầu_tư được chấp_thuận chủ_trương đầu_tư ,
        nhà_đầu_tư không được điều_chỉnh tiến_độ thực_hiện dự_án đầu_tư quá 24
        tháng so với tiến_độ thực_hiện dự_án đầu_tư quy_định tại văn_bản
        chấp_thuận chủ_trương đầu_tư lần đầu , trừ một trong các trường_hợp sau
        đây : đ ) Thay_đổi mục_tiêu đã được quy_định tại văn_bản chấp_thuận
        chủ_trương đầu_tư ; bổ_sung mục_tiêu thuộc diện chấp_thuận chủ_trương
        đầu_tư ; "
      - >-
        " Điều 4 . Tiêu_chuẩn tuyển quân 1 . Tuổi_đời : a ) Công_dân từ đủ 18
        tuổi đến hết 25 tuổi . b ) Công_dân nam được đào_tạo trình_độ cao_đẳng ,
        đại_học đã được tạm hoãn gọi nhập_ngũ trong thời_gian một khóa đào_tạo
        của một trình_độ đào_tạo thì tuyển_chọn và gọi nhập_ngũ đến hết 27 tuổi
        . 2 . Tiêu_chuẩn chính_trị : a ) Thực_hiện theo Thông_tư liên_tịch số
        50/2016 / TTLT-BQP-BCA ngày 15 tháng 4 năm 2016 của Bộ_trưởng Bộ
        Quốc_phòng - Bộ_trưởng Bộ Công_an quy_định tiêu_chuẩn chính_trị
        tuyển_chọn công_dân vào phục_vụ trong Quân_đội nhân_dân Việt_Nam . b )
        Đối_với các cơ_quan , đơn_vị và vị_trí trọng_yếu cơ_mật trong Quân_đội ;
        lực_lượng Tiêu_binh , Nghi_lễ ; lực_lượng Vệ_binh và Kiểm_soát quân_sự
        chuyên_nghiệp thực_hiện tuyển_chọn theo quy_định của Bộ Quốc_phòng . 3 .
        Tiêu_chuẩn sức_khỏe : a ) Tuyển_chọn những công_dân có sức khỏe loại 1 ,
        2 , 3 theo quy_định tại Thông_tư liên_tịch số 16/2016 / TTLT-BYT-BQP
        ngày 30 tháng 6 năm 2016 của Bộ_trưởng Bộ Y_tế - Bộ_trưởng Bộ Quốc_phòng
        quy_định việc khám sức_khỏe thực_hiện nghĩa_vụ_quân_sự . b ) Đối_với các
        cơ_quan , đơn_vị , vị_trí quy_định tại Điểm b , Khoản 2 Điều này ,
        thực_hiện tuyển_chọn bảo_đảm tiêu_chuẩn riêng theo quy_định của Bộ
        Quốc_phòng . c ) Không gọi nhập_ngũ vào Quân_đội những công_dân có sức
        khỏe loại 3 tật khúc_xạ về mắt ( cận_thị 1,5 diop trở lên , viễn_thị các
        mức_độ ) ; nghiện ma_túy , nhiễm HlV , AIDS. 4 . Tiêu_chuẩn văn_hóa : a
        ) Tuyển_chọn và gọi nhập_ngũ những công_dân có trình_độ văn_hóa lớp 8
        trở lên , lấy từ cao xuống thấp . Những địa_phương có khó_khăn không
        đảm_bảo đủ chỉ_tiêu giao_quân thì báo_cáo cấp có thẩm_quyền xem_xét ,
        quyết_định được tuyển_chọn số công_dân có trình_độ văn_hóa lớp 7 . b )
        Các xã thuộc vùng_sâu , vùng_xa , vùng điều_kiện kinh_tế - xã_hội
        đặc_biệt khó_khăn theo quy_định của pháp_luật ; đồng_bào
        dân_tộc_thiểu_số dưới 10.000 người thì được tuyển không quá 25 %
        công_dân có trình_độ văn_hóa cấp tiểu_học , còn lại là trung_học_cơ_sở
        trở lên . "
  - source_sentence: >-
      Người đứng đầu cơ_quan thuộc Chính_phủ , đơn_vị sự_nghiệp công_lập
      thực_hiện tiếp dân đột_xuất trong các trường_hợp nào ?
    sentences:
      - >-
        Nghĩa_vụ nộp chi_phí cho người làm_chứng ... 3 . Tòa_án căn_cứ vào khoản
        1 và khoản 2 Điều này quyết_định nghĩa_vụ nộp chi_phí cho người
        làm_chứng , hoàn_trả lại chi_phí cho các bên đương_sự trong bản_án ,
        quyết_định .
      - >-
        Trách_nhiệm của người đứng đầu cơ_quan thuộc Chính_phủ , đơn_vị
        sự_nghiệp công_lập ... 3 . Thực_hiện tiếp công_dân đột_xuất trong các
        trường_hợp sau đây : a ) Vụ_việc gay_gắt , phức_tạp , có nhiều người
        tham_gia , liên_quan đến trách_nhiệm của nhiều cơ_quan , tổ_chức ,
        đơn_vị hoặc ý_kiến của các cơ_quan , tổ_chức , đơn_vị còn khác nhau ; b
        ) Vụ_việc nếu không_chỉ_đạo , xem_xét kịp_thời có_thể gây ra hậu_quả
        nghiêm_trọng hoặc có_thể dẫn đến hủy_hoại tài_sản của Nhà_nước , của
        tập_thể , xâm_hại đến tính_mạng , tài_sản của nhân_dân , ảnh_hưởng đến
        an_ninh , chính_trị , trật_tự , an_toàn xã_hội . 4 . Khi tiếp công_dân ,
        người đứng đầu cơ_quan , đơn_vị phải có ý_kiến trả_lời về việc
        giải_quyết vụ_việc cho công_dân . Trường_hợp chưa trả_lời ngay được thì
        chỉ_đạo cơ_quan , tổ_chức , đơn_vị , công_chức , viên_chức thuộc quyền
        quản_lý của mình kịp_thời xem_xét , giải_quyết và thông_báo cho công_dân
        biết thời_gian trả_lời .
      - >-
        Cơ_cấu tổ_chức bộ_máy và biên_chế của Ban quản_lý khu công_nghiệp , khu
        kinh_tế 1 . Ban quản_lý khu công_nghiệp , khu kinh_tế gồm Trưởng_ban ,
        không quá 03 Phó Trưởng_ban ; bộ_máy giúp_việc . Trưởng ban do Chủ_tịch
        Ủy_ban_nhân_dân cấp tỉnh bổ_nhiệm , miễn_nhiệm . Phó Trưởng ban do
        Chủ_tịch Ủy_ban_nhân_dân cấp tỉnh bổ_nhiệm , miễn_nhiệm theo đề_nghị của
        Trưởng ban . 2 . Trưởng ban có trách_nhiệm điều_hành mọi hoạt_động của
        Ban quản_lý khu công_nghiệp , khu kinh_tế , chịu trách_nhiệm trước
        Ủy_ban_nhân_dân cấp tỉnh , Chủ_tịch Ủy_ban_nhân_dân cấp tỉnh và
        pháp_luật về hoạt_động của khu công_nghiệp , khu kinh_tế . ....
  - source_sentence: >-
      Nếu chảy_máu trong phẫu_thuật mở tiền phòng lấy máu_cục thì xử_lý
      như_thế_nào ?
    sentences:
      - >-
        PHẪU_THUẬT MỞ TIỀN_PHÒNG LẤY MÁU_CỤC ... VII. XỬ_TRÍ TAI_BIẾN 1 .
        Chảy_máu trong phẫu_thuật Là biến_chứng hay gặp - Nguyên_nhân : + Do hút
        lôi_kéo vào mống mắt đặc_biệt chân mống mắt . + Do cục máu đông chưa
        được hình_thành chắc_chắn . - Xử_trí : + Dừng hút . + Bơm tiền phòng
        dung_dịch adrenalin 0,1 % hòa loãng với dung_dịch ringer_lactat tỷ_lệ
        1/3 và / hoặc bơm bóng hơi to vào tiền phòng hoặc bơm nhầy vào tiền
        phòng . + Nếu máu vẫn không ngừng chảy , có_thể ngừng phẫu_thuật , khâu
        đóng mép phẫu_thuật , chờ_đợi cho đến khi cục máu đông được hình_thành
        chắc_chắn rồi rửa lại máu tiền phòng một hôm khác . ...
      - >-
        Nội_dung quy_hoạch không_gian biển quốc_gia ... 3 . Xác_định quan_điểm
        và mục_tiêu phát_triển : a ) Xây_dựng quan_điểm sử_dụng không_gian biển
        , khai_thác và sử_dụng bền_vững tài_nguyên biển , bảo_vệ môi_trường vùng
        bờ ; b ) Xác_định mục_tiêu tổng_quát và các mục_tiêu cụ_thể về sử_dụng
        không_gian biển và khai_thác , sử_dụng tài_nguyên trong phạm_vi
        không_gian biển trong thời_kỳ quy_hoạch 10 năm , tầm nhìn từ 30 đến 50
        năm ; c ) Xác_định những vấn_đề trọng_tâm cần giải_quyết và các khâu
        đột_phá trong việc khai_thác , sử_dụng không_gian biển cho các hoạt_động
        kinh_tế , xã_hội , môi_trường trong thời_kỳ quy_hoạch . ...
      - >-
        Cách tiến_hành 9.1 Yêu_cầu chung ... 9.2 Phần mẫu thử Cân khoảng 40 g
        mẫu thử , cho vào cốc thủy tinh_hình cầu dung_tích 160 ml . Khuấy_mẫu
        bằng thìa nhựa , nếu cần , sau đó ổn_định mẫu ở nhiệt_độ phòng ( từ 18
        °C đến 25 °C ) . 9.3 Phương_pháp đánh_giá bằng khứu_giác 9.3.1 Đánh_giá
        bằng khứu_giác Các đặc_tính khứu_giác được đánh_giá trước_tiên . Đối_với
        mẫu mật_ong thô , đánh_giá mùi ngay sau khi mật_ong đã được trải trên
        bề_mặt của cốc bằng thìa nhựa , để sự cảm_nhận các chất dễ bay_hơi được
        giải_phóng và sự bốc_hơi trên bề_mặt bay_hơi là như nhau đối_với tất_cả
        các mẫu . Đối_với mẫu pha loãng , cần xoáy vòng_mẫu trong cốc để
        thúc_đẩy sự bay_hơi . Người đánh_giá phải thở trong vài giây trên
        miệng_cốc . Phải đánh_giá mùi ngay sau khi trải trên bề_mặt của cốc hoặc
        ngay sau khi xoay_cốc và sau đó 10 hoặc 20 s . Trước khi hít_hơi thứ hai
        , người đánh_giá phải chờ từ 5 s đến 20 s hoặc có_thể lâu hơn , để
        có_thể cảm_nhận được toàn_bộ mùi . Ghi vào phiếu đánh_giá cường_độ của
        bất_kỳ khuyết_tật nào cảm_nhận được và sự phù_hợp với profile đơn hoa ,
        nếu được yêu_cầu . 9.3.2 Cường_độ mùi Thang_điểm đánh_giá cường_độ mùi
        của mật_ong : 0 . không mùi 1 . mùi yếu 2 . mùi trung_bình 3 . mùi mạnh
        9.3.3 Mô_tả mùi Có_thể tham_khảo các thuật_ngữ sau : a ) Mùi cây_cỏ : -
        Mùi cây_cỏ tươi : mùi hạt đậu , mùi lá bị nhàu , mùi cây_cỏ sau mưa ; -
        Mùi cây_cỏ khô : mùi malt vàng , mùi rơm , mùi trà , mùi cỏ khô ; b )
        Mùi gỗ : - Mùi gỗ khô : mùi gỗ và lá , mùi bụi gỗ , mùi hạt_óc chó , mùi
        hạt_dẻ ; - Mùi nhựa gỗ : mùi nhựa cây tuyết_tùng , mùi nhựa thông , mùi
        keo_ong ; - Mùi gia_vị : mùi đinh_hương , mùi nhục đậu_khấu , mùi cà_phê
        ; c ) Mùi hóa_chất : - Mùi hóa_chất dầu_mỏ : mùi styren , mùi sơn , mùi
        dung_môi ; - Mùi thuốc : mùi xà_phòng gia_dụng , mùi vitamin_B1 ; d )
        Mùi tươi : - Mùi tươi mới : mùi bạc_hà , mùi khuynh_diệp , mùi hoa hồi ;
        - Mùi quả có múi : mùi chanh , mùi cam , mùi bưởi ; e ) Mùi hoa_quả tươi
        : - Mùi hoa : mùi hoa_cam , mùi hoa thạch_thảo ( violet ) , mùi hoa_hồng
        , mùi hoa_dạ lan_hương ( Hyacinthus ) ; - Mùi quả : mùi táo , mùi lê ,
        mùi quả dứa_dại ( red fruit ) , mùi quả_lý chua_đen , mùi dừa , mùi mơ ,
        mùi quả lạ ( exotic fruit ) ; f ) Mùi ấm : - Mùi cháy : mùi mật_rỉ , mùi
        đường cháy ; - Mùi quả nấu : mùi chà_là , mùi mận , mùi vả_tây , mùi nho
        khô , mùi kẹo trái_cây ; - Mùi caramel : mùi kẹo toffee , mùi
        bánh_caramel , mùi đường nâu ; g ) Mùi mật hỏng : - Mùi hăng : mùi
        phomat_cay , mùi dấm ; - Mùi động_vật : mùi phomat , mùi mồ_hôi , mùi bò
        , mùi nước tiểu_mèo ; - Mùi mốc : mùi ẩm , mùi thảm_trải sàn , mùi mùn
        đất , mùi ngột_ngạt ; - Mùi lưu_huỳnh : mùi atiso , mùi bắp_cải .
  - source_sentence: >-
      Việc ghi nhãn đối_với vàng trang_sức , mỹ_nghệ thể_hiện trực_tiếp trên
      sản_phẩm bằng những cách nào ?
    sentences:
      - >-
        Xác_định tỷ_trọng ( % ) sản_lượng xăng_dầu từ nguồn trong nước và
        nhập_khẩu để tính giá cơ_sở các mặt_hàng xăng_dầu 1 . Tỷ_trọng ( % )
        sản_lượng xăng_dầu từ nguồn trong nước và nhập_khẩu để tính giá cơ_sở
        các mặt_hàng xăng_dầu được xác_định như sau : a ) Sản_lượng xăng_dầu từ
        nguồn trong nước là sản_lượng xăng_dầu bán ra của các nhà_máy lọc dầu
        trong nước ( không bao_gồm dung_môi , nhiên_liệu bay ; không bao_gồm
        sản_lượng xăng_dầu tự dùng và xuất_khẩu ) . Tỷ_trọng ( % ) sản_lượng
        xăng_dầu từ nguồn trong nước bằng ( = ) Sản_lượng xăng_dầu từ nguồn
        trong nước chia cho ( :) Tổng_sản_lượng xăng_dầu nhập_khẩu và sản_lượng
        xăng_dầu từ nguồn trong nước trong kỳ báo_cáo của thương_nhân đầu_mối
        sản_xuất xăng_dầu . b ) Sản_lượng xăng_dầu từ nguồn nhập_khẩu thực_hiện
        như quy_định tại điểm a_khoản 1 Điều 3 Thông_tư này . Tỷ_trọng ( % )
        sản_lượng xăng_dầu từ nguồn nhập_khẩu bằng ( = ) Sản_lượng xăng_dầu từ
        nguồn nhập_khẩu chia cho ( :) Tổng_sản_lượng xăng_dầu nhập_khẩu và
        sản_lượng xăng_dầu từ nguồn sản_xuất trong nước của các thương_nhân
        đầu_mối sản_xuất xăng_dầu trong kỳ báo_cáo . c ) Thời_gian thu_thập
        số_liệu thực_hiện theo Quý ( từ ngày 21 tháng trước liền kề tháng
        đầu_tiên của Quý đến ngày 20 tháng cuối Quý ) .
      - >-
        Kỹ_sư cao_cấp ( hạng I ) - Mã_số : V._05.02.05 ... 2 . Tiêu_chuẩn về
        trình_độ đào_tạo , bồi_dưỡng : a ) Có trình_độ thạc_sĩ trở lên thuộc
        lĩnh_vực kỹ_thuật , công_nghệ ; b ) Có chứng_chỉ bồi_dưỡng chức_danh
        công_nghệ . ...
      - >-
        Công_bố tiêu_chuẩn áp_dụng và ghi nhãn đối_với vàng trang_sức , mỹ_nghệ
        ... 4 . Ghi nhãn đối_với vàng trang_sức , mỹ_nghệ : a ) Yêu_cầu chung :
        - Việc ghi nhãn vàng trang_sức , mỹ_nghệ phải được thực_hiện theo
        quy_định tại Nghị_định số 89/2006 / NĐ-CP ngày 30 tháng 8 năm 2006 của
        Chính_phủ về nhãn hàng hóa . Vị_trí nhãn vàng trang_sức , mỹ_nghệ được
        thực_hiện theo quy_định tại Điều 6 Nghị_định số 89/2006 / NĐ-CP ; - Nhãn
        vàng trang_sức , mỹ_nghệ được thể_hiện trực_tiếp trên sản_phẩm bằng cách
        khắc cơ_học , khắc_la-de , đục chìm , đúc_chìm , đúc nổi hoặc bằng
        phương_pháp thích_hợp ( nếu kích_thước và cấu_trúc sản_phẩm đủ để
        thực_hiện ) hoặc thể_hiện trên tài_liệu đính kèm sản_phẩm ; - Độ
        tinh_khiết hay hàm_lượng vàng theo phân_hạng quy_định tại Điều 6
        Thông_tư này phải được ghi rõ tại vị_trí dễ thấy trên sản_phẩm bằng số
        Ả_Rập chỉ_số phần vàng trên một nghìn ( 1000 ) phần khối_lượng của
        sản_phẩm ( ví_dụ : 999 hoặc 916 ... ) hoặc bằng số Ả_Rập thể_hiện chỉ_số
        Kara kèm theo chữ_cái K ( ví_dụ : 24K hoặc 22K ... ) tương_ứng với
        phân_hạng theo quy_định tại Điều 6 Thông_tư này . Trường_hợp sản_phẩm có
        kích_thước không_thể thể_hiện trực_tiếp được thì hàm_lượng vàng công_bố
        phải được ghi trên nhãn đính kèm . Trường_hợp sản_phẩm có từ hai
        thành_phần trở lên với hàm_lượng vàng khác nhau , có_thể nhận_biết sự
        khác nhau qua ngoại_quan thì việc ghi hàm_lượng vàng được thể_hiện trên
        phần có hàm_lượng vàng thấp hơn ; - Đối_với vàng trang_sức , mỹ_nghệ
        nhập_khẩu , ngoài nhãn gốc ghi bằng tiếng nước_ngoài , phải có nhãn phụ
        bằng tiếng Việt thể_hiện các thông_tin ghi nhãn theo quy_định tại điểm b
        khoản 4 Điều này và xuất_xứ hàng hóa . ...

SentenceTransformer based on keepitreal/vietnamese-sbert

This is a sentence-transformers model finetuned from keepitreal/vietnamese-sbert on the csv dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: keepitreal/vietnamese-sbert
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • csv

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("Cloyne/vietnamese-sbert-v3")
# Run inference
sentences = [
    'Việc ghi nhãn đối_với vàng trang_sức , mỹ_nghệ thể_hiện trực_tiếp trên sản_phẩm bằng những cách nào ?',
    'Công_bố tiêu_chuẩn áp_dụng và ghi nhãn đối_với vàng trang_sức , mỹ_nghệ ... 4 . Ghi nhãn đối_với vàng trang_sức , mỹ_nghệ : a ) Yêu_cầu chung : - Việc ghi nhãn vàng trang_sức , mỹ_nghệ phải được thực_hiện theo quy_định tại Nghị_định số 89/2006 / NĐ-CP ngày 30 tháng 8 năm 2006 của Chính_phủ về nhãn hàng hóa . Vị_trí nhãn vàng trang_sức , mỹ_nghệ được thực_hiện theo quy_định tại Điều 6 Nghị_định số 89/2006 / NĐ-CP ; - Nhãn vàng trang_sức , mỹ_nghệ được thể_hiện trực_tiếp trên sản_phẩm bằng cách khắc cơ_học , khắc_la-de , đục chìm , đúc_chìm , đúc nổi hoặc bằng phương_pháp thích_hợp ( nếu kích_thước và cấu_trúc sản_phẩm đủ để thực_hiện ) hoặc thể_hiện trên tài_liệu đính kèm sản_phẩm ; - Độ tinh_khiết hay hàm_lượng vàng theo phân_hạng quy_định tại Điều 6 Thông_tư này phải được ghi rõ tại vị_trí dễ thấy trên sản_phẩm bằng số Ả_Rập chỉ_số phần vàng trên một nghìn ( 1000 ) phần khối_lượng của sản_phẩm ( ví_dụ : 999 hoặc 916 ... ) hoặc bằng số Ả_Rập thể_hiện chỉ_số Kara kèm theo chữ_cái K ( ví_dụ : 24K hoặc 22K ... ) tương_ứng với phân_hạng theo quy_định tại Điều 6 Thông_tư này . Trường_hợp sản_phẩm có kích_thước không_thể thể_hiện trực_tiếp được thì hàm_lượng vàng công_bố phải được ghi trên nhãn đính kèm . Trường_hợp sản_phẩm có từ hai thành_phần trở lên với hàm_lượng vàng khác nhau , có_thể nhận_biết sự khác nhau qua ngoại_quan thì việc ghi hàm_lượng vàng được thể_hiện trên phần có hàm_lượng vàng thấp hơn ; - Đối_với vàng trang_sức , mỹ_nghệ nhập_khẩu , ngoài nhãn gốc ghi bằng tiếng nước_ngoài , phải có nhãn phụ bằng tiếng Việt thể_hiện các thông_tin ghi nhãn theo quy_định tại điểm b khoản 4 Điều này và xuất_xứ hàng hóa . ...',
    'Kỹ_sư cao_cấp ( hạng I ) - Mã_số : V._05.02.05 ... 2 . Tiêu_chuẩn về trình_độ đào_tạo , bồi_dưỡng : a ) Có trình_độ thạc_sĩ trở lên thuộc lĩnh_vực kỹ_thuật , công_nghệ ; b ) Có chứng_chỉ bồi_dưỡng chức_danh công_nghệ . ...',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

csv

  • Dataset: csv
  • Size: 132,997 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 6 tokens
    • mean: 16.75 tokens
    • max: 34 tokens
    • min: 17 tokens
    • mean: 172.75 tokens
    • max: 256 tokens
  • Samples:
    anchor positive
    Điều_kiện cần có của Văn_phòng công_chứng là gì ? " Điều 22 . Văn_phòng công_chứng 3 . Tên gọi của Văn_phòng công_chứng phải bao_gồm cụm_từ “ Văn_phòng công_chứng ” kèm theo họ tên của Trưởng Văn_phòng hoặc họ tên của một công_chứng_viên hợp_danh khác của Văn_phòng công_chứng do các công_chứng_viên hợp_danh thỏa_thuận , không được trùng hoặc gây nhầm_lẫn với tên của tổ_chức hành_nghề công_chứng khác , không được vi_phạm truyền_thống lịch_sử , văn_hóa , đạo_đức và thuần_phong mỹ_tục của dân_tộc . "
    Thứ_trưởng , Phó Thủ_trưởng cơ_quan ngang Bộ thực_hiện nhiệm_vụ theo sự phân_công của ai ? " Điều 3 . Bộ_trưởng 1 . Bộ_trưởng là thành_viên Chính_phủ và là người đứng đầu Bộ , lãnh_đạo công_tác của Bộ ; chịu trách_nhiệm quản_lý_nhà_nước về ngành , lĩnh_vực được phân_công ; tổ_chức thi_hành và theo_dõi việc thi_hành pháp_luật liên_quan đến ngành , lĩnh_vực được giao trong phạm_vi toàn_quốc . 2 . Bộ_trưởng làm_việc theo chế_độ thủ_trưởng và Quy_chế làm_việc của Chính_phủ , bảo_đảm nguyên_tắc tập_trung_dân_chủ . Điều 4 . Thứ_trưởng , Phó Thủ_trưởng cơ_quan ngang Bộ 1 . Thứ_trưởng , Phó Thủ_trưởng cơ_quan ngang Bộ ( sau đây gọi chung là Thứ_trưởng ) giúp Bộ_trưởng thực_hiện một hoặc một_số nhiệm_vụ cụ_thể do Bộ_trưởng phân_công và chịu trách_nhiệm trước Bộ_trưởng và trước pháp_luật về nhiệm_vụ được phân_công . Thứ_trưởng không kiêm người đứng đầu tổ_chức , đơn_vị thuộc Bộ , trừ trường_hợp đặc_biệt . Khi Bộ_trưởng vắng_mặt , một Thứ_trưởng được Bộ_trưởng ủy_nhiệm thay Bộ_trưởng điều_hành và giải_quyết công_việc của Bộ . 2 . Số_lượng Thứ_trưởng thực_hiện theo quy_định của Luật_Tổ_chức Chính_phủ . "
    Việc lựa_chọn xuất_bản_phẩm tham_khảo dùng chung trong các cơ_sở giáo_dục được quy_định thế_nào ? Lựa_chọn xuất_bản_phẩm tham_khảo dùng chung trong các cơ_sở giáo_dục 1 . Tổ / nhóm chuyên_môn , căn_cứ vào mục_tiêu , nội_dung chương_trình giáo_dục , sách_giáo_khoa , kế_hoạch thực_hiện nhiệm_vụ năm_học , các hoạt_động giáo_dục và đề_xuất của giáo_viên để lựa_chọn , đề_xuất danh_mục xuất_bản_phẩm tham_khảo tối_thiểu liên_quan đến môn_học / lớp_học , hoạt_động giáo_dục . 2 . Định_kì vào đầu năm_học , thủ_trưởng cơ_sở giáo_dục thành_lập Hội_đồng để xem_xét , lựa_chọn , đề_xuất danh_mục xuất_bản_phẩm tham_khảo trên cơ_sở đề_xuất của các tổ / nhóm chuyên_môn . Thành_phần tối_thiểu của Hội_đồng gồm : Lãnh_đạo cơ_sở giáo_dục phụ_trách chuyên_môn , tổ / nhóm trưởng chuyên_môn và viên_chức phụ_trách thư_viện trong cơ_sở giáo_dục . 3 . Thủ_trưởng cơ_sở giáo_dục quyết_định phê_duyệt danh_mục xuất_bản_phẩm tham_khảo tối_thiểu để có kế_hoạch mua_sắm và sử_dụng hằng năm trong cơ_sở giáo_dục trên cơ_sở đề_xuất của Hội_đồng lựa_chọn xuất_bản_phẩm tham_khảo , cân_đối nguồn kinh_phí , quy_mô của cơ_sở giáo_dục , số_lượng và chất_lượng xuất_bản_phẩm tham_khảo đã có tại cơ_sở giáo_dục .
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

csv

  • Dataset: csv
  • Size: 132,997 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 6 tokens
    • mean: 17.13 tokens
    • max: 57 tokens
    • min: 7 tokens
    • mean: 173.11 tokens
    • max: 256 tokens
  • Samples:
    anchor positive
    Hoàn lại số tiền lừa_đảo thì có được nhẹ_tội hơn không ? " Điều 51 . Các tình_tiết giảm nhẹ trách_nhiệm hình_sự 1 . Các tình_tiết sau đây là tình_tiết giảm nhẹ trách_nhiệm hình_sự : a ) Người phạm_tội đã ngăn_chặn hoặc làm giảm bớt tác_hại của tội_phạm ; b ) Người phạm_tội tự_nguyện sửa_chữa , bồi_thường thiệt_hại hoặc khắc_phục hậu_quả ; c ) Phạm_tội trong trường_hợp vượt quá giới_hạn phòng_vệ chính_đáng ; d ) Phạm_tội trong trường_hợp vượt quá yêu_cầu của tình_thế cấp_thiết ; đ ) Phạm_tội trong trường_hợp vượt quá mức cần_thiết khi bắt_giữ người phạm_tội ; e ) Phạm_tội trong trường_hợp bị kích_động về tinh_thần do hành_vi trái pháp_luật của nạn_nhân gây ra ; g ) Phạm_tội vì hoàn_cảnh đặc_biệt khó_khăn mà không phải do mình tự gây ra ; h ) Phạm_tội nhưng chưa gây thiệt_hại hoặc gây thiệt_hại không lớn ; i ) Phạm_tội lần đầu và thuộc trường_hợp ít nghiêm_trọng ; k ) Phạm_tội vì bị người khác đe_dọa hoặc cưỡng_bức ; l ) Phạm_tội trong trường_hợp bị hạn_chế khả_năng nhận_thức mà không phải do lỗi của mình gây ra ; m ) Phạm_tội do lạc_hậu ; n ) Người phạm_tội là phụ_nữ có_thai ; o ) Người phạm_tội là người đủ 70 tuổi trở lên ; p ) Người phạm_tội là người khuyết_tật nặng hoặc khuyết_tật đặc_biệt nặng ; q ) Người phạm_tội là người có bệnh bị hạn_chế khả_năng nhận_thức hoặc khả_năng điều_khiển hành_vi của mình ; r ) Người phạm_tội tự_thú ; s ) Người phạm_tội thành_khẩn khai_báo , ăn_năn hối_cải ; t ) Người phạm_tội tích_cực hợp_tác với cơ_quan có trách_nhiệm trong việc phát_hiện tội_phạm hoặc trong quá_trình giải_quyết vụ án ; u ) Người phạm_tội đã lập_công chuộc tội ; v ) Người phạm_tội là người có thành_tích xuất_sắc trong sản_xuất , chiến_đấu , học_tập hoặc công_tác ; x ) Người phạm_tội là người có công với cách_mạng hoặc là cha , mẹ , vợ , chồng , con của liệt_sĩ . 2 . Khi quyết_định hình_phạt , Tòa_án có_thể coi đầu_thú hoặc tình_tiết khác là tình_tiết giảm nhẹ , nhưng phải ghi rõ lý_do giảm nhẹ trong bản_án . 3 . Các tình_tiết giảm nhẹ đã được Bộ_luật này quy_định là dấu_hiệu định_tội hoặc định_khung thì không được coi là tình_tiết giảm nhẹ trong khi quyết_định hình_phạt . "
    Quy_trình phát_mại tài_sản bao_gồm các bước nào ? “ Điều 307 . Thanh_toán số tiền có được từ việc xử_lý tài_sản cầm_cố , thế_chấp 1 . Số tiền có được từ việc xử_lý tài_sản cầm_cố , thế_chấp sau khi thanh_toán chi_phí bảo_quản , thu_giữ và xử_lý tài_sản cầm_cố , thế_chấp được thanh_toán theo thứ_tự ưu_tiên quy_định tại Điều 308 của Bộ_luật này . 2 . Trường_hợp số tiền có được từ việc xử_lý tài_sản cầm_cố , thế_chấp sau khi thanh_toán chi_phí bảo_quản , thu_giữ và xử_lý tài_sản cầm_cố , thế_chấp lớn hơn giá_trị nghĩa_vụ được bảo_đảm thì số tiền chênh_lệch phải được trả cho bên bảo_đảm . 3 . Trường_hợp số tiền có được từ việc xử_lý tài_sản cầm_cố , thế_chấp sau khi thanh_toán chi_phí bảo_quản , thu_giữ và xử_lý tài_sản cầm_cố , thế_chấp nhỏ hơn giá_trị nghĩa_vụ được bảo_đảm thì phần nghĩa_vụ chưa được thanh_toán được xác_định là nghĩa_vụ không có bảo_đảm , trừ trường_hợp các bên có thỏa_thuận bổ_sung tài_sản bảo_đảm . Bên nhận bảo_đảm có quyền yêu_cầu bên có nghĩa_vụ được bảo_đảm phải thực_hiện phần nghĩa_vụ chưa được thanh_toán . ”
    Người lao_động đang trong thời_gian nghỉ thai_sản thì có đóng đoàn phí công_đoàn không ? " Điều 23 . Đối_tượng , mức đóng , tiền_lương làm căn_cứ đóng đoàn phí [ ... ] 6 . Đoàn_viên công_đoàn hưởng trợ_cấp Bảo_hiểm_xã_hội từ 01 tháng trở lên , trong thời_gian hưởng trợ_cấp không phải đóng đoàn phí ; đoàn_viên công_đoàn không có việc_làm , không có thu_nhập , nghỉ_việc riêng từ 01 tháng trở lên không hưởng tiền_lương , trong thời_gian đó không phải đóng đoàn phí ” .
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • num_train_epochs: 5
  • warmup_ratio: 0.1
  • fp16: True
  • eval_on_start: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: True
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss
0 0 - 0.4612
0.2424 500 0.1944 -
0.4847 1000 0.1022 0.0650
0.7271 1500 0.0883 -
0.9695 2000 0.0762 0.0594
1.2118 2500 0.0686 -
1.4542 3000 0.0407 0.0508
1.6966 3500 0.0275 -
1.9389 4000 0.0209 0.0487
2.1813 4500 0.0209 -
2.4237 5000 0.013 0.0495
2.6660 5500 0.0103 -
2.9084 6000 0.0072 0.0416
3.1508 6500 0.0086 -
3.3931 7000 0.005 0.0387
3.6355 7500 0.0038 -
3.8778 8000 0.0032 0.0314
4.1202 8500 0.0037 -
4.3626 9000 0.0027 0.0381
4.6049 9500 0.0018 -
4.8473 10000 0.0017 0.0360

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.2.1
  • Transformers: 4.45.1
  • PyTorch: 2.4.0
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.20.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}