Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

truong1301
/
bi_encoder_viwiki_1

Sentence Similarity
sentence-transformers
Safetensors
roberta
feature-extraction
dense
Generated from Trainer
dataset_size:16581
loss:CachedMultipleNegativesRankingLoss
Model card Files Files and versions
xet
Community

Instructions to use truong1301/bi_encoder_viwiki_1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use truong1301/bi_encoder_viwiki_1 with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("truong1301/bi_encoder_viwiki_1")
    
    sentences = [
        "Có phải nhiều vĩ_nhân đã sinh ra ở Firenze không ? \n",
        "Sau khi thống_nhất , Việt_Nam tiếp_tục gặp khó_khăn do sự sụp_đổ và tan_rã của đồng_minh Liên_Xô cùng Khối phía Đông , các lệnh cấm_vận của Hoa_Kỳ , chiến_tranh với Campuchia , biên_giới giáp Trung_Quốc và hậu_quả của chính_sách bao_cấp sau nhiều năm áp_dụng . Năm 1986 , Đảng Cộng_sản ban_hành cải_cách đổi_mới , tạo điều_kiện hình_thành kinh_tế thị_trường và hội_nhập sâu_rộng . Cải_cách đổi_mới kết_hợp cùng quy_mô dân_số lớn đưa Việt_Nam trở_thành một trong những nước đang phát_triển có tốc_độ tăng_trưởng thuộc nhóm nhanh nhất thế_giới , được coi là Hổ mới châu Á dù_cho vẫn gặp phải những thách_thức như tham_nhũng , tội_phạm gia_tăng , ô_nhiễm môi_trường và phúc_lợi xã_hội chưa đầy_đủ . Ngoài_ra , giới bất_đồng chính_kiến , chính_phủ một_số nước phương Tây và các tổ_chức theo_dõi nhân_quyền có quan_điểm chỉ_trích hồ_sơ nhân_quyền của Việt_Nam liên_quan đến các vấn_đề tôn_giáo , kiểm_duyệt truyền_thông , hạn_chế hoạt_động ủng_hộ nhân_quyền cùng các quyền tự_do dân_sự .",
        "Tuy_nhiên , sự_thật là không phải tới thời Lorenzo nắm quyền Phục_Hưng mới ra_đời , mà bản_thân gia_đình Medici cũng chỉ thừa_hưởng truyền_thống trọng nghệ_thuật của Firenze và phát_huy nó . Một_số người cho rằng Firenze trở_thành nơi khởi_đầu Phục_Hưng là do may_mắn , nghĩa_là đơn_thuần bởi_vì những vĩ_nhân ngẫu_nhiên sinh ra ở đây : cả da Vinci , Botticelli và Michelangelo đều là người xứ Toscana ( mà Firenze là thủ phủ ) . Tuy_nhiên các nhà sử_học khác phản_đối ý_kiến cho rằng đây là sự ngẫu_nhiên và quy cho truyền_thống trọng nghệ_thuật của Firenze .",
        "Hệ_thống đường_sắt Trung_Quốc thuộc sở_hữu nhà_nước , nằm trong số các hệ_thống nhộn_nhịp nhất trên thế_giới . Năm 2013 , đường_sắt Trung_Quốc vận_chuyển khoảng 2,106 tỷ lượt hành_khách , khoảng 3,967 tỷ tấn hàng_hóa . Hệ_thống đường_sắt cao_tốc Trung_Quốc bắt_đầu được xây_dựng từ đầu thập_niên 2000 , xếp_hàng_đầu thế_giới về chiều dài với 11.028 kilômét ( 6.852 dặm ) đường_ray vào năm 2013 . Tính đến năm 2017 , đất_nước có 127.000 km ( 78.914 dặm ) đường_sắt , xếp thứ hai trên thế_giới . Đường_sắt đáp_ứng nhu_cầu đi_lại khổng_lồ của người dân , đặc_biệt là trong kỳ nghỉ Tết_Nguyên_đán , thời_điểm cuộc di_cư hàng năm lớn nhất thế_giới của loài_người diễn ra"
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
bi_encoder_viwiki_1
542 MB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
truong1301's picture
truong1301
Add new SentenceTransformer model
c5cc8ae verified 9 months ago
  • 1_Pooling
    Add new SentenceTransformer model 9 months ago
  • .gitattributes
    1.52 kB
    initial commit 9 months ago
  • README.md
    46.9 kB
    Add new SentenceTransformer model 9 months ago
  • added_tokens.json
    22 Bytes
    Add new SentenceTransformer model 9 months ago
  • bpe.codes
    1.14 MB
    Add new SentenceTransformer model 9 months ago
  • config.json
    672 Bytes
    Add new SentenceTransformer model 9 months ago
  • config_sentence_transformers.json
    283 Bytes
    Add new SentenceTransformer model 9 months ago
  • model.safetensors
    540 MB
    xet
    Add new SentenceTransformer model 9 months ago
  • modules.json
    229 Bytes
    Add new SentenceTransformer model 9 months ago
  • sentence_bert_config.json
    57 Bytes
    Add new SentenceTransformer model 9 months ago
  • special_tokens_map.json
    965 Bytes
    Add new SentenceTransformer model 9 months ago
  • tokenizer_config.json
    1.17 kB
    Add new SentenceTransformer model 9 months ago
  • vocab.txt
    895 kB
    Add new SentenceTransformer model 9 months ago