Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing

  • Log In
  • Sign Up

nhatminh
/
vietnamese_bi_encoder

Sentence Similarity
PyTorch
Safetensors
sentence-transformers
Transformers
Vietnamese
generic
roberta
feature-extraction
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use nhatminh/vietnamese_bi_encoder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use nhatminh/vietnamese_bi_encoder with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("nhatminh/vietnamese_bi_encoder")
    
    sentences = [
        "Làm thế nào Đại học Bách khoa Hà Nội thu hút sinh viên quốc tế?",
        "Đại học Bách khoa Hà Nội đã phát triển các chương trình đào tạo bằng tiếng Anh để làm cho việc học tại đây dễ dàng hơn cho sinh viên quốc tế.",
        "Môi trường học tập đa dạng và sự hỗ trợ đầy đủ cho sinh viên quốc tế tại Đại học Bách khoa Hà Nội giúp họ thích nghi nhanh chóng.",
        "Hà Nội có khí hậu mát mẻ vào mùa thu.",
        "Các món ăn ở Hà Nội rất ngon và đa dạng."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [5, 5]
  • Transformers

    How to use nhatminh/vietnamese_bi_encoder with Transformers:

    # Load model directly
    from transformers import AutoTokenizer, AutoModel
    
    tokenizer = AutoTokenizer.from_pretrained("nhatminh/vietnamese_bi_encoder")
    model = AutoModel.from_pretrained("nhatminh/vietnamese_bi_encoder")
  • Notebooks
  • Google Colab
  • Kaggle
vietnamese_bi_encoder
1.09 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 7 commits
nhatminh's picture
nhatminh
Update config.json
20f8d67 verified over 1 year ago
  • 1_Pooling
    Upload config.json about 2 years ago
  • .gitattributes
    1.52 kB
    initial commit about 2 years ago
  • README.md
    6.47 kB
    Upload 16 files about 2 years ago
  • added_tokens.json
    22 Bytes
    Upload 16 files about 2 years ago
  • bpe.codes
    1.14 MB
    Upload 16 files about 2 years ago
  • config.json
    777 Bytes
    Update config.json over 1 year ago
  • config_sentence_transformers.json
    123 Bytes
    Upload 16 files about 2 years ago
  • custom_tokenizer.py
    325 Bytes
    Upload 16 files about 2 years ago
  • model.safetensors
    540 MB
    xet
    Upload 2 files about 2 years ago
  • modules.json
    229 Bytes
    Upload 16 files about 2 years ago
  • pipeline.py
    2.71 kB
    Upload 16 files about 2 years ago
  • pytorch_model.bin
    540 MB
    xet
    Upload 2 files about 2 years ago
  • requirements.txt
    11 Bytes
    Upload 16 files about 2 years ago
  • sentence_bert_config.json
    53 Bytes
    Upload 16 files about 2 years ago
  • special_tokens_map.json
    167 Bytes
    Upload 16 files about 2 years ago
  • tokenizer.json
    3.13 MB
    Upload 16 files about 2 years ago
  • tokenizer_config.json
    1.17 kB
    Upload 16 files about 2 years ago
  • vocab.txt
    895 kB
    Upload 16 files about 2 years ago