Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing

  • Log In
  • Sign Up

bkai-foundation-models
/
vietnamese-bi-encoder

Sentence Similarity
PyTorch
Safetensors
sentence-transformers
Transformers
Vietnamese
generic
roberta
feature-extraction
Model card Files Files and versions
xet
Community
8

Instructions to use bkai-foundation-models/vietnamese-bi-encoder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use bkai-foundation-models/vietnamese-bi-encoder with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("bkai-foundation-models/vietnamese-bi-encoder")
    
    sentences = [
        "Làm thế nào Đại học Bách khoa Hà Nội thu hút sinh viên quốc tế?",
        "Đại học Bách khoa Hà Nội đã phát triển các chương trình đào tạo bằng tiếng Anh để làm cho việc học tại đây dễ dàng hơn cho sinh viên quốc tế.",
        "Môi trường học tập đa dạng và sự hỗ trợ đầy đủ cho sinh viên quốc tế tại Đại học Bách khoa Hà Nội giúp họ thích nghi nhanh chóng.",
        "Hà Nội có khí hậu mát mẻ vào mùa thu.",
        "Các món ăn ở Hà Nội rất ngon và đa dạng."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [5, 5]
  • Transformers

    How to use bkai-foundation-models/vietnamese-bi-encoder with Transformers:

    # Load model directly
    from transformers import AutoTokenizer, AutoModel
    
    tokenizer = AutoTokenizer.from_pretrained("bkai-foundation-models/vietnamese-bi-encoder")
    model = AutoModel.from_pretrained("bkai-foundation-models/vietnamese-bi-encoder")
  • Notebooks
  • Google Colab
  • Kaggle
New discussion
Resources
  • PR & discussions documentation
  • Code of Conduct
  • Hub documentation

Add new SentenceTransformer model with an onnx backend

#8 opened 10 months ago by
iambestfeed

Chi tiết setup eval

#7 opened about 2 years ago by
datnguyen

feature request: file tokenizer.json for HuggingFace embedding inference

#6 opened about 2 years ago by
hiepxanh

Xin tập dữ liệu

#5 opened about 2 years ago by
anhnh2002

Xin tips minning hard negative

#4 opened over 2 years ago by
bravend

Cho mình hỏi độ dài tối đa

1
#3 opened over 2 years ago by
minhduc96

Về việc sử dụng negative sample

3
#2 opened over 2 years ago by
anhnct

Câu hỏi về cấu hình training

1
#1 opened over 2 years ago by
whoisltd
Company
TOS Privacy About Careers
Website
Models Datasets Spaces Pricing Docs