Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

Bachhoang
/
DATN-vietnamese-bi-encoder

Sentence Similarity
PyTorch
Safetensors
sentence-transformers
Transformers
Vietnamese
generic
roberta
feature-extraction
Model card Files Files and versions
xet
Community

Instructions to use Bachhoang/DATN-vietnamese-bi-encoder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use Bachhoang/DATN-vietnamese-bi-encoder with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("Bachhoang/DATN-vietnamese-bi-encoder")
    
    sentences = [
        "Làm thế nào Đại học Bách khoa Hà Nội thu hút sinh viên quốc tế?",
        "Đại học Bách khoa Hà Nội đã phát triển các chương trình đào tạo bằng tiếng Anh để làm cho việc học tại đây dễ dàng hơn cho sinh viên quốc tế.",
        "Môi trường học tập đa dạng và sự hỗ trợ đầy đủ cho sinh viên quốc tế tại Đại học Bách khoa Hà Nội giúp họ thích nghi nhanh chóng.",
        "Hà Nội có khí hậu mát mẻ vào mùa thu.",
        "Các món ăn ở Hà Nội rất ngon và đa dạng."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [5, 5]
  • Transformers

    How to use Bachhoang/DATN-vietnamese-bi-encoder with Transformers:

    # Load model directly
    from transformers import AutoTokenizer, AutoModel
    
    tokenizer = AutoTokenizer.from_pretrained("Bachhoang/DATN-vietnamese-bi-encoder")
    model = AutoModel.from_pretrained("Bachhoang/DATN-vietnamese-bi-encoder")
  • Notebooks
  • Google Colab
  • Kaggle
DATN-vietnamese-bi-encoder
1.08 GB
Ctrl+K
Ctrl+K
  • 2 contributors
History: 2 commits
BachhoangVnist
init embedding model
d7bdc80 almost 2 years ago
  • 1_Pooling
    init embedding model almost 2 years ago
  • .gitattributes
    1.88 kB
    init embedding model almost 2 years ago
  • README.md
    6.47 kB
    init embedding model almost 2 years ago
  • added_tokens.json
    22 Bytes
    init embedding model almost 2 years ago
  • bpe.codes
    1.14 MB
    init embedding model almost 2 years ago
  • config.json
    777 Bytes
    init embedding model almost 2 years ago
  • config_sentence_transformers.json
    123 Bytes
    init embedding model almost 2 years ago
  • custom_tokenizer.py
    325 Bytes
    init embedding model almost 2 years ago
  • model.safetensors
    540 MB
    xet
    init embedding model almost 2 years ago
  • modules.json
    229 Bytes
    init embedding model almost 2 years ago
  • pipeline.py
    2.71 kB
    init embedding model almost 2 years ago
  • pytorch_model.bin

    Detected Pickle imports (3)

    • "torch.FloatStorage",
    • "torch._utils._rebuild_tensor_v2",
    • "collections.OrderedDict"

    What is a pickle import?

    540 MB
    xet
    init embedding model almost 2 years ago
  • requirements.txt
    11 Bytes
    init embedding model almost 2 years ago
  • sentence_bert_config.json
    53 Bytes
    init embedding model almost 2 years ago
  • special_tokens_map.json
    167 Bytes
    init embedding model almost 2 years ago
  • tokenizer_config.json
    1.17 kB
    init embedding model almost 2 years ago
  • vocab.txt
    895 kB
    init embedding model almost 2 years ago