---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dense
- generated_from_trainer
- dataset_size:790
- loss:MultipleNegativesRankingLoss
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
widget:
- source_sentence: 'Nhà tang lễ Bệnh viện Nguyễn Tri Phương, còn gọi là nhà tang lễ
Quảng Đông, tọa lạc tại địa chỉ 336 Trần Phú, Phường 7, Quận 5, Thành phố Hồ Chí
Minh, phục vụ nhu cầu tổ chức tang lễ cho cộng đồng người Việt và người Hoa. Địa
điểm này hoạt động 24/24, cung cấp dịch vụ tổ chức tang lễ trọn gói, có bãi đậu
xe riêng và được nhiều người đánh giá cao về sự chu đáo, giá cả hợp lý.
https://phucanvienlongan.vn/blogs/tin-tuc/tim-hieu-ve-nha-tang-le-benh-vien-nguyen-tri-phuong'
sentences:
- french colonial architecture indochina villa balcony yellow walls shutters kiến
trúc pháp thuộc địa đông dương biệt thự tường vàng cửa chớp
- secular non-religious atheism no religion không tôn giáo vô thần thế tục
- restaurant place to eat food dining hungry lunch dinner eatery nhà hàng quán ăn
tiệm cơm ăn uống
- source_sentence: 'Trường Đại học Bách khoa (ĐHQG TPHCM) là trường đại học hàng đầu
về kỹ thuật và công nghệ tại Việt Nam. Cơ sở 1 tọa lạc tại Quận 10, là nơi học
tập của nhiều khoa, phòng ban và các khu chức năng quan trọng của trường. '
sentences:
- institution school university college education academy library trường học đại
học thư viện giáo dục
- restaurant place to eat food dining hungry lunch dinner eatery nhà hàng quán ăn
tiệm cơm ăn uống
- secular non-religious atheism no religion không tôn giáo vô thần thế tục
- source_sentence: 'Hội quán Tuệ Thành (còn gọi là Miếu Thiên Hậu hoặc Chùa Bà Chợ
Lớn) là một công trình kiến trúc tín ngưỡng dân gian lâu đời của người Hoa tại
Chợ Lớn, TP. Hồ Chí Minh. Hội quán được xây dựng vào khoảng cuối thế kỷ 17, dùng
làm nơi hội họp, quản lý di dân, và đặc biệt là thờ cúng Thiên Hậu Thánh Mẫu.
Công trình này có giá trị văn hóa, lịch sử sâu sắc với kiến trúc đặc trưng, nhiều
cổ vật quý báu và là một điểm đến tâm linh quan trọng.
https://ttvhq5.com.vn/chua-ba-tue-thanh-hoi-quan/'
sentences:
- chinese folk religion ancestor worship shenism tín ngưỡng dân gian trung hoa thờ
cúng tổ tiên
- marketplace market bazaar shopping buy food groceries ben thanh chợ bến thành
mua sắm thực phẩm đồ khô
- restaurant place to eat food dining hungry lunch dinner eatery nhà hàng quán ăn
tiệm cơm ăn uống
- source_sentence: Nhà tang lễ TP.HCM (Lê Quý Đôn) là một nhà tang lễ cũ nằm ở số
25, đường Lê Quý Đôn, phường 07, quận 03, TP.HCM. Đây là một cơ sở tang lễ lâu
đời, nay đã được thay thế bởi một nhà hàng lẩu Đài Loan có tên Man Tang Guo Lê
Quý Đôn tại số 6B Lê Quý Đôn, Phường Võ Thị Sáu, Quận 3.
sentences:
- secular non-religious atheism no religion không tôn giáo vô thần thế tục
- institution school university college education academy library trường học đại
học thư viện giáo dục
- place of worship temple church pagoda shrine mosque pray spiritual nơi thờ tự
chùa đền nhà thờ thánh đường miếu
- source_sentence: Đình Phú Xuân tọa lạc tại Huyện Nhà Bè, TP.HCM, đã được UBND Thành
phố xếp hạng là di tích kiến trúc nghệ thuật cấp Thành phố vào năm 2012. Đình
nằm trong một khuôn viên rộng rãi, có nhiều cây xanh, bên bờ Rạch Đời.
sentences:
- traditional vietnamese architecture wooden red tile roof kiến trúc truyền thống
việt nam nhà gỗ mái ngói đỏ nhà rường
- christian church jesus catholic protestant cross bible công giáo tin lành nhà
thờ chúa giêsu thánh giá kinh thánh
- traditional vietnamese architecture wooden red tile roof kiến trúc truyền thống
việt nam nhà gỗ mái ngói đỏ nhà rường
pipeline_tag: sentence-similarity
library_name: sentence-transformers
---
# SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2)
- **Maximum Sequence Length:** 128 tokens
- **Output Dimensionality:** 384 dimensions
- **Similarity Function:** Cosine Similarity
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Đình Phú Xuân tọa lạc tại Huyện Nhà Bè, TP.HCM, đã được UBND Thành phố xếp hạng là di tích kiến trúc nghệ thuật cấp Thành phố vào năm 2012. Đình nằm trong một khuôn viên rộng rãi, có nhiều cây xanh, bên bờ Rạch Đời.',
'traditional vietnamese architecture wooden red tile roof kiến trúc truyền thống việt nam nhà gỗ mái ngói đỏ nhà rường',
'traditional vietnamese architecture wooden red tile roof kiến trúc truyền thống việt nam nhà gỗ mái ngói đỏ nhà rường',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.4176, 0.4176],
# [0.4176, 1.0000, 1.0000],
# [0.4176, 1.0000, 1.0000]])
```
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 790 training samples
* Columns: sentence_0 and sentence_1
* Approximate statistics based on the first 790 samples:
| | sentence_0 | sentence_1 |
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
| type | string | string |
| details |
ình Xuân Hiệp là một ngôi đình cổ tọa lạc tại phường Linh Trung, Thành phố Thủ Đức. Đây là nơi thờ cúng Thành hoàng và các vị tiền nhân có công khai phá, gìn giữ vùng đất Xuân Hiệp xưa. | vietnamese folk religion mother goddess dao mau thanh mau tín ngưỡng dân gian việt nam đạo mẫu hầu đồng thánh mẫu |
| Nhà thờ Mạc Ty Nho (còn gọi là Giáo xứ Mạc Ty Nho) là một nhà thờ Công giáo nổi bật tọa lạc tại trung tâm Thành phố Hồ Chí Minh, nổi tiếng với các hoạt động cộng đồng và trang trí lễ hội độc đáo.
https://muctim.tuoitre.vn/den-nha-tho-mac-ty-nho-check-in-giang-sinh-voi-cay-thong-xoay-360-do-101241213182102305.htm | french colonial architecture indochina villa balcony yellow walls shutters kiến trúc pháp thuộc địa đông dương biệt thự tường vàng cửa chớp |
| Bảo tàng tọa lạc trong tòa nhà Bến Nhà Rồng lịch sử, nơi Chủ tịch Hồ Chí Minh (lúc đó là người thanh niên Nguyễn Tất Thành) đã xuống tàu rời Tổ quốc ra đi tìm đường cứu nước vào ngày 5 tháng 6 năm 1911. Bảo tàng trưng bày nhiều tài liệu, hiện vật và hình ảnh về cuộc đời, sự nghiệp cách mạng của Chủ tịch Hồ Chí Minh. | secular non-religious atheism no religion không tôn giáo vô thần thế tục |
* Loss: [MultipleNegativesRankingLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `per_device_train_batch_size`: 32
- `per_device_eval_batch_size`: 32
- `num_train_epochs`: 4
- `multi_dataset_batch_sampler`: round_robin
#### All Hyperparameters