Instructions to use Adc05102002/bge-m3-vi-tune with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use Adc05102002/bge-m3-vi-tune with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("Adc05102002/bge-m3-vi-tune") sentences = [ "Khi xảy ra sự cố, tai nạn giao thông đường sắt đô thị thì có thể báo tin bằng những biện pháp nào?", "việc sau:\n- Xây dựng phương án, kế hoạch thực hiện kiểm kê đất đai, lập bản đồ hiện trạng sử dụng đất trên địa bàn cấp huyện;\n- Chuẩn bị nhân lực, thiết bị kỹ thuật, tài chính theo quy định phục vụ cho kiểm kê đất đai, lập bản đồ hiện trạng sử dụng đất; phân công trách nhiệm và sự phối hợp giữa các lực lượng thực hiện;\n- Thu thập, đánh giá, lựa chọn các tài liệu đất đai có liên quan phục vụ kiểm kê đất đai gồm hồ sơ quy hoạch, kế hoạch sử dụng đất; kết quả thống kê đất đai 05 năm gần nhất, kết quả kiểm kê đất đai, lập bản đồ hiện trạng sử dụng đất hai kỳ trước đó;\n- Phối hợp với Chi nhánh Văn phòng đăng ký đất đai rà soát, tổng hợp các trường hợp biến động về đất đai đã thực hiện xong thủ tục hành chính trong kỳ kiểm kê đất đai thuộc thẩm quyền của Ủy ban nhân dân cấp huyện (theo mẫu Phụ lục số \n\t\tĐiểm d) Ủy ban nhân dân cấp xã tổ chức thực hiện và hoàn thành trước thời điểm kiểm kê đất đai đối với các công việc sau:\n- Xây dựng phương án, kế hoạch thực hiện kiểm kê đất đai trên địa bàn xã;\n- Chuẩn bị nhân lực, thiết bị kỹ thuật phục vụ cho kiểm kê đất đai; phân công trách nhiệm cho các lực lượng tham gia hực hiện;\n- Phổ biến, quán triệt nhiệm vụ đến các cán bộ và tuyên truyền cho người dân về chủ trương, kế hoạch kiểm kê;\n- Thu thập các tài liệu, số liệu về đất đai hiện có phục vụ cho kiểm kê gồm các loại bản đồ, dữ liệu phục vụ cho điều tra khoanh vẽ hiện trạng; hồ sơ địa chính; thông báo chỉnh lý biến động và trích lục bản đồ, sơ đồ kèm theo; hồ sơ thanh tra, kiểm tra, xử lý vi phạm trong sử dụng đất; kết quả thống kê đất đai của 05 năm gần nhất, kết quả kiểm kê đất đai, lập bản đồ hiện trạng sử dụng đất hai kỳ trước đó; bảng tổng hợp các trường hợp biến động trong kỳ kiểm kê do Văn phòng Đăng ký đất đai chuyển đến và các hồ sơ, tài liệu đất đai khác có liên quan;\n- Rà soát, đối chiếu, đánh giá khả năng sử dụng, lựa chọn các tài liệu, số liệu, bản đồ thu thập để sử dụng cho kiểm kê;\n- Rà soát phạm vi ranh giới hành chính trên bản đồ sử dụng cho điều tra kiểm kê để chỉnh lý thống nhất với bản đồ biên giới, bản đồ địa giới hành chính mới nhất đã được cơ quan có thẩm quyền phê duyệt. Trường hợp đường địa giới hành chính cấp xã đang có tranh chấp hoặc không thống nhất giữa hồ sơ địa giới với thực địa thì Ủy ban nhân dân của các đơn vị hành chính cấp xã có liên quan làm việc để thống nhất xác định phạm vi, trách nhiệm kiểm kê đất đai của từng bên theo quy định tại khoản 3 Điều 11 của Thông tư này;\n- In ấn tài liệu phục vụ cho kiểm kê đất đai (trừ bản đồ phục vụ điều tra);\n-", "Điều 22. Báo tin và xử lý tin báo về sự cố, tai nạn giao thông đường sắt\n\n\tKhoản 1. Khi có sự cố, tai nạn xảy ra lái tàu hoặc nhân viên hỗ trợ an toàn phải báo ngay cho nhân viên điều độ chạy tàu.\n\n\t\tĐiểm a) Các ga hai đầu khu gian;\n\n\t\tĐiểm b) Doanh nghiệp kinh doanh đường sắt đô thị.\n\n\t\tĐiểm a) Cơ quan công an nơi gần nhất;\n\n\t\tĐiểm b) Ủy ban nhân dân cấp tỉnh (trong trường hợp xảy ra tai nạn chết người và trong các trường hợp cần sự phối hợp của Ủy ban nhân dân các cấp) và các đơn vị có liên quan.\n\n\tKhoản 4. Doanh nghiệp kinh doanh đường sắt đô thị quy định việc báo tin sự cố giao thông đường sắt gây ra không phải dừng tàu, không bế tắc chính tuyến, không ảnh hưởng đến biểu đồ chạy tàu.\n\n\tKhoản 5. Trường hợp quá thời gian chạy tàu trong khu gian theo kế hoạch chạy tàu mà không xác định được thông tin về đoàn tàu, nhân viên phục vụ chạy tàu tại ga đón phải thông báo tới Tổ chức điều hành giao thông vận tải đường sắt đô thị để có biện pháp xử lý tình huống và tổ chức xác định vị trí đoàn tàu trong khu gian. Đồng thời báo ngay cho nhân viên điều độ chạy tàu để có biện pháp xử lý tình huống.\n\n\t\tĐiểm a) Khi xảy ra sự cố, tai nạn các cá nhân có liên quan phải nhanh chóng tìm mọi biện pháp, thông qua các phương tiện thông tin, liên lạc hoặc gặp trực tiếp để báo tin về sự cố, tai nạn đến các tổ chức, cá nhân có liên quan theo quy định tại Khoản 1, Khoản 2 và Khoản 3 Điều này;\n\n\t\tĐiểm b) Trong trường hợp các cá nhân quy định tại Khoản 1, Khoản 2 và Khoản 3 Điều này không thể liên lạc được với một trong số các tổ chức, cá nhân có liên quan thì yêu cầu tổ chức, cá nhân mình đã liên lạc được cùng phối hợp, hỗ trợ trong việc báo tin cho tổ chức, cá nhân còn lại.\n\n\t\tĐiểm a) Địa điểm xảy ra sự cố, tai nạn (km, khu gian, xã, phường, quận, huyện, tỉnh, thành phố);\n\n\t\tĐiểm b) Thời gian xảy ra sự cố, tai nạn;\n\n\t\tĐiểm c) Số người chết, số người bị thương (nếu có);\n\n\t\tĐiểm d) Sơ bộ trạng thái hiện trường, phương tiện bị sự cố, tai nạn; kết cấu hạ tầng bị ảnh hưởng do sự cố, tai nạn gây ra;\n\n\t\tĐiểm đ) Ngoài việc báo tin ban đầu theo quy định tại Khoản 1 Điều này, nhân viên điều độ chạy tàu phải lập báo cáo tai nạn theo Mẫu quy định tại Phụ lục số 1 ban hành kèm theo Thông tư này. Báo cáo tai nạn được gửi cùng Hồ sơ vụ việc về sự cố, tai nạn tới các cơ quan chức năng theo quy định tại Khoản 3 Điều 22 của Thông tư này.\n\n", "đường bộ giao nhau, nơi đường bộ giao nhau cùng mức với đường sắt, nơi tầm nhìn bị che khuất; lùi xe không quan sát hoặc không có tín hiệu báo trước, trừ hành vi vi phạm quy định tại điểm a khoản 8 Điều này;\n\n\t\tĐiểm p) Không thắt dây an toàn khi điều khiển xe chạy trên đường;\n\n\t\tĐiểm q) Chở người trên xe ô tô không thắt dây an toàn (tại vị trí có trang bị dây an toàn) khi xe đang chạy;\n\n\t\tĐiểm r) Chạy trong hầm đường bộ không sử dụng đèn chiếu sáng gần;\n\n\t\tĐiểm s) Điều khiển xe chạy dưới tốc độ tối thiểu trên những đoạn đường bộ có quy định tốc độ tối thiểu cho phép.\n\n\tKhoản 4. Phạt tiền từ \n\tKhoản 000.000 đồng đến \n\t\tĐiểm a) Dùng tay sử dụng điện thoại di động khi đang điều khiển xe chạy trên đường;\n\n\t\tĐiểm b) Đi vào khu vực cấm, đường có biển báo hiệu có nội dung cấm đi vào đối với loại phương tiện đang điều khiển, trừ các hành vi vi phạm quy định tại điểm c khoản 5, điểm a khoản 8 Điều này và các trường hợp xe ưu tiên đang đi làm nhiệm vụ khẩn cấp theo quy định;\n\n\t\tĐiểm c) Điều khiển xe không đủ điều kiện để thu phí theo hình thức điện tử tự động không dừng đi vào làn đường dành riêng thu phí theo hình thức điện tử tự động không dừng tại các trạm thu phí;\n\n\t\tĐiểm d) Dừng xe, đỗ xe tại vị trí: Bên trái đường một chiều hoặc bên trái (theo hướng lưu thông) của đường đôi; trên đoạn đường cong hoặc gần đầu dốc nơi tầm nhìn bị che khuất; trên cầu, gầm cầu vượt, song song với một xe khác đang dừng, đỗ, trừ hành vi vi phạm quy định tại điểm b khoản 6 Điều này;\n\n\t\tĐiểm đ) Dừng xe, đỗ xe, quay đầu xe trái quy định gây ùn tắc giao thông;\n\n\t\tĐiểm e) Xe không được quyền ưu tiên lắp đặt, sử dụng thiết bị phát tín hiệu của xe được quyền ưu tiên;\n\n\t\tĐiểm g) Không thực hiện biện pháp bảo đảm an toàn theo quy định khi xe ô tô bị hư hỏng ngay tại nơi đường bộ giao nhau cùng mức với đường sắt;\n\n\t\tĐiểm h) Không nhường đường cho xe xin vượt khi có đủ điều kiện an toàn;\n\n\t\tĐiểm i) Lùi xe, quay đầu xe trong hầm đường bộ; dừng xe, đỗ xe, vượt xe trong hầm đường bộ không đúng nơi quy định.\n\n\tKhoản 5. Phạt tiền từ \n\tKhoản 000.000 đồng đến \n\t\tĐiểm a) Không chấp hành hiệu lệnh của đèn tín hiệu giao thông;\n\n\t\tĐiểm b) Không chấp hành hiệu lệnh, hướng dẫn của người điều khiển giao thông hoặc người kiểm soát giao thông;\n\n\t\tĐiểm c) Đi ngược chiều của đường một chiều, đi ngược chiều trên đường có biển \n\t\t\t“Cấm đi ngược chiều”\n, trừ các hành vi vi phạm quy định tại điểm a khoản 8 Điều này và các trường hợp xe ưu tiên đang đi làm nhiệm vụ khẩn cấp theo quy định;\n\n\t\tĐiểm d) Vượt xe trong những trường hợp không được vượt, vượt xe tại đoạn đường có biển báo hiệu có nội dung cấm vượt (đối với loại phương tiện đang điều khiển); không có báo hiệu trước khi vượt; vượt bên phải xe khác trong" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
SentenceTransformer based on Adc05102002/bge-m3-vi-base
This is a sentence-transformers model finetuned from Adc05102002/bge-m3-vi-base on the train dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for retrieval.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: Adc05102002/bge-m3-vi-base
- Maximum Sequence Length: 4026 tokens
- Output Dimensionality: 1024 dimensions
- Similarity Function: Cosine Similarity
- Supported Modality: Text
- Training Dataset:
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'PeftModelForFeatureExtraction'})
(1): Pooling({'embedding_dimension': 1024, 'pooling_mode': 'mean', 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Adc05102002/bge-m3-vi-tune")
# Run inference
sentences = [
'Quản lý và sử dụng Quỹ Thi đua, Khen thưởng ngành Văn hóa, Thể thao và Du lịch được quy định như thế nào?',
'Điều 67. Quản lý quỹ thi đua, khen thưởng\n\n\tKhoản 1. Quỹ thi đua, khen thưởng của cấp nào do cơ quan thi đua, khen thưởng phối hợp với cơ quan tài chính cấp đó quản lý. Đối với cấp tỉnh, nguồn kinh phí chi cho công tác thi đua, khen thưởng do Ban Thi đua - Khen thưởng của tỉnh phối hợp với cơ quan tài chính cấp tỉnh quản lý và sử dụng theo tỷ lệ quy định trên cơ sở dự toán; việc quyết toán căn cứ số chi thực tế theo đúng chế độ, chính sách quy định.\n\n\tKhoản 2. Thủ trưởng cơ quan các cấp chịu trách nhiệm chi tiền thưởng cho các tập thể, cá nhân thuộc biên chế, quỹ lương do cấp mình quản lý và hạch toán chi theo quy định.\nCác tập thể, cá nhân thuộc bộ, ban, ngành, đoàn thể trung ương, tỉnh, thành phố trực thuộc trung ương được Thủ tướng Chính phủ, Chủ tịch nước quyết định khen thưởng thì bộ, ban, ngành, tỉnh, đoàn thể trung ương đó có trách nhiệm chi thưởng từ ngân sách nhà nước của cấp mình và hạch toán chi thành mục riêng.\nCá nhân được nhận danh hiệu Nhà giáo, Thầy thuốc, Nghệ sỹ, Nghệ nhân (nhân dân và ưu tú) thuộc bộ, ban, ngành, tỉnh, đoàn thể trung ương trình Thủ tướng Chính phủ xét, phong tặng thì bộ, ban, ngành, tỉnh, đoàn thể trung ương đó chi trả tiền thưởng và hạch toán chi thành mục riêng.',
'phần đường, làn đường, không giữ khoảng cách an toàn giữa hai xe theo quy định gây tai nạn giao thông hoặc đi vào đường có biển báo hiệu có nội dung cấm đi vào đối với loại phương tiện đang điều khiển, đi ngược chiều của đường một chiều, đi ngược chiều trên đường có biển \n\t\t\t“Cấm đi ngược chiều”\n gây tai nạn giao thông, trừ các hành vi vi phạm quy định tại điểm a khoản 8 Điều này;\n\n\t\tĐiểm b) Điều khiển xe lạng lách, đánh võng; chạy quá tốc độ đuổi nhau trên đường bộ; dùng chân điều khiển vô lăng xe khi xe đang chạy trên đường;\n\n\t\tĐiểm c) Điều khiển xe chạy quá tốc độ quy định trên 35 km/h.\n\n\tKhoản 8. Phạt tiền từ 1\n\tKhoản 000.000 đồng đến 1\n\t\tĐiểm a) Điều khiển xe đi ngược chiều trên đường cao tốc, lùi xe trên đường cao tốc, trừ các xe ưu tiên đang đi làm nhiệm vụ khẩn cấp theo quy định;\n\n\t\tĐiểm b) Gây tai nạn giao thông không dừng lại, không giữ nguyên hiện trường, bỏ trốn không đến trình báo với cơ quan có thẩm quyền, không tham gia cấp cứu người bị nạn;\n\n\t\tĐiểm c) Điều khiển xe trên đường mà trong máu hoặc hơi thở có nồng độ cồn vượt quá 50 miligam đến 80 miligam/100 mililít máu hoặc vượt quá 0,25 miligam đến 0,4 miligam/1 lít khí thở.\n\n\tKhoản 9. Phạt tiền từ 1\n\tKhoản 000.000 đồng đến \n\tKhoản 000.000 đồng đối với hành vi vi phạm quy định tại điểm b khoản 7 Điều này mà không chấp hành hiệu lệnh dừng xe của người thi hành công vụ hoặc gây tai nạn giao thông.\n\n\tKhoản 10. Phạt tiền từ \n\tKhoản 000.000 đồng đến \n\t\tĐiểm a) Điều khiển xe trên đường mà trong máu hoặc hơi thở có nồng độ cồn vượt quá 80 miligam/100 mililít máu hoặc vượt quá 0,4 miligam/1 lít khí thở;\n\n\t\tĐiểm b) Không chấp hành yêu cầu kiểm tra về nồng độ cồn của người thi hành công vụ;\n\n\t\tĐiểm c) Điều khiển xe trên đường mà trong cơ thể có chất ma túy;\n\n\t\tĐiểm d) Không chấp hành yêu cầu kiểm tra về chất ma túy của người thi hành công vụ.\n\n',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.5005, -0.1257],
# [ 0.5005, 1.0000, -0.2017],
# [-0.1257, -0.2017, 1.0000]])
Training Details
Training Dataset
train
Size: 5,516 training samples
Columns:
anchorandpositiveApproximate statistics based on the first 1000 samples:
anchor positive type string string details - min: 10 tokens
- mean: 31.22 tokens
- max: 57 tokens
- min: 72 tokens
- mean: 610.9 tokens
- max: 1219 tokens
Samples:
anchor positive Công an xã xử phạt lỗi không mang bằng lái xe có đúng không?Điều 7. Nhiệm vụ của lực lượng Cảnh sát khác và Công an xãKhoản 1. Bố trí lực lượng tham gia tuần tra, kiểm soát trật tự, an toàn giao thông theo kế hoạch. Khoản 2. Thống kê, báo cáo các vụ, việc vi phạm pháp luật, tai nạn giao thông đường bộ; kết quả tuần tra, kiểm soát và xử lý vi phạm hành chính về trật tự, an toàn giao thông đường bộ theo sự phân công trong kế hoạch. Khoản 3. Trường hợp không có lực lượng Cảnh sát giao thông đi cùng thì lực lượng Cảnh sát khác và Công an xã thực hiện việc tuần tra, kiểm soát theo kế hoạch đã được cấp có thẩm quyền phê duyệt. Khoản 4. Lực lượng Công an xã chỉ được tuần tra, kiểm soát trên các tuyến đường liên xã, liên thôn thuộc địa bàn quản lý và xử lý các hành vi vi phạm trật tự, an toàn giao thông sau: điều khiển xe mô tô, xe gắn máy không đội mũ bảo hiểm, chở quá số người quy định, chở hàng hóa cồng kềnh; đỗ xe ở lòng đường trái quy định; điều khiển phương tiện phóng nhanh, lạng lách, đánh võng, tháo ống xả, không có gương chiếu hậu hoặ...</code> ||
Phải thực hiện thao tác nạp mẫu vào bình chứa và xử lý mẫu sơ bộ bằng hóa chất như thế nào?|Điều 11. Tiến hành lấy, bảo quản mẫuĐiểm a) Dọn sạch khu vực đã chọn làm điểm thu mẫu để loại bỏ các cặn, bùn, các lớp vi khuẩn ở trên thành cống thải, vật nổi trên mặt nước. Nếu dòng thải không có điều kiện chảy rối thì thực hiện như khoản 3 Điều Điểm b) Kiểm tra lại độ sạch của các bình chứa mẫu, dụng cụ lấy và chứa mẫu trung gian. Rà soát và chuẩn bị các dụng cụ và hóa chất để xử lý sơ bộ. Kiểm tra và chuẩn bị vật tư niêm phong. Chuẩn bị các trang thiết bị bảo hộ và các điều kiện cần thiết khác (có thể ghi và dán nhãn mẫu vào thời điểm này); Điểm c) Lắp dụng cụ lấy mẫu (nối cán của cây lấy mẫu, buộc dây gàu), mặc bảo hộ lao động và các thiết bị bảo đảm an toàn khác. Điểm a) Việc lấy mẫu phải có mặt chủ nguồn thải hoặc người đại diện của cơ sở có nguồn thải. Trường hợp chủ nguồn thải hoặc người đại diện vắng mặt hoặc không hợp tác thì trưởng đoàn công tác có trách nhiệm lập biên bản về sự vắng mặt hoặc không hợp tác và phải có người chứng kiến việc lấy mẫu; Điểm b) Tr...</code> ||
Trình tự đánh giá chất lượng hàng năm đối với Kiểm soát viên được quy định như thế nào?|Điều 13. Trình tự, thủ tục đánh giáĐiểm a) Người quản lý doanh nghiệp nhà nước viết bản tự nhận xét, đánh giá theo nội dung, tiêu chí đánh giá và tự nhận mức độ xếp loại chất lượng; Điểm b) Hội đồng thành viên họp nhận xét, đánh giá đối với người quản lý doanh nghiệp. Cuộc họp đánh giá, xếp loại chất lượng được ghi thành biên bản, trong đó nêu rõ thành phần tham dự, các ý kiến tham gia; Điểm c) Lấy ý kiến bằng văn bản về đánh giá, xếp loại chất lượng người quản lý doanh nghiệp của cấp ủy cùng cấp; Điểm d) Trên cơ sở ý kiến của cấp ủy cùng cấp, Hội đồng thành viên hoặc Chủ tịch công ty xem xét, quyết định đánh giá, xếp loại chất lượng đối với người quản lý doanh nghiệp theo thẩm quyền hoặc báo cáo kết quả đánh giá, xếp loại chất lượng Chủ tịch Hội đồng thành viên, thành viên Hội đồng thành viên, Chủ tịch công ty gửi cơ quan đại diện chủ sở hữu xem xét, quyết định. Điểm a) Kiểm soát viên viết bản tự nhận xét, đánh giá và tự nhận mức độ xếp loại chất lượng gửi đến cơ quan ...</code> |Loss:
CachedMultipleNegativesRankingLosswith these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "mini_batch_size": 32, "gather_across_devices": false, "directions": [ "query_to_doc" ], "partition_mode": "joint", "hardness_mode": null, "hardness_strength": 0.0 }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 32
num_train_epochs: 5
learning_rate: 3e-05
lr_scheduler_type: constant_with_warmup
warmup_steps: 0.03
fp16: True
batch_sampler: no_duplicates
All Hyperparameters
Click to expand
per_device_train_batch_size: 32
num_train_epochs: 5
max_steps: -1
learning_rate: 3e-05
lr_scheduler_type: constant_with_warmup
lr_scheduler_kwargs: None
warmup_steps: 0.03
optim: adamw_torch_fused
optim_args: None
weight_decay: 0.0
adam_beta1: 0.9
adam_beta2: 0.999
adam_epsilon: 1e-08
optim_target_modules: None
gradient_accumulation_steps: 1
average_tokens_across_devices: True
max_grad_norm: 1.0
label_smoothing_factor: 0.0
bf16: False
fp16: True
bf16_full_eval: False
fp16_full_eval: False
tf32: None
gradient_checkpointing: False
gradient_checkpointing_kwargs: None
torch_compile: False
torch_compile_backend: None
torch_compile_mode: None
use_liger_kernel: False
liger_kernel_config: None
use_cache: False
neftune_noise_alpha: None
torch_empty_cache_steps: None
auto_find_batch_size: False
log_on_each_node: True
logging_nan_inf_filter: True
include_num_input_tokens_seen: no
log_level: passive
log_level_replica: warning
disable_tqdm: False
project: huggingface
trackio_space_id: trackio
per_device_eval_batch_size: 8
prediction_loss_only: True
eval_on_start: False
eval_do_concat_batches: True
eval_use_gather_object: False
eval_accumulation_steps: None
include_for_metrics: []
batch_eval_metrics: False
save_only_model: False
save_on_each_node: False
enable_jit_checkpoint: False
push_to_hub: False
hub_private_repo: None
hub_model_id: None
hub_strategy: every_save
hub_always_push: False
hub_revision: None
load_best_model_at_end: False
ignore_data_skip: False
restore_callback_states_from_checkpoint: False
full_determinism: False
seed: 42
data_seed: None
use_cpu: False
accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
parallelism_config: None
dataloader_drop_last: False
dataloader_num_workers: 0
dataloader_pin_memory: True
dataloader_persistent_workers: False
dataloader_prefetch_factor: None
remove_unused_columns: True
label_names: None
train_sampling_strategy: random
length_column_name: length
ddp_find_unused_parameters: None
ddp_bucket_cap_mb: None
ddp_broadcast_buffers: False
ddp_backend: None
ddp_timeout: 1800
fsdp: []
fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
deepspeed: None
debug: []
skip_memory_metrics: True
do_predict: False
resume_from_checkpoint: None
warmup_ratio: None
local_rank: -1
prompts: None
batch_sampler: no_duplicates
multi_dataset_batch_sampler: proportional
router_mapping: {}
learning_rate_mapping: {}
Training Logs
Epoch
Step
Training Loss
0.0578
10
3.4042
0.1156
20
3.4242
0.1734
30
3.3575
0.2312
40
3.3364
0.2890
50
3.3027
0.3468
60
3.2140
0.4046
70
3.1071
0.4624
80
3.0983
0.5202
90
3.0155
0.5780
100
2.9224
0.6358
110
2.8186
0.6936
120
2.7603
0.7514
130
2.7636
0.8092
140
2.7688
0.8671
150
2.5655
0.9249
160
2.5714
0.9827
170
2.5100
1.0405
180
2.3449
1.0983
190
2.4728
1.1561
200
2.2962
1.2139
210
2.3515
1.2717
220
2.2728
1.3295
230
2.2553
1.3873
240
2.2241
1.4451
250
2.3062
1.5029
260
2.3398
1.5607
270
2.0516
1.6185
280
2.1120
1.6763
290
2.1730
1.7341
300
2.1035
1.7919
310
2.0691
1.8497
320
2.0123
1.9075
330
1.9984
1.9653
340
2.0118
2.0231
350
1.8542
2.0809
360
1.9576
2.1387
370
1.6936
2.1965
380
1.9642
2.2543
390
1.7611
2.3121
400
1.7278
2.3699
410
1.7350
2.4277
420
1.9592
2.4855
430
1.7795
2.5434
440
1.7016
2.6012
450
1.7765
2.6590
460
1.6856
2.7168
470
1.7306
2.7746
480
1.7065
2.8324
490
1.4620
2.8902
500
1.6106
2.9480
510
1.6705
3.0058
520
1.5199
3.0636
530
1.5497
3.1214
540
1.4253
3.1792
550
1.5167
3.2370
560
1.4550
3.2948
570
1.3935
3.3526
580
1.4080
3.4104
590
1.4052
3.4682
600
1.5440
3.5260
610
1.4851
3.5838
620
1.2712
3.6416
630
1.4262
3.6994
640
1.3924
3.7572
650
1.4750
3.8150
660
1.2477
3.8728
670
1.2456
3.9306
680
1.4857
3.9884
690
1.3898
4.0462
700
1.3008
4.1040
710
1.2095
4.1618
720
1.2976
4.2197
730
1.2864
4.2775
740
1.1289
4.3353
750
1.1390
4.3931
760
1.2896
4.4509
770
1.4013
4.5087
780
1.2712
4.5665
790
1.0540
4.6243
800
1.2158
4.6821
810
1.1734
4.7399
820
1.2259
4.7977
830
1.1259
4.8555
840
1.1196
4.9133
850
1.1762
4.9711
860
1.1654
Training Time
- Training: 2.7 hours
Framework Versions
- Python: 3.12.13
- Sentence Transformers: 5.4.1
- Transformers: 5.5.0
- PyTorch: 2.10.0+cu128
- Accelerate: 1.13.0
- Datasets: 4.3.0
- Tokenizers: 0.22.2
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
CachedMultipleNegativesRankingLoss
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
- Downloads last month
- 20