hiudev commited on
Commit
bfd87aa
·
verified ·
1 Parent(s): 47675b5

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "embedding_dimension": 1024,
3
+ "pooling_mode": "cls",
4
+ "include_prompt": true
5
+ }
README.md ADDED
@@ -0,0 +1,491 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:15
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: BAAI/bge-m3
10
+ widget:
11
+ - source_sentence: Trong quá trình chỉnh sửa, công cụ nào cho phép xem trước trước
12
+ khi áp dụng thay đổi?
13
+ sentences:
14
+ - 'Phân mềm Mouse Skills là một phần mềm hữu ích giúp em luyện tập sử dụng chuột.
15
+ ![](images/781fc7345f120e415a307148302179d60c5356b1bebb70f4c9e67895d543cad3.jpg)
16
+ # Hoạt động 1 Hãy kích hoạt phần mềm Mouse Skills. Tiếp theo, em gỗ phím N, di
17
+ chuyển chuột và nói với bạn những gì em đã thấy trong các mô tả sau đây: <table><tr><td>Điểm
18
+ số (Score) thay đổi</td><td>Các hình vuông màu sắc</td><td>Kích thước các hình
19
+ vuông lớn dần</td></tr><tr><td>Kích thước các hình vuông nhỏ dần</td><td>Vị trí
20
+ các hình vuông giữ nguyên</td><td>Cửa (Stage) thay đổi</td></tr></table> ![](images/5dbe6a665d0ae7d7f2d7cfe028042350b8065a331a6c16fd61650e1ac23a73ac.jpg)
21
+ <details> <summary>flowchart</summary> ```mermaid'
22
+ - '``` # Hình 3. Chương trình giải bài toán Quản lí tiền điện Với chương trình vừa
23
+ viết xong cần phải chạy thử và kiểm tra xem chương trình có lỗi hay không và nếu
24
+ tìm thấy thì phải sửa tất cả các lỗi tìm được. Đây là bước cuối cùng, bước Kiểm
25
+ thử, chạy và hiệu chỉnh chương trình. Có thể xem quá trình giải bài toán bằng
26
+ lập trình trên máy tính có các bước như sau: Bước 1. Xác định bài toán. Bước 2.
27
+ Tìm thuật toán giải bài toán và cách tổ chức dữ liệu.'
28
+ - <summary>text_image</summary> Document2 - Word File Home Insert Design Layout
29
+ References Mailings Review View Help Tell me Share Cut Calibri (Body) 11 Copy
30
+ B I U abc x₂ x² A Format Painter A a A A A Clipboard Font Paragraph Styles Editing
31
+ </details> Hình 6a ![](images/f3fa0863274d5d6641680b020c52114f9d640ca18167a05f9a273341c936e999.jpg)
32
+ - '– Lựa chọn được đối tượng làm hình mẫu để thực hành sáng tạo. # Sáng tạo và ứng
33
+ dụng thẩm mĩ: \- Biết kết hợp vẽ, cắt, xé, dán,... trong thực hành, sáng tạo.
34
+ \- Tạo được sản phẩm có sự lập lại của hình, khối dạng cơ bản. \- Thế hiện được
35
+ màu đãm, màu nhạt ở sản phẩm. \- Biết vận dụng tính chất lặp lại, nhịp điều của
36
+ chấm, nét hoặc hình, màu trong thực hành, sáng tạo. \- Biết cách bảo quản sản
37
+ phẩm và công cụ thực hành. # Phân tích và đánh giá thẩm mĩ: \- Biết trưng bày
38
+ sản phẩm ở trong hoặc ngoài lớp học. – Trả lời được các câu hỏi: Sản phẩm dùng
39
+ để làm gì?'
40
+ - Split view Help Reset OK Cancel </details> Hình 10b.7. Hộp thoại Brightness-Contrast
41
+ ![](images/b8ad6a9cdf4b4a94f361eb53d1787f81613b93dfc32da9df02720c6504c3f84a.jpg)
42
+ <details>
43
+ - source_sentence: Đối với bức ảnh Hình 10b.2b, công cụ nào được dùng để chèn văn
44
+ bản "Vườn hồng"?
45
+ sentences:
46
+ - '# BÀI 10b # THÊM VĂN BẦN, TẠO HIỆU ỨNG CHO ẦNH # Sau bài học này em sẽ: \- Thực
47
+ hiện được các thao tác xử lí ảnh: thêm văn bản, điều chỉnh độ sáng, độ tương phản,
48
+ làm mờ, làm sắc nét. ![](images/e4a8b1c03e595f3f326263d925eb66315cb29f398746bfe1a90af6279f4aa8af.jpg)
49
+ An: Minh ơi, câu xem một vài bức ảnh tố chụp trường mình này. Tớ muốn chỉnh sửa
50
+ các ảnh đó và thêm chú thích từng khu vực trong trường vào ảnh để gửi cho bạn
51
+ học cùng trường tiểu học. Cậu có biết công cụ nào của phần mềm chỉnh sửa ảnh làm
52
+ được điều đó không? Minh: Có chú. Tór thấy một số ảnh cầu chụp bị tối, cần tăng
53
+ độ sáng lên và chỉnh thêm về màu sắc ảnh nữa thì sẽ đẹp đáy.'
54
+ - 'Hình ảnh được chèn thêm văn bản # 2. TẠO HIỆU ỨNG CHO ẢNH # Hoạt động 2 Độ sáng
55
+ của hình ảnh 1. Em hãy quan sát các bức ảnh ở Hình 10b.1 và cho nhận xét về độ
56
+ sáng của mỗi ảnh. 2. Theo em có thể thay đổi độ sáng của ảnh không? ![](images/783357365b92b7d7f69557aaff4db6d26475bcfd0bee537e8e7cc41633aa5e4c.jpg)
57
+ Hình ảnh được chụp từ máy ảnh kĩ thuật số không phải lúc nào cũng hoàn hảo.'
58
+ - 'Hình 9b.5 ![](images/a8bcac8ffa875c129d5a0fe2a6067ce41bf4c7559838dfba5203b31574d17dab.jpg)
59
+ <details> <summary>natural_image</summary> Exterior view of a multi-story residential
60
+ building with parked cars and trees, no visible text or signage </details> Hình
61
+ 9b.6 # 2. THỰC HÀNH: SỬ DỤNG MỘT S Ble CÔNG CỤ CHÌNH SỬA ÀNH Nhiệm vụ 1: Em hãy
62
+ sử dụng phần mềm chỉnh sửa ảnh để cắt phần ảnh bị ngón tay che ở Hình 8b.1 trong
63
+ Bài 8b.'
64
+ - 'Tắc dụng của chèn thêm văn bản có thể đọc trong phần nội dung mới bài học.2.
65
+ Công cụ chèn văn bản vào ảnh: Text.</td><td>Thời gian cho hoạt động khoảng 10
66
+ – 15 phút.</td></tr></table> ![](images/79386141a55138130b8caa7e6629d07142429e073cd00e777970eb166f1fc3f1.jpg)
67
+ # Kiến thức mới (hoạt động đọc) GV lưu ý: Với một số phần mềm xử lí ảnh, cân chọn
68
+ đúng phòng chữ được phần mềm hỗ trợ để viết được chữ tiếng Việt. Nhấn mạnh với
69
+ HS khi định dạng văn bản thì cần chú ý, quan tâm đến cả tính thẩm mỹ, bổ cục của
70
+ văn bản và bức ảnh. # 2. Tạo hiệu ứng cho ảnh Hoạt động 2. Độ sáng của hình ảnh'
71
+ - 'Có thể thay đổi phông chữ cho văn bản chèn vào ảnh. B. Có thể tăng hoặc giảm
72
+ độ sáng của ảnh. C. Tăng độ tương phản cho ảnh là làm cho phần tối sáng hơn, phần
73
+ sáng tối hơn. D. Có thể làm mờ, làm sắc nét riêng từng đối tượng trong ảnh. #
74
+ 3. THỰC HÀNH: CHÌNH SỰA ẢNH Nhiệm vụ 1: Chèn dòng chữ "Vườn hồng" vào ảnh như
75
+ Hình 10b.2b.'
76
+ - source_sentence: Khi sử dụng công cụ Brightness-Contrast, người dùng cần làm gì
77
+ để điều chỉnh độ sáng?
78
+ sentences:
79
+ - '# CÓ THẾ EM CHUA BIẾT Để tăng lực từ của nam châm điện tác dụng lên một vật,
80
+ ngoài việc tăng cường độ dòng điện chạy qua các vòng dây hoặc tăng số vòng của
81
+ ống dây, còn có các cách khác nhu cho lỗi sắt một hình dạng thích hợp, tăng khối
82
+ lượng của nam châm. Nam châm được chế tạo không máy khó khăn và ít tổn kém nhưng
83
+ lại có vai trò quan trọng và được ứng dụng rộng rãi trong đời sống cũng như trong
84
+ kĩ thuật. Vậy nam châm có những ứng dụng nào trong thực tế? # I - LOA ĐIỆN # 1.
85
+ Nguyên tắc hoạt động của loa điện Loa điện hoạt động dựa vào tác dụng từ của nam
86
+ châm lên ống dây có dòng điện chạy qua. a) Thí nghiệm Mắc mạch điện theo hình
87
+ 26.1.'
88
+ - 'Bài tập 2: Bật cao tại chỗ, hai tay chống hông khoảng 25 – 30 lần, lập lại 2
89
+ lần; sau mỗi lần, cần đi lại và hít thở sâu trong vòng 1 phút. Liu y: - Các trường
90
+ hợp không nên cho HS tập luyện hoặc tập thể lực: có bệnh về xuống khớp; mới hồi
91
+ phục sau các chắn thương; có bệnh về mạch máu; bệnh tim mạch, đau xuống hoặc phù
92
+ hai tay. - Ngoài ra, GV cân quan sát khi luyện tập và thực hiện bài tập thể lực,
93
+ nếu HS có các dấu hiệu như: tái mặt, choáng váng, chóng mặt, đau thất vùng ngực,
94
+ khó thở, đau ở vùng lưng, vùng gối, cổ chân,... thì cân cho HS dùng lại ngay để
95
+ nghi ngơi hoặc được chăm sóc y tế. # 4. Vận dụng'
96
+ - 'Color Name: 100 00 Mudin hõng 168.208 00 15.01% Mudin hõng (29.4.008) </details>'
97
+ - 'Hãy mô tả những hoạt động phòng trừ sâu hại trong Hình 15.3. ![](images/ecc06a943fc7aaed2fc836e3e824e30667173eb11d17f59d104a2c3781cb0941.jpg)
98
+ Có thể áp dụng biện pháp cơ giới, vật lí nào đề phòng trừ sâu, bệnh hại trên cây
99
+ trồng ở gia đình hoặc địa phương em? # 1.3. Biện pháp sử dụng giống chống chịu
100
+ sâu, bệnh Nội dung: sử dụng những giống cây trồng mang gen chống chịu sâu, bệnh
101
+ hại. Ví dụ: Giống lúa CP10 kháng rầy nâu; giống ngô nếp lai HN88 kháng sâu đục
102
+ bắp, giống cà phê TR4 kháng bệnh gì sắt, giống cà chua CVR9 kháng bệnh virus vàng
103
+ xoắn lá,... Uu điểm: giảm chi phí phòng trừ sâu, bệnh; không gây ô nhiễm môi trường;'
104
+ - '\- Trước tiên, GV có thể đặt câu hỏi: + Các em có thích đi công viên không? +
105
+ Tại sao các em thích đi công viên? Ô đó có những hoạt động gì? \- Tiếp đến, GV
106
+ nên yêu cầu HS quan sát tranh và đoán tên các tiết mục được minh hoạ. # Lùu y:
107
+ - Các tiết mục trong bằng được đua ra theo thứ tự thời gian bắt đầu biểu diễn,
108
+ vì vậy GV nên yêu cầu HS quan sát các bức tranh tương ứng với các tiết mục theo
109
+ thứ tự như trong bằng đua ra. Từ đó nêu thời gian bắt đầu diễn ra cho mỗi tiết
110
+ mục. - Sau khi hoàn thành câu a, GV có thể đặt thêm một số câu hỏi, chằng hạn:
111
+ “Trong các tiết mục được nêu ra, em thích tiết mục nào nhất?”; “Có bạn nào thích
112
+ tiết mục khác với các tiết mục được nêu ra trong SGK không?”...'
113
+ - source_sentence: Thao tác làm mờ ảnh có thể gây ra hậu quả gì nếu áp dụng quá mức?
114
+ sentences:
115
+ - Tuy nhiên, việc thêm quá nhiều độ mờ, độ sắc nét có thể làm cho hình ảnh trong
116
+ xấu hơn hoặc dẫn đến mất chi tiết của ảnh. ![](images/19827e0c8ec5e6790bff840dcbec5fdde733d842720843c8a21c307717c95744.jpg)
117
+ <details> <summary>natural_image</summary> Close-up of a vibrant red rose with
118
+ green leaves in the background (no text or symbols visible) </details> a) Ảnh
119
+ gốc ![](images/1d6a4adfd3f350dfa21fde18bed8a958acdd55fb591473207a8fbbbecfb9b43c.jpg)
120
+ <details> <summary>natural_image</summary>
121
+ - 'Tuy nhiên, GV chỉ dạy 1, 2 trường hợp làm mờ cụ thể để HS hiểu. GV giới thiệu
122
+ thêm các lựa chọn khác và yêu cầu HS tự tìm hiểu, vận dụng tương tự. ![](images/3ea8575cc5e20af05e9e5df340a24d3a141f1f5c0ce752f45dcbff08cfa6a083.jpg)
123
+ # Hoạt động luyện tập GV định hướng và nhân mạnh với HS các hình ảnh chính sửa
124
+ trong bài sẽ lưu lại và dùng để phục vụ mục đích tạo ra sản phẩm thực hành trong
125
+ Bài 11b. GV yêu cầu HS sử dụng lại các hình ảnh đã chính sửa trong Bài 9b và tiếp
126
+ tục hoàn thành các ảnh đó với yêu cầu chính sửa độ sáng, độ tương phản, độ mờ,...
127
+ Sau khi làm xong, HS tạo một thu mục BAI10b trong thu mục HINHANH và lưu tất cả
128
+ sản phẩm đã hoàn thiện vào thu mục đó. ![](images/226297ca96e6ecab0750735faa803398f1688055d6b7f3f11532d0280bd068fd.jpg)
129
+ # Hoạt động vận dụng HS có thể sử dụng các hình ảnh khác để thực hành.'
130
+ - 'Aa Arial Bold Italic Condense Aa Arial Condensed Aa Arial Heavy Aa Arial Italic
131
+ </details> Hình 10b.1 # Nhiêm vụ 2: GV lưu ý cho HS khi thao tác điều chỉnh độ
132
+ sáng, độ tương phản, ngoài cách kéo thả nhu SGK đã huống dẫn thì HS có thể diễn
133
+ mức độ theo giá trị tủ –127 đến 127. # Nhiêm vụ 3: Có rất nhiều lựa chọn làm mờ
134
+ hình ảnh trong bộ lọc Filters/Blur.'
135
+ - '<details> <summary>text_image</summary> a) Ānh gốc b) Ānh sau khi tăng độ tương
136
+ phải </details> Hình 10b.4. Điều chỉnh độ tương phản cho ảnh # c) Độ mò, độ sắc
137
+ nét (Blur, Sharpen) Phần mềm xử lí ảnh cung cấp công cụ làm mờ, làm sắc nét ảnh.
138
+ Em có thể sử dụng để làm mờ một vùng quá nổi bật trong ảnh, làm sắc nét riêng
139
+ một đối tượng hoặc làm mờ nền xung quanh ảnh để làm nổi bật chủ thể bức ảnh.'
140
+ - 'Có thể thay đổi phông chữ cho văn bản chèn vào ảnh. B. Có thể tăng hoặc giảm
141
+ độ sáng của ảnh. C. Tăng độ tương phản cho ảnh là làm cho phần tối sáng hơn, phần
142
+ sáng tối hơn. D. Có thể làm mờ, làm sắc nét riêng từng đối tượng trong ảnh. #
143
+ 3. THỰC HÀNH: CHÌNH SỰA ẢNH Nhiệm vụ 1: Chèn dòng chữ "Vườn hồng" vào ảnh như
144
+ Hình 10b.2b.'
145
+ - source_sentence: Khi muốn làm nổi bật bông hoa bằng cách làm mờ nền, công cụ nào
146
+ nên dùng?
147
+ sentences:
148
+ - 'Có thể thay đổi phông chữ cho văn bản chèn vào ảnh. B. Có thể tăng hoặc giảm
149
+ độ sáng của ảnh. C. Tăng độ tương phản cho ảnh là làm cho phần tối sáng hơn, phần
150
+ sáng tối hơn. D. Có thể làm mờ, làm sắc nét riêng từng đối tượng trong ảnh. #
151
+ 3. THỰC HÀNH: CHÌNH SỰA ẢNH Nhiệm vụ 1: Chèn dòng chữ "Vườn hồng" vào ảnh như
152
+ Hình 10b.2b.'
153
+ - '<details> <summary>text_image</summary> a) Ānh gốc b) Ānh sau khi tăng độ tương
154
+ phải </details> Hình 10b.4. Điều chỉnh độ tương phản cho ảnh # c) Độ mò, độ sắc
155
+ nét (Blur, Sharpen) Phần mềm xử lí ảnh cung cấp công cụ làm mờ, làm sắc nét ảnh.
156
+ Em có thể sử dụng để làm mờ một vùng quá nổi bật trong ảnh, làm sắc nét riêng
157
+ một đối tượng hoặc làm mờ nền xung quanh ảnh để làm nổi bật chủ thể bức ảnh.'
158
+ - float Anh\_Crop \- Sử dụng công cụ Gradient để đồ màu (chuyển đàn giữa màu nền
159
+ và màu vẽ) cho lớp Khungvien. Thực hiện các bước như hướng dẫn trong Hình 11b.4.
160
+ ![](images/c1c902d204cfdc9b814e35d13da30fc207962b5dac51551a3e989b04df6beef1.jpg)
161
+ <details> <summary>text_image</summary> 1. Chọn công cụ Gradient 2. Nhấy chuột
162
+ vào hai ô vuông để chọn màu nền và màu vẽ
163
+ - 'Text #1 Background </details> b) Hai lớp trên cùng có thứ tự hợp lí Hình 5. Thay
164
+ đổi thứ tự của các lớp # 3 Sử dụng vùng chọn # a) Vùng chọn và các công cụ tạo
165
+ vùng chọn Vùng chọn giúp xử lí riêng biệt một vùng nào đó trên ảnh, ví dụ như:
166
+ tổ màu, vẽ hình. Hai công cụ phổ biến để tạo vùng chọn hình chữ nhật và hình elip
167
+ tương ứng là Rectangle Select □ và Ellipse Select ●.'
168
+ - Tủy theo đặc điểm của ảnh cần tách khởi nền mà sử dụng công cụ tách ảnh phù hợp.
169
+ Sau đây là cách tách ảnh phổ biến bằng công cụ Free Select (công cụ chọn tự do).
170
+ Bước 1. Chọn ảnh nguồn và thêm kênh alpha vào lớp ảnh \- Chọn lớp ảnh cần xử lí,
171
+ ví dụ chọn lớp ảnh Hộp quả. \- Thêm kênh alpha vào lớp ảnh bằng cách thực hiện
172
+ lệnh Add Alpha Channel từ bằng chọn Layer\Transparency hoặc từ bằng chọn được
173
+ mở ra khi nháy chuột phải vào tên lớp ở bằng quản lí lớp. Ảnh bảy giờ có nền trong
174
+ suốt nên có thể chọn và tách các đối tượng ra khởi nền. Bước 2. Chọn đối tượng
175
+ cần tách ra khởi nền ảnh \- Nháy chuột chọn công cụ Free Select rời bắt đầu từ
176
+ một điểm bắt kì trên biên đối tượng, lần lượt nháy chuột vào xung quanh đối tượng
177
+ cần tách, ví dụ như Hình 3a.
178
+ pipeline_tag: sentence-similarity
179
+ library_name: sentence-transformers
180
+ ---
181
+
182
+ # SentenceTransformer based on BAAI/bge-m3
183
+
184
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for retrieval.
185
+
186
+ ## Model Details
187
+
188
+ ### Model Description
189
+ - **Model Type:** Sentence Transformer
190
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
191
+ - **Maximum Sequence Length:** 512 tokens
192
+ - **Output Dimensionality:** 1024 dimensions
193
+ - **Similarity Function:** Cosine Similarity
194
+ - **Supported Modality:** Text
195
+ <!-- - **Training Dataset:** Unknown -->
196
+ <!-- - **Language:** Unknown -->
197
+ <!-- - **License:** Unknown -->
198
+
199
+ ### Model Sources
200
+
201
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
202
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
203
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
204
+
205
+ ### Full Model Architecture
206
+
207
+ ```
208
+ SentenceTransformer(
209
+ (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'XLMRobertaModel'})
210
+ (1): Pooling({'embedding_dimension': 1024, 'pooling_mode': 'cls', 'include_prompt': True})
211
+ (2): Normalize({})
212
+ )
213
+ ```
214
+
215
+ ## Usage
216
+
217
+ ### Direct Usage (Sentence Transformers)
218
+
219
+ First install the Sentence Transformers library:
220
+
221
+ ```bash
222
+ pip install -U sentence-transformers
223
+ ```
224
+ Then you can load this model and run inference.
225
+ ```python
226
+ from sentence_transformers import SentenceTransformer
227
+
228
+ # Download from the 🤗 Hub
229
+ model = SentenceTransformer("hiudev/bge-m3-deepedu")
230
+ # Run inference
231
+ sentences = [
232
+ 'Khi muốn làm nổi bật bông hoa bằng cách làm mờ nền, công cụ nào nên dùng?',
233
+ '<details> <summary>text_image</summary> a) Ānh gốc b) Ānh sau khi tăng độ tương phải </details> Hình 10b.4. Điều chỉnh độ tương phản cho ảnh # c) Độ mò, độ sắc nét (Blur, Sharpen) Phần mềm xử lí ảnh cung cấp công cụ làm mờ, làm sắc nét ảnh. Em có thể sử dụng để làm mờ một vùng quá nổi bật trong ảnh, làm sắc nét riêng một đối tượng hoặc làm mờ nền xung quanh ảnh để làm nổi bật chủ thể bức ảnh.',
234
+ 'float Anh\\_Crop \\- Sử dụng công cụ Gradient để đồ màu (chuyển đàn giữa màu nền và màu vẽ) cho lớp Khungvien. Thực hiện các bước như hướng dẫn trong Hình 11b.4. ![](images/c1c902d204cfdc9b814e35d13da30fc207962b5dac51551a3e989b04df6beef1.jpg) <details> <summary>text_image</summary> 1. Chọn công cụ Gradient 2. Nhấy chuột vào hai ô vuông để chọn màu nền và màu vẽ',
235
+ ]
236
+ embeddings = model.encode(sentences)
237
+ print(embeddings.shape)
238
+ # [3, 1024]
239
+
240
+ # Get the similarity scores for the embeddings
241
+ similarities = model.similarity(embeddings, embeddings)
242
+ print(similarities)
243
+ # tensor([[1.0000, 0.5892, 0.5468],
244
+ # [0.5892, 1.0000, 0.5841],
245
+ # [0.5468, 0.5841, 1.0000]])
246
+ ```
247
+ <!--
248
+ ### Direct Usage (Transformers)
249
+
250
+ <details><summary>Click to see the direct usage in Transformers</summary>
251
+
252
+ </details>
253
+ -->
254
+
255
+ <!--
256
+ ### Downstream Usage (Sentence Transformers)
257
+
258
+ You can finetune this model on your own dataset.
259
+
260
+ <details><summary>Click to expand</summary>
261
+
262
+ </details>
263
+ -->
264
+
265
+ <!--
266
+ ### Out-of-Scope Use
267
+
268
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
269
+ -->
270
+
271
+ <!--
272
+ ## Bias, Risks and Limitations
273
+
274
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
275
+ -->
276
+
277
+ <!--
278
+ ### Recommendations
279
+
280
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
281
+ -->
282
+
283
+ ## Training Details
284
+
285
+ ### Training Dataset
286
+
287
+ #### Unnamed Dataset
288
+
289
+ * Size: 15 training samples
290
+ * Columns: <code>anchor</code>, <code>positive</code>, <code>negative_1</code>, <code>negative_2</code>, <code>negative_3</code>, and <code>negative_4</code>
291
+ * Approximate statistics based on the first 15 samples:
292
+ | | anchor | positive | negative_1 | negative_2 | negative_3 | negative_4 |
293
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
294
+ | type | string | string | string | string | string | string |
295
+ | details | <ul><li>min: 19 tokens</li><li>mean: 22.0 tokens</li><li>max: 30 tokens</li></ul> | <ul><li>min: 33 tokens</li><li>mean: 140.13 tokens</li><li>max: 223 tokens</li></ul> | <ul><li>min: 76 tokens</li><li>mean: 161.8 tokens</li><li>max: 289 tokens</li></ul> | <ul><li>min: 88 tokens</li><li>mean: 174.73 tokens</li><li>max: 282 tokens</li></ul> | <ul><li>min: 72 tokens</li><li>mean: 190.13 tokens</li><li>max: 475 tokens</li></ul> | <ul><li>min: 107 tokens</li><li>mean: 169.13 tokens</li><li>max: 255 tokens</li></ul> |
296
+ * Samples:
297
+ | anchor | positive | negative_1 | negative_2 | negative_3 | negative_4 |
298
+ |:----------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
299
+ | <code>Thao tác chèn văn bản vào ảnh để ghi chú và tạo hiệu ứng là gì?</code> | <code># BÀI 10b # THÊM VĂN BẦN, TẠO HIỆU ỨNG CHO ẦNH # Sau bài học này em sẽ: \- Thực hiện được các thao tác xử lí ảnh: thêm văn bản, điều chỉnh độ sáng, độ tương phản, làm mờ, làm sắc nét. ![](images/e4a8b1c03e595f3f326263d925eb66315cb29f398746bfe1a90af6279f4aa8af.jpg) An: Minh ơi, câu xem một vài bức ảnh tố chụp trường mình này. Tớ muốn chỉnh sửa các ảnh đó và thêm chú thích từng khu vực trong trường vào ảnh để gửi cho bạn học cùng trường tiểu học. Cậu có biết công cụ nào của phần mềm chỉnh sửa ảnh làm được điều đó không? Minh: Có chú. Tór thấy một số ảnh cầu chụp bị tối, cần tăng độ sáng lên và chỉnh thêm về màu sắc ảnh nữa thì sẽ đẹp đáy.</code> | <code>Bước 5: Chèn và định dạng hộp văn bản. a) Chèn hộp văn bản \- Tạo hộp văn bản nằm ở lớp trên của các ảnh nền như Hình 3.1. 1. Chèn hình khối chữ nhật đặt ở vị trí lớp trên ảnh nên, di chuyển hình khối tới vị trí chính giữa như Hình 3.1. 2. Chọn hình khối vừa chèn, nháy nút phải chuột, nháy chọn Add Text trong danh sách lệnh hiện ra (Hình 3.5). 3. Con trò soan thảo sẽ xuất hiện bên trong hình khối, cho phép ta gỗ vào nội dung giới thiệu. b) Định dạng hộp văn bản</code> | <code>Hình ảnh được chèn thêm văn bản # 2. TẠO HIỆU ỨNG CHO ẢNH # Hoạt động 2 Độ sáng của hình ảnh 1. Em hãy quan sát các bức ảnh ở Hình 10b.1 và cho nhận xét về độ sáng của mỗi ảnh. 2. Theo em có thể thay đổi độ sáng của ảnh không? ![](images/783357365b92b7d7f69557aaff4db6d26475bcfd0bee537e8e7cc41633aa5e4c.jpg) Hình ảnh được chụp từ máy ảnh kĩ thuật số không phải lúc nào cũng hoàn hảo.</code> | <code>![](images/abdd80afb423ce6612314c3288867b4cd1b569b3fd921aade75775d3f0e1240a.jpg) # Hoạt động khởi động <table><tr><td>Mục tiêu</td><td>Tiền hành</td><td>Kết quả</td><td>Chú ý</td></tr><tr><td>Hoạt động này đặt HS vào việc khi chụp ảnh có thể sẽ gặp phải những bức ảnh như hình 10b.1 và có mong muốn thay đổi, chỉnh sửa để có bức ảnh đẹp hơn.</td><td>– GV yêu cầu HS làm việc theo nhóm. Với mỗi nhóm cụ thể GV cung cấp các hình ảnh khác nhau và yêu cầu HS duża ra mong muốn chỉnh sửa cho bức ảnh nhóm nhận được.– HS đọc nội dung phân khởi động, thảo luận duża ra các ý kiến cá nhân.– GV tổ chức cho cá nhân hoặc nhóm nhận xét các câu trả lời.</td><td>Mỗi nhóm HS sẽ duża ra được ý tưởng thay đổi bức ảnh khác nhau. Tổng hợp các ý kiến và nội dung của hoạt động khởi động chính là nội dung sẽ học trong bài.</td><td>Thời gian cho hoạt động khoảng 5 phút.</td></tr></table> # 1. Thêm văn bản Hoạt động 1. Thêm văn bản vào ảnh <table><tr><td>Mục tiêu</td><td>Tiền hành</td><td>Kết quả</td><td>Chú ý</td><...</code> | <code>Bước 2: Chèn ảnh vào văn bản. Trong tiết lí thuyết, chúng ta đã phân tích Hình 2.1 gồm 4 ảnh với vị trí và bổ cục như Hình 2.8. Để làm được như vậy, lần lượt thực hiện các thao tác sau: ![](images/c239d82b3be4389cb1944338dca0fb064eb6c2bd1b0c3e908c05dfede1e1bf01.jpg) <details> <summary>text_image</summary> Ảnh số 1 Ảnh số 2 Ảnh số 3 Ảnh số 4 </details> Hình 2.8.</code> |
300
+ | <code>Công cụ nào trong phần mềm chỉnh sửa ảnh cho phép điều chỉnh độ sáng và độ tương phản?</code> | <code>![](images/7fd697186cd1d3b935f711737d2129a79d61c52c1348dc54ba01bcfb71c5d07a.jpg) <details> <summary>natural_image</summary> Outdoor mural display with colorful painted murals and potted plants, no visible text or symbols </details> a ![](images/06b247e62d6e27bd7f0b30aad062c847b7dc4bd926097b6792b0431cf194dd37.jpg) <details> <summary>natural_image</summary> Close-up of a vibrant red rose surrounded by green foliage (no text or symbols visible)</code> | <code>Đặt 1 hạt dưa chuột nằm ngang giữa ô bầu. Dùng ngón tay ấn nhẹ hạt xuống sâu khoảng 0,5 cm. Gạt giá thể xung quanh lên hạt để lắp kín hạt. Dùng ô doa tươi đẩm khay bầu ngay sau khi gieo. Bước 3. Ghi chép nhật kí Ghi thông tin về giống, giá thể worm cây, phân bón và người lao động theo mẫu Bằng 11.2, 11.3. Bước 4. Chăm sóc Hằng ngày tưới giữ ẩm;</code> | <code># 1. Tính oxi hoá # a) Tác dụng với kim loại O nhiệt độ cao, nito tác dụng được với một số kim loại hoạt động như Ca, Mg, Al,... tạo thành nitrua kim loại. Thí dụ : $$ 3 \mathrm{Mg} + \stackrel {0} {\mathrm{N}} _ {2} \xrightarrow {\mathrm{t} ^ {\circ}} \mathrm{Mg} _ {3} \stackrel {- 3} {\mathrm{N}} _ {2} \text { magie nitrua } $$ # b) Tác dụng với hidro O nhiệt độ cao, áp suất cao và có mặt chất xúc tác, nito tác dụng trực tiếp với hidro, tạo ra khí amoniac.</code> | <code>Liu y: Khi giới thiệu động tác mới (đi đều vòng bên phải), GV cân tăng cường sử dụng các phương tiện trực quan, đa dạng hoá các hoạt động trong giờ học để thu hút và tạo hứng thú cho HS, GV không nên sử dụng đơn điều phương pháp giảng giải (thuyết trình) trong thời gian dài. Lời nói của GV phải đơn giản, để hiểu, ngắn gọn và phù hợp với vốn từ vựng của các em. # 2.3. Hình thành động tác mới GV có thể tiến hành nhu sau: – GV làm mẫu, cả lớp quan sát. Sau đó, GV gọi lân lượt một vài HS lên tập động tác đi đều vòng bên phải, cả lớp quan sát và nhận xét bạn tập. \- GV gọi 4 - 5 HS lên, huống dẫn cách thực hiện động tác một hàng dọc đi đều vòng bên phải và cho các em thực hiện 1 - 2 lần; cả lớp quan sát và nhận xét. Sau đó, GV cho các hàng thực hiện động tác này.</code> | <code># III. LUYÊN TÂP # GIÁO VIÊN CHO HỌC SINH TẬP LUYÊN VỚI NHẠC # 1. Luyện tập đồng loạt – theo nhóm \- Luyên tập đồng loạt: \+ Giáo viên cho học sinh đúng thành nhiều hàng ngang cách một sai tay và xen kê. \+ Giáo viên đếm nhịp cho cả lớp cùng tập: Giáo viên đếm chậm từng cử động của động tác cho học sinh tập theo. \+ Khi học sinh đã thực hiện tương đối theo nhịp chậm, giáo viên sẽ đếm nhịp nhanh hơn theo tốc độ của kĩ thuật động tác. \+ Giáo viên cho cả lớp cùng đếm để thuộc nhịp động tác, sau đó giáo viên có thể gọi một học sinh lên thực hiện cho cả lớp xem và nhận xét, sửa sai.</code> |
301
+ | <code>Việc tăng độ sáng cho ảnh có thể gây ra hậu quả gì nếu ảnh ban đầu quá tối?</code> | <code>Hình ảnh được chèn thêm văn bản # 2. TẠO HIỆU ỨNG CHO ẢNH # Hoạt động 2 Độ sáng của hình ảnh 1. Em hãy quan sát các bức ảnh ở Hình 10b.1 và cho nhận xét về độ sáng của mỗi ảnh. 2. Theo em có thể thay đổi độ sáng của ảnh không? ![](images/783357365b92b7d7f69557aaff4db6d26475bcfd0bee537e8e7cc41633aa5e4c.jpg) Hình ảnh được chụp từ máy ảnh kĩ thuật số không phải lúc nào cũng hoàn hảo.</code> | <code>Tuy nhiên, việc thêm quá nhiều độ mờ, độ sắc nét có thể làm cho hình ảnh trong xấu hơn hoặc dẫn đến mất chi tiết của ảnh. ![](images/19827e0c8ec5e6790bff840dcbec5fdde733d842720843c8a21c307717c95744.jpg) <details> <summary>natural_image</summary> Close-up of a vibrant red rose with green leaves in the background (no text or symbols visible) </details> a) Ảnh gốc ![](images/1d6a4adfd3f350dfa21fde18bed8a958acdd55fb591473207a8fbbbecfb9b43c.jpg) <details> <summary>natural_image</summary></code> | <code><details> <summary>text_image</summary> a) Ānh gốc b) Ānh sau khi tăng độ tương phải </details> Hình 10b.4. Điều chỉnh độ tương phản cho ảnh # c) Độ mò, độ sắc nét (Blur, Sharpen) Phần mềm xử lí ảnh cung cấp công cụ làm mờ, làm sắc nét ảnh. Em có thể sử dụng để làm mờ một vùng quá nổi bật trong ảnh, làm sắc nét riêng một đối tượng hoặc làm mờ nền xung quanh ảnh để làm nổi bật chủ thể bức ảnh.</code> | <code># BÀI 10b # THÊM VĂN BẦN, TẠO HIỆU ỨNG CHO ẦNH # Sau bài học này em sẽ: \- Thực hiện được các thao tác xử lí ảnh: thêm văn bản, điều chỉnh độ sáng, độ tương phản, làm mờ, làm sắc nét. ![](images/e4a8b1c03e595f3f326263d925eb66315cb29f398746bfe1a90af6279f4aa8af.jpg) An: Minh ơi, câu xem một vài bức ảnh tố chụp trường mình này. Tớ muốn chỉnh sửa các ảnh đó và thêm chú thích từng khu vực trong trường vào ảnh để gửi cho bạn học cùng trường tiểu học. Cậu có biết công cụ nào của phần mềm chỉnh s���a ảnh làm được điều đó không? Minh: Có chú. Tór thấy một số ảnh cầu chụp bị tối, cần tăng độ sáng lên và chỉnh thêm về màu sắc ảnh nữa thì sẽ đẹp đáy.</code> | <code>bảo vệ môi trường làng nghề; bảo vệ môi trường khu đủ thị, khu dân cư; bảo vệ môi trường nông thôn; bảo vệ môi trường nơi công cộng và bảo vệ môi trường đối với hộ gia đình, cá nhân. # 1. Ô nhiễm ánh sáng O nhiễm ánh sáng xáy ra do việc sử dụng sai hương (hình 1.2) hoặc quá mức ánh sáng nhân tạo từ đến điện (bảng 1.1). Đảy là tác động tiêu cực của quá trình độ thị hoá, gây ánh hương đến sức khoé, phá vỡ hệ sinh thái. Ảnh sáng chói dẫn đến điều kiện lái xe không an toàn. Tiếp xúc với ảnh sáng lâu sẽ gây ra đau đầu, một mới, lo âu, trầm cảm, căng thẳng thần kinh (rối loạn nhịp sinh học).</code> |
302
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
303
+ ```json
304
+ {
305
+ "scale": 50.0,
306
+ "similarity_fct": "cos_sim",
307
+ "gather_across_devices": false,
308
+ "directions": [
309
+ "query_to_doc"
310
+ ],
311
+ "partition_mode": "joint",
312
+ "hardness_mode": null,
313
+ "hardness_strength": 0.0
314
+ }
315
+ ```
316
+
317
+ ### Training Hyperparameters
318
+ #### Non-Default Hyperparameters
319
+
320
+ - `learning_rate`: 1e-05
321
+ - `warmup_steps`: 0.1
322
+ - `gradient_accumulation_steps`: 16
323
+ - `bf16`: True
324
+ - `tf32`: True
325
+ - `gradient_checkpointing`: True
326
+ - `dataloader_num_workers`: 4
327
+
328
+ #### All Hyperparameters
329
+ <details><summary>Click to expand</summary>
330
+
331
+ - `per_device_train_batch_size`: 8
332
+ - `num_train_epochs`: 3
333
+ - `max_steps`: -1
334
+ - `learning_rate`: 1e-05
335
+ - `lr_scheduler_type`: linear
336
+ - `lr_scheduler_kwargs`: None
337
+ - `warmup_steps`: 0.1
338
+ - `optim`: adamw_torch_fused
339
+ - `optim_args`: None
340
+ - `weight_decay`: 0.0
341
+ - `adam_beta1`: 0.9
342
+ - `adam_beta2`: 0.999
343
+ - `adam_epsilon`: 1e-08
344
+ - `optim_target_modules`: None
345
+ - `gradient_accumulation_steps`: 16
346
+ - `average_tokens_across_devices`: True
347
+ - `max_grad_norm`: 1.0
348
+ - `label_smoothing_factor`: 0.0
349
+ - `bf16`: True
350
+ - `fp16`: False
351
+ - `bf16_full_eval`: False
352
+ - `fp16_full_eval`: False
353
+ - `tf32`: True
354
+ - `gradient_checkpointing`: True
355
+ - `gradient_checkpointing_kwargs`: None
356
+ - `torch_compile`: False
357
+ - `torch_compile_backend`: None
358
+ - `torch_compile_mode`: None
359
+ - `use_liger_kernel`: False
360
+ - `liger_kernel_config`: None
361
+ - `use_cache`: False
362
+ - `neftune_noise_alpha`: None
363
+ - `torch_empty_cache_steps`: None
364
+ - `auto_find_batch_size`: False
365
+ - `log_on_each_node`: True
366
+ - `logging_nan_inf_filter`: True
367
+ - `include_num_input_tokens_seen`: no
368
+ - `log_level`: passive
369
+ - `log_level_replica`: warning
370
+ - `disable_tqdm`: False
371
+ - `project`: huggingface
372
+ - `trackio_space_id`: None
373
+ - `trackio_bucket_id`: None
374
+ - `trackio_static_space_id`: None
375
+ - `per_device_eval_batch_size`: 8
376
+ - `prediction_loss_only`: True
377
+ - `eval_on_start`: False
378
+ - `eval_do_concat_batches`: True
379
+ - `eval_use_gather_object`: False
380
+ - `eval_accumulation_steps`: None
381
+ - `include_for_metrics`: []
382
+ - `batch_eval_metrics`: False
383
+ - `save_only_model`: False
384
+ - `save_on_each_node`: False
385
+ - `enable_jit_checkpoint`: False
386
+ - `push_to_hub`: False
387
+ - `hub_private_repo`: None
388
+ - `hub_model_id`: None
389
+ - `hub_strategy`: every_save
390
+ - `hub_always_push`: False
391
+ - `hub_revision`: None
392
+ - `load_best_model_at_end`: False
393
+ - `ignore_data_skip`: False
394
+ - `restore_callback_states_from_checkpoint`: False
395
+ - `full_determinism`: False
396
+ - `seed`: 42
397
+ - `data_seed`: None
398
+ - `use_cpu`: False
399
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
400
+ - `parallelism_config`: None
401
+ - `dataloader_drop_last`: False
402
+ - `dataloader_num_workers`: 4
403
+ - `dataloader_pin_memory`: True
404
+ - `dataloader_persistent_workers`: False
405
+ - `dataloader_prefetch_factor`: None
406
+ - `remove_unused_columns`: True
407
+ - `label_names`: None
408
+ - `train_sampling_strategy`: random
409
+ - `length_column_name`: length
410
+ - `ddp_find_unused_parameters`: None
411
+ - `ddp_bucket_cap_mb`: None
412
+ - `ddp_broadcast_buffers`: False
413
+ - `ddp_static_graph`: None
414
+ - `ddp_backend`: None
415
+ - `ddp_timeout`: 1800
416
+ - `fsdp`: []
417
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
418
+ - `deepspeed`: None
419
+ - `debug`: []
420
+ - `skip_memory_metrics`: True
421
+ - `do_predict`: False
422
+ - `resume_from_checkpoint`: None
423
+ - `warmup_ratio`: None
424
+ - `local_rank`: -1
425
+ - `prompts`: None
426
+ - `batch_sampler`: batch_sampler
427
+ - `multi_dataset_batch_sampler`: proportional
428
+ - `router_mapping`: {}
429
+ - `learning_rate_mapping`: {}
430
+
431
+ </details>
432
+
433
+ ### Training Time
434
+ - **Training**: 1.4 minutes
435
+
436
+ ### Framework Versions
437
+ - Python: 3.12.13
438
+ - Sentence Transformers: 5.4.1
439
+ - Transformers: 5.8.0
440
+ - PyTorch: 2.11.0+cu130
441
+ - Accelerate: 1.13.0
442
+ - Datasets: 4.8.5
443
+ - Tokenizers: 0.22.2
444
+
445
+ ## Citation
446
+
447
+ ### BibTeX
448
+
449
+ #### Sentence Transformers
450
+ ```bibtex
451
+ @inproceedings{reimers-2019-sentence-bert,
452
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
453
+ author = "Reimers, Nils and Gurevych, Iryna",
454
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
455
+ month = "11",
456
+ year = "2019",
457
+ publisher = "Association for Computational Linguistics",
458
+ url = "https://arxiv.org/abs/1908.10084",
459
+ }
460
+ ```
461
+
462
+ #### MultipleNegativesRankingLoss
463
+ ```bibtex
464
+ @misc{oord2019representationlearningcontrastivepredictive,
465
+ title={Representation Learning with Contrastive Predictive Coding},
466
+ author={Aaron van den Oord and Yazhe Li and Oriol Vinyals},
467
+ year={2019},
468
+ eprint={1807.03748},
469
+ archivePrefix={arXiv},
470
+ primaryClass={cs.LG},
471
+ url={https://arxiv.org/abs/1807.03748},
472
+ }
473
+ ```
474
+
475
+ <!--
476
+ ## Glossary
477
+
478
+ *Clearly define terms in order to be accessible across audiences.*
479
+ -->
480
+
481
+ <!--
482
+ ## Model Card Authors
483
+
484
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
485
+ -->
486
+
487
+ <!--
488
+ ## Model Card Contact
489
+
490
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
491
+ -->
config.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_cross_attention": false,
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "dtype": "float32",
10
+ "eos_token_id": 2,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.1,
13
+ "hidden_size": 1024,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 4096,
16
+ "is_decoder": false,
17
+ "layer_norm_eps": 1e-05,
18
+ "max_position_embeddings": 8194,
19
+ "model_type": "xlm-roberta",
20
+ "num_attention_heads": 16,
21
+ "num_hidden_layers": 24,
22
+ "output_past": true,
23
+ "pad_token_id": 1,
24
+ "position_embedding_type": "absolute",
25
+ "tie_word_embeddings": true,
26
+ "transformers_version": "5.8.0",
27
+ "type_vocab_size": 1,
28
+ "use_cache": true,
29
+ "vocab_size": 250002
30
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "pytorch": "2.11.0+cu130",
4
+ "sentence_transformers": "5.4.1",
5
+ "transformers": "5.8.0"
6
+ },
7
+ "default_prompt_name": null,
8
+ "model_type": "SentenceTransformer",
9
+ "prompts": {
10
+ "document": "",
11
+ "query": ""
12
+ },
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5e02fcd9d22ee72a9fa3f26145f4c23b3675a40d1eac43ba3f9c168888d97f35
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.base.modules.transformer.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "transformer_task": "feature-extraction",
3
+ "modality_config": {
4
+ "text": {
5
+ "method": "forward",
6
+ "method_output_name": "last_hidden_state"
7
+ }
8
+ },
9
+ "module_output_name": "token_embeddings"
10
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:45885ab5cd9f8d0becc7075cecb177574d1cf4d086a891cac2b745f681d2b3c3
3
+ size 17098338
tokenizer_config.json ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": true,
3
+ "backend": "tokenizers",
4
+ "bos_token": "<s>",
5
+ "clean_up_tokenization_spaces": true,
6
+ "cls_token": "<s>",
7
+ "eos_token": "</s>",
8
+ "is_local": false,
9
+ "local_files_only": false,
10
+ "mask_token": "<mask>",
11
+ "model_max_length": 512,
12
+ "pad_token": "<pad>",
13
+ "sep_token": "</s>",
14
+ "sp_model_kwargs": {},
15
+ "tokenizer_class": "XLMRobertaTokenizer",
16
+ "unk_token": "<unk>"
17
+ }