File size: 70,907 Bytes
fd61fd9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dense
- generated_from_trainer
- dataset_size:6765
- loss:TripletLoss
base_model: hiieu/halong_embedding
widget:
- source_sentence: Việc tích hợp siêu tụ với pin truyền thống  tác dụng  đối với
    tuổi thọ pin?
  sentences:
  - "Public_066\nCác phương pháp đặc tả mô hình\nMáy trạng thái UML\nCác phương pháp\
    \ đặc tả hình thức như máy hữu hạn trạng thái, biểu đồ trạng thái, v.v. giúp ta\
    \ đặc tả các hệ thống một cách chính xác với ý nghĩa duy nhất (vì chúng sử dụng\
    \ các công cụ toán học). Tuy nhiên, các phương pháp này thường khó được áp dụng\
    \ trong công nghiệp vì chúng đòi hỏi các chuyên gia về đặc tả hình thức.\nMáy\
    \ trạng thái UML được xem là giải pháp tốt để giải quyết vấn đề này. Nó có thể\
    \ được sử dụng để đặc tả hành vi động (chuyển trạng thái) của các lớp đối tượng,\
    \ các ca sử dụng (use cases), các hệ thống con và thậm chí là toàn bộ hệ thống.\
    \ Tuy nhiên, máy trạng thái UML thường được sử dụng cho các lớp đối tượng. Theo\
    \ [AJ00], biểu đồ cộng tác đặc tả bằng UML là một mô hình quan trọng trong việc\
    \ kiểm thử hệ thống bởi mô hình này đặc tả chính xác hành vi (tương tác giữa các\
    \ đối tượng) của hệ thống cần kiểm thử.\nTrong UML, một trạng thái ứng với một\
    \ điều kiện quan trọng của một đối tượng. Trạng thái này được quyết định bởi các\
    \ giá trị hiện thời của đối tượng, các mối quan hệ với các đối tượng khác và các\
    \ hành động (phương thức) mà đối tượng này thực hiện. Một phép chuyển trạng thái\
    \ là mối quan hệ giữa hai trạng thái. Một phép chuyển trạng thái trong UML bao\
    \ gồm một sự kiện được kích hoạt, điều kiện và hành động tương ứng. Các sự kiện\
    \ được kích hoạt của các phép chuyển trạng thái có thể là một trong các sự kiện\
    \ sau:\n  * Một lời gọi ứng với một phương thức\n  * Một tín hiệu nhận được từ\
    \ các trạng thái khác trong máy trạng thái\n  * Một sự thay đổi giá trị của một\
    \ thuộc tính nào đó của một đối tượng\n  * Hết thời gian (timeout)\nHình 8.4 là\
    \ ví dụ về một máy trạng thái UML đặc tả hành vi của hệ thống quản lý bán hàng.\n\
    **Hình 8.4: Một ví dụ về máy trạng thái UML.** |<image_4>|"
  - "Public_098\nTích hợp với pin truyền thống\n\n* Hệ thống song song: Siêu tụ xử\
    \ lý các xung công suất cao, trong khi pin đảm nhận lưu trữ năng lượng dài hạn.\n\
    \  * Tăng tuổi thọ pin: Giảm căng thẳng dòng điện và nhiệt cho pin, kéo dài thời\
    \ gian sử dụng.\n  * Tối ưu hiệu suất năng lượng tái tạo: Kết hợp với pin lưu\
    \ trữ trong lưới điện gió, mặt trời."
  - 'Public_202

    TÁC DỤNG, VỊ TRÍ VÀ HÌNH DÁNG CÁC BỘ PHẬN CHỦ YẾU TRONG BUỒNG LÁI XE ÔTÔ

    Vô lăng lái

    Vô lăng lái dùng để điều khiển hướng chuyển động của xe ôtô.

    Vị trí của vô lăng lái trong buồng lái phụ thuộc vào quy định của mỗi nước. Khi
    quy định chiều thuận của chuyển động là bên phải (theo hướng đi của mình) thì
    vô lăng lái được bố trí ở phía bên trái (còn gọi là tay lái thuận). Khi quy định
    chiều thuận của chuyển động là bên trái thì vô lăng lái được bố trí ở phía bên
    phải (còn gọi là tay lái nghịch).

    Trong giáo trình này chỉ giới thiệu loại “tay lái thuận” theo đúng Luật Giao thông
    đường bộ của nước Cộng hòa xã hội chủ nghĩa Việt Nam.

    Vô lăng lái có dạng hình vành khăn tròn, các kiểu loại thông dụng được trình bày
    trên hình 1-2.

    |<image_1>|

    _Hình 1-3 : **Các kiểu vô lăng lái**_

    \- Điều chỉnh Vô lăng lái:

    Để người lái được thoải mái khi lái xe, nhà sản xuất cho phép người sử dụng có
    thể điều chỉnh vị trí vô lăng lái cho phù hợp

    |<image_2>|

    _Hình 1-4: Điều chỉnh vị trí vô lăng lái bằng cơ khí_

    Để điều chỉnh vô lăng lái, người lái xe cần kéo khóa 1 theo chiều mũi tên, điều
    chỉnh chiều cao vô lăng theo chiều mũi tên 2, điều chỉnh độ gần xa vô lăng theo
    chiều mũi tên 3 (như trên hình 1-4).

    |<image_3>|

    _Hình 1-5: Điều chỉnh vô lăng bằng điện_

    Để điều chỉnh vô lăng bên hông trụ lái có 4 nút điều chỉnh theo 4 hướng, người
    lái bấm nút để điều chỉnh vô lăng lên xuống và gần, xa như trên hình 1-5.

    \- Bật, tắt sưởi vô lăng: Ở trên một số xe đời mới hiện đại có trang bị hệ thống
    sưởi cho vô lăng lái như trên hình 1-6.

    |<image_4>|

    _Hình 1-6: Điều khiển sưởi vô lăng_'
- source_sentence: MTLT hoạt động dựa trên những nguyên tắc vật   bản nào?
  sentences:
  - "Public_199\nKết quả nghiên cứu và bài luận\nNguyên lý hoạt động của MTLT\n###\
    \ Các nguyên tắc hoạt động của MTLT \nMTLT hoạt động dựa trên một số nguyên tắc\
    \ vật lý cơ bản, bao gồm nguyên lý siêu dẫn, nguyên lý bù trừ và nguyên lý siêu\
    \ vị nhân [14] – [16]. Nguyên lý siêu dẫn (superconductivity) là nguyên tắc vật\
    \ lý mô tả sự dẫn điện hoàn toàn của vật liệu khi được làm lạnh đến một nhiệt\
    \ độ rất thấp. Điều này cho phép các dòng điện chạy qua vật liệu mà không gặp\
    \ phải sự trở kháng. Nguyên tắc này được sử dụng trong các quantum bit (qubit)\
    \ của MTLT để giữ trạng thái của qubit với độ chính xác cao. Nguyên lý bù trừ\
    \ (quantum entanglement) là nguyên tắc vật lý mô tả sự liên kết giữa các hạt với\
    \ nhau, dù chúng có thể ở cách xa nhau đến hàng trăm nghìn kilômét. Khi hai qubit\
    \ liên kết với nhau thông qua nguyên tắc này, thì sự thay đổi của một qubit sẽ\
    \ ảnh hưởng đến trạng thái của qubit kia, bất kể khoảng cách giữa hai qubit đó.\
    \ Nguyên lý siêu vị nhân (quantum tunneling) là nguyên tắc vật lý mô tả sự xuyên\
    \ qua của các hạt qua một vật liệu mà không gặp sự trở kháng. Điều này cho phép\
    \ qubit có khả năng chuyển trạng thái một cách rất nhanh chóng, mà không cần mất\
    \ thời gian để vượt qua các vật liệu giữa. Các nguyên tắc này tạo nên cơ sở cho\
    \ sự hoạt động của MTLT, giúp nó có thể giải quyết các bài toán phức tạp một cách\
    \ nhanh chóng hơn so với MTTT.\n### Thành phần cấu tạo của MTLT \nMTLT được tạo\
    \ ra để thực hiện tính toán bằng cách sử dụng các phép toán trên các trạng thái\
    \ lượng tử. Các thành phần cấu tạo của MTLT bao gồm qubit, quantum gate và quantum\
    \ register [1], [6], [16], [19], [20], [22].\n|<image_3>|\nQubit: Qubit (quantum\
    \ bit) là đơn vị cơ bản của MTLT và tương đương với bit trong máy tính cổ điển.\
    \ Tuy nhiên, qubit không chỉ mang giá trị 0 hoặc 1 như bit nhị phân, mà có thể\
    \ tồn tại trong một trạng thái siêu dẫn của 0 và 1 đồng thời (superposition) (xem\
    \ minh họa trên hình 1). Điều này cho phép qubit thực hiện các tính toán đồng\
    \ thời trên nhiều giá trị hơn là một giá trị duy nhất như trên máy tính cổ điển.\n\
    |<image_4>|\nQuantum gate: là các phép toán được sử dụng để thực hiện các tính\
    \ toán trên qubit. Hình 2 mô tả tên các phép toán lượng tử tương ứng với các quantum\
    \ gate và ma trận toán học tương ứng. Các quantum gate có thể được sử dụng để\
    \ biến đổi trạng thái của qubit hoặc để tạo ra sự tương tác giữa các qubit. Các\
    \ quantum gate phổ biến bao gồm X-gate, Y-gate, Z-gate, Hadamard gate, CNOT gate,\
    \ SWAP gate, Toffoli gate và một số các cổng khác.\nQuantum register: là tập hợp\
    \ các qubit được sử dụng để lưu trữ và thực hiện các tính toán. Quantum register\
    \ có thể có từ một đến hàng trăm qubit, tùy thuộc vào ứng dụng cụ thể. Các thành\
    \ phần này cùng hoạt động để tạo ra sức mạnh tính toán của MTLT. Khi các qubit\
    \ được kết hợp với các quantum gate và được tổ chức trong quantum register, các\
    \ tính toán lượng tử phức tạp có thể được thực hiện. Ngoài các thành phần khác\
    \ biệt như trình bày trên của MTLTT, các thành phần cấu tạo cơ bản khác của một\
    \ hệ thống tính toán được giới thiệu và minh họa trong [36] (xem hình 3).\n|<image_5>|\n\
    **3.2.3.** So sánh giữa MTLT và MTTT\nMTLT và MTTT đều là những công cụ để xử\
    \ lý thông tin, tuy nhiên chúng khác nhau về cách thức hoạt động và cách tiếp\
    \ cận vấn đề.\nBảng 1 trình bày sự khác nhau theo một số cách tiếp cận chính tạo\
    \ ra sự khác biệt vượt trội như: cách biểu diễn thông tin, thao tác lưu trữ, phương\
    \ pháp giải quyết bài toán.\nTóm lại, MTLT và MTTT đều có sức mạnh và hạn chế\
    \ riêng, có thể được sử dụng để giải quyết các bài toán khác nhau. Tuy nhiên,\
    \ vì tính đặc biệt của MTLT, nó có thể giải quyết các bài toán phức tạp và lớn\
    \ hơn nhiều so với MTTT. Song việc phát triển và sử dụng MTLT vẫn còn rất khó\
    \ khăn và đòi hỏi sự đầu tư lớn về kỹ thuật và tài chính. Hiện nay, MTLT được\
    \ sử dụng trong nhiều lĩnh vực như tài chính, y học, và khoa học vật lý. Với sự\
    \ phát triển của công nghệ, các ứng dụng của MTLT dự kiến sẽ tiếp tục mở rộng\
    \ và đóng góp vào sự phát triển của nhiều lĩnh vực khác nhau."
  - "Public_059\ninclude <stdio .h>\nnan\nvoid print_str( char* str){ printf(\"% s\"\
    , str);\n}\nint main ( void ){\nprint_str(\" Hello ␣World !\"); return 0;\n}\n\
    \  * **Giao diện bộ nhớ chia sẻ (shared memory):** một khối bộ nhớ được chia sẻ\
    \ giữa hai mô-đun. Khối bộ nhớ này có thể do một trong hai mô-đun cấp phát, hoặc\
    \ cũng có thể do một mô-đun thứ ba cấp phát. Một mô-đun sẽ ghi dữ liệu lên khối\
    \ bộ nhớ và mô-đun kia đọc dữ liệu từ khối bộ nhớ.\nTrong ví dụ dưới đây hàm main\
    \ và hàm print_str sử dụng bộ nhớ chia sẻ là biến str để trao đổi dữ liệu giữa\
    \ các hàm này. Hàm main() ghi dữ liệu và hàm print_str() đọc dữ liệu. Trong trường\
    \ hợp này, bộ nhớ cho biến str không được cấp phát mà sử dụng hằng ký tự.\n**Đoạn\
    \ mã 10.2: Giao diện bộ nhớ chia sẻ**"
  - "Public_014\nBiểu diễn dữ liệu trong máy tính\nBiểu diễn số trong các hệ đếm\n\
    Hệ đếm là tập hợp các ký hiệu và qui tắc sử dụng tập ký hiệu đó để biểu diễn và\
    \ xác định các giá trị các số. Mỗi hệ đếm có một số ký số (digits) hữu hạn. Tổng\
    \ số ký số của mỗi hệ đếm được gọi là **cơ số** (base hay radix), ký hiệu là b.\n\
    ### Hệ đếm cơ số b\nHệ đếm cơ số b (b ≥ 2 và nguyên dương) mang tính chất sau\
    \ :\n  * Có b ký số để thể hiện giá trị số. Ký số nhỏ nhất là **0** và lớn nhất\
    \ là **b-1**.\n  * Giá trị vị trí thứ n trong một số của hệ đếm bằng cơ số b lũy\
    \ thừa n\n  * Số N(b) trong hệ đếm cơ số (b) được biểu diễn bởi:\n|<image_1>|\n\
    trong đó, số N(b) có **n+1** ký số biểu diễn cho phần nguyên và **m** ký số lẻ\
    \ biểu diễn cho phần b_phân, và có giá trị là:\n|<image_2>|\nTrong ngành toán\
    \ - tin học hiện nay phổ biến 4 hệ đếm là hệ thập phân, hệ nhị phân, hệ bát phân\
    \ và hệ thập lục phân.\n### Hệ đếm thập phân (Decimal system, b=10)\nHệ đếm thập\
    \ phân hay hệ đếm cơ số 10 là một trong các phát minh của người Ả rập cổ, bao\
    \ gồm 10 ký số theo ký hiệu sau:\n**0,1,2,3,4,5,6,7,8,9**\nQui tắc tính giá trị\
    \ của hệ đếm này là mỗi đơn vị ở một hàng bất kỳ có giá trị bằng 10 đơn vị của\
    \ hàng kế cận bên phải. Ở đây b=10. Bất kỳ số nguyên dương trong hệ thập phân\
    \ có thể biểu diễn như là một tổng các số hạng, mỗi số hạng là tích của một số\
    \ với 10 lũy thừa, trong đó số mũ lũy thừa được tăng thêm 1 đơn vị kể từ số mũ\
    \ lũy thừa phía bên phải nó. Số mũ lũy thừa của hàng đơn vị trong hệ thập phân\
    \ là 0.\nVí dụ: Số 5246 có thể được biểu diễn như sau:\n3 2 1 0\n5246 = 5 x 10\
    \ + 2 x 10 + 4 x 10 + 6 x 10\n= 5 x 1000 + 2 x 100 + 4 x 10 + 6 x 1\nThể hiện\
    \ như trên gọi là ký hiệu mở rộng của số nguyên vì\n5246 = 5000 + 200 + 40 + 6\n\
    Như vậy, trong số 5246 : ký số 6 trong số nguyên đại diện cho giá trị 6 đơn vị\
    \ (1s), ký số 4 đại diện cho giá trị 4 chục (10s), ký số 2 đại diện cho giá trị\
    \ 2 trăm (100s) và ký số 5 đại diện cho giá trị 5 ngàn (1000s). Nghĩa là, số lũy\
    \ thừa của 10 tăng dần 1 đơn vị từ trái sang phải tương ứng với vị trí ký hiệu\
    \ số,\n0 1 2 3 4\n10 = 1 10 = 10 10 = 100 10 = 1000 10 = 10000 ...\nMỗi ký số\
    \ ở thứ tự khác nhau trong số sẽ có giá trị khác nhau, ta gọi là giá trị vị trí\
    \ (place value).\nPhần thập phân trong hệ thập phân sau dấu chấm phân cách thập\
    \ phân (theo qui ước của Mỹ) thể hiện trong ký hiệu mở rộng bởi 10 lũy thừa âm\
    \ tính từ phải sang trái kể từ dấu chấm phân cách:\n101101−= 1011002−= 10110003−=\
    \ ...\n<table>\n<colgroup>\n<col/>\n<col/>\n<col/>\n<col/>\n<col/>\n</colgroup>\n\
    <thead>\n<tr>\n<th>2</th>\n<th>1</th>\n<th>0</th>\n<th>-1</th>\n<th>-2</th>\n\
    </tr>\n</thead>\n<tbody>\n<tr>\n<td colspan=\"3\">Ví dụ: 254.68 = 2 x 10 + 5 x\
    \ 10 + 4 x 10 + 6 x 10</td>\n<td></td>\n<td>+ 8 x 10</td>\n</tr>\n</tbody>\n</table>\
    \ \n### Hệ đếm nhị phân (Binary system, b=2)\nVới cơ số b=2, chúng ta có hệ đếm\
    \ nhị phân. Đây là hệ đếm đơn giản nhất với 2 chữ số là 0 và 1, mỗi chữ số nhị\
    \ phân gọi là BIT (viết tắt từ chữ BInary digiT). Vì hệ nhị phân chỉ có 2 trị\
    \ số là 0 và 1, nên khi muốn diễn tả một số lớn hơn, hoặc các ký tự phức tạp hơn\
    \ thì cần kết hợp nhiều bit với nhau. Ta có thể chuyển đổi số trong hệ nhị phân\
    \ sang số trong hệ thập phân quen thuộc.\nVí dụ: Số 11101.11(2) sẽ tương đương\
    \ với giá trị thập phân là :\n|<image_3>|\n### Hệ đếm bát phân (Octal system,\
    \ b=8)\nNếu dùng 1 tập hợp 3 bit thì có thể biểu diễn 8 trị khác nhau : 000, 001,\
    \ 010, 011, 100, 101, 110, 111. Các trị này tương đương với 8 trị trong hệ thập\
    \ phân là 0, 1, 2, 3, 4, 5, 7. Tập hợp các chữ\n3\nsố này gọi là hệ bát phân,\
    \ là hệ đếm với b = 8 = 2 . Trong hệ bát phân, trị vị trí là lũy thừa của 8.\n\
    Ví dụ:\n<table>\n<colgroup>\n<col/>\n<col/>\n<col/>\n<col/>\n<col/>\n</colgroup>\n\
    <thead>\n<tr>\n<th>2</th>\n<th>1</th>\n<th>0</th>\n<th>-1</th>\n<th>-2</th>\n\
    </tr>\n</thead>\n<tbody>\n<tr>\n<td colspan=\"3\">235 . 64<sub>(8)</sub> = <strong>2</strong>x8\
    \ +\n<strong>3</strong>x8 + <strong>5</strong>x8 + <strong>6</strong>x8</td>\n\
    <td>+ <strong>4</strong>x8</td>\n<td>= 157. 8125<sub>(10)</sub></td>\n</tr>\n\
    </tbody>\n</table> \n### Hệ đếm thập lục phân (Hexa-decimal system, b=16)\n4\n\
    Hệ đếm thập lục phân là hệ cơ số b=16 = 2 , tương đương với tập hợp 4 chữ số nhị\
    \ phân (4 bit). Khi thể hiện ở dạng hexa-decimal, ta có 16 ký tự gồm 10 chữ số\
    \ từ 0 đến 9, và 6 chữ in A, B, C, D, E, F để biểu diễn các giá trị số tương ứng\
    \ là 10, 11, 12, 13, 14, 15. Với hệ thập lục phân, trị vị trí là lũy thừa của\
    \ 16.\nVí dụ:\n4 3 2 1 0\n34F5C(16) = 3x16 + 4x16 + 15x16 + 5x16 + 12x16 = 216294(10)\n\
    _Ghi chú_ : Một số ngôn ngữ lập trình qui định viết số hexa phải có chữ H ở cuối\
    \ chữ số. Ví dụ: Số 15 viết là FH.\n### Chuyển đổi một số từ hệ thập phân sang\
    \ hệ đếm cơ số b\n#### Đổi phần nguyên từ hệ thập phân sang hệ b\nTổng quát: Lấy\
    \ số nguyên thập phân N(10) lần lượt chia cho b cho đến khi thương số bằng 0.\
    \ Kết\nquả số chuyển đổi N(b) là các dư số trong phép chia viết ra theo thứ tự\
    \ ngược lại.. Ví dụ: Số 12(10)\n  * ?(2). Dùng phép chia cho 2 liên tiếp, ta có\
    \ một loạt các số dư như sau:\n|<image_4>|\n#### Đổi phần thập phân từ hệ thập\
    \ phân sang hệ cơ số b\n|<image_5>|Tổng quát: Lấy phần thập phân N(10) lần lượt\
    \ nhân với b cho đến khi phần thập phân của tích số bằng 0. Kết quả số chuyển\
    \ đổi N(b) là các số phần nguyên trong phép nhân viết ra theo thứ tự\ntính toán."
- source_sentence: Để đẩy mạnh xây dựng  phát triển hạ tầng quản  đô thị thông
    minh, Bắc Giang dự kiến xây dựng những trung tâm nào?
  sentences:
  - 'Public_587

    Đánh giá hiện trạng và xây dựng định hướng phát triển

    Đánh giá hiện trạng phát triển của tỉnh khi xây dựng thành phố thông minh

    **a) Điểm mạnh**

    Bắc Giang có vị trí thuận lợi, nằm trên tuyến hành lang kinh tế Nam Ninh (Trung
    Quốc) - Lạng Sơn - Hà Nội - Hải Phòng - Quảng Ninh; nằm trong vùng Thủ đô Hà Nội,
    có hệ thống giao thông thuận tiện bao gồm cả đường bộ, đường sắt và đường thuỷ
    tới thủ đô Hà Nội, cửa khẩu quốc tế Lạng Sơn, sân bay quốc tế Nội Bài, cảng biển
    quốc tế Hải Phòng, Cái Lân… tạo thuận lợi trong phát triển kinh tế và giao lưu
    văn hoá với các nước trong khu vực.

    Bắc Giang đã có quy hoạch phát triển kinh tế xã hội, quy hoạch ngành công nghệ
    thông tin và các ngành khác đáp ứng yêu cầu phát triển của tỉnh; đã có những định
    hướng chủ trương để đẩy mạnh ứng dụng, phát triển công nghệ thông tin; đã có chính
    sách đẩy mạnh phát triển công nghiệp, chú trọng đến chính sách thu hút phát triển
    ngành công nghệ cao.

    Tốc độ tăng trưởng kinh tế của tỉnh Bắc Giang gia tăng liên tục nhờ sự phát triển
    của ngành công nghiệp xây dựng, sản xuất, thương mại, dịch vụ. Tốc độ tăng trưởng
    tổng sản phẩm của tỉnh (GRDP) đạt 13,3% (gần gấp đôi bình quân cả nước), tăng
    cao nhất từ trước đến nay.

    Các đô thị trên địa bàn tỉnh đã được quan tâm quy hoạch, đầu tư xây dựng. Quy
    mô đô thị từng bước được mở rộng; hạ tầng kỹ thuật đô thị có nhiều cải thiện;
    kinh tế khu vực đô thị tăng nhanh, với định hướng phát triển thành phố Bắc Giang
    trở thành đô thị loại I trong thời gian tới.

    Ứng dụng công nghệ thông tin và truyền thông được đẩy mạnh phát triển trong các
    ngành, lĩnh vực, đặc biệt là trong việc xây dựng Chính quyền điện tử. Đạt 100%
    đơn vị sở, ban, ngành, Ủy ban nhân dân cấp tỉnh, huyện đã có cổng thông tin điện
    tử, ứng dụng công nghệ thông tin trong giải quyết thủ tục hành chính, triển khai
    một cửa điện tử (với 18 sở, ngành, 10/10 huyện, thành phố, 230/230 xã, phường,
    thị trấn triển khai), rút ngắn thời gian xử lý nhà nước, tăng tính minh bạch trong
    hoạt động của cơ quan nhà nước; cung cấp 667 dịch vụ công mức độ 3 phục vụ người
    dân và doanh nghiệp. 100% các sở, ngành và Ủy ban nhân dân huyện cài đặt và sử
    dụng phần mềm quản lý văn bản và điều hành qua mạng (với 02 phần mềm mã nguồn
    mở BGO và phần mềm thương mại BGNetOffice).

    Hạ tầng kỹ thuật công nghệ thông tin tại các cơ quan, đơn vị đã được đầu tư xây
    dựng tương đối đầy đủ, cơ bản đáp ứng nhu cầu triển khai ứng dụng công nghệ thông
    tin. Mạng diện rộng (WAN) của tỉnh đã được triển khai và đưa vào khai thác tại
    100% đơn vị sở, ban, ngành, địa phương. Hệ thống hội nghị trực tuyến đã được đầu
    tư xây dựng, kết nối từ tỉnh, đến huyện đáp ứng được các cuộc họp trực tuyến giữa
    Ủy ban nhân dân tỉnh với Chính phủ và các Bộ, ngành Trung ương và một số cuộc
    họp trực tuyến giữa Ủy ban nhân dân tỉnh với Ủy ban nhân dân các huyện, thành
    phố. 100% các cơ quan sở, ban, ngành, Ủy ban nhân dân cấp huyện và các đơn vị
    trực thuộc, 100% Hội đồng nhân dân - Ủy ban nhân dân cấp xã đã triển khai sử dụng
    chứng thư số, chữ ký số trong việc gửi, nhận văn bản, tài liệu điện tử...

    Bước đầu triển khai lắp đặt hệ thống camera giám sát giao thông, an ninh trật
    tự tại các tuyến đường trọng điểm trên địa bàn thành phố Bắc Giang, các địa điểm
    công cộng đem lại nhiều hiệu quả tích cực, đảm bảo trật tự an toàn giao thông
    trên địa bàn tỉnh. Triển khai các mô hình sản xuất nông nghiệp ứng dụng công nghệ
    cao để nâng cao năng suất như xây dựng mô hình nhà màng; áp dụng các quy trình
    sản xuất theo tiêu chuẩn VietGAP và GlobalGAP...

    Nguồn nhân lực công nghệ thông tin được nâng cao về chất lượng, số lượng. Bên
    cạnh đó, nhằm phát huy hiệu quả sử dụng các chương trình, dự án công nghệ thông
    tin đã được đầu tư, Sở Thông tin và Truyền thông thường xuyên tổ chức các lớp
    tập huấn, đào tạo người sử dụng.

    **b) Điểm yếu**

    Kinh tế của tỉnh phát triển, nhưng chưa bền vững. Số lượng doanh nghiệp trên địa
    bàn tỉnh tăng nhanh nhưng chủ yếu là doanh nghiệp nhỏ và vừa, trình độ công nghệ
    và khả năng cạnh tranh của các doanh nghiệp nhìn chung còn hạn chế; vì vậy chưa
    thu hút được nhiều sự quan tâm đầu tư của các doanh nghiệp trong và ngoài nước
    về phát triển công nghệ thông tin và truyền thông trên địa bàn tỉnh.

    Dân cư sống chủ yếu tại khu vực nông thôn, phân bố không đồng đều. Tuy đời sống
    vật chất, tinh thần của người dân ngày càng được cải thiện, nhưng chưa đồng đều,
    vẫn còn khoảng cách giữa các khu vực nông thôn và thành thị. Việc tiếp cận, sử
    dụng các công nghệ hiện đại trong đời sống xã hội còn hạn chế nên ảnh hưởng đến
    việc phát triển các dịch vụ thông minh phục vụ người dân.

    Công tác quản lý điều hành, đặc biệt quản lý đô thị vẫn còn nhiều khó khăn, chưa
    có công cụ hiện đại hóa, các hệ thống thông minh hỗ trợ quản lý đô thị. Còn phát
    sinh các vấn đề đô thị như thiếu cơ sở hạ tầng trong đô thị do đô thị hóa; tỷ
    lệ ô nhiễm môi trường tăng nhanh do thải nước và số xe máy tăng.

    Việc triển khai ứng dụng công nghệ thông tin trong nội bộ cơ quan, đơn vị vẫn
    còn nhiều hạn chế. Một số đơn vị sở, ban, ngành, địa phương chưa thực sự tích
    cực triển khai ứng dụng công nghệ thông tin. Vẫn còn thiếu các phần mềm chuyên
    ngành, các cơ sở dữ liệu phục vụ quản lý điều hành, liên thông. Đa phần các ứng
    dụng công nghệ thông tin được triển khai tại các đơn vị vẫn mang tính rời rạc,
    chưa liên kết thành một hệ thống; dữ liệu chưa được chia sẻ và sử dụng chung.

    Hạ tầng thiết bị công nghệ thông tin tại cơ quan nhà nước vẫn chưa được đầu tư
    đồng bộ; một số thiết bị đã bị xuống cấp, hết hạn khấu hao, chưa được duy tu,
    bảo dưỡng đầy đủ nên chưa đáp ứng được nhiều cho việc ứng dụng công nghệ thông
    tin. Vấn đề bảo mật an toàn, an ninh thông tin vẫn còn chưa được quan tâm đúng
    mức do điều kiện kinh phí hạn hẹp.

    Nguồn nhân lực công nghệ thông tin trong các cơ quan, đơn vị vẫn còn thiếu và
    chưa đồng bộ, đặc biệt là thiếu cán bộ công nghệ thông tin có trình độ cao. Cán
    bộ chuyên trách công nghệ thông tin chủ yếu vẫn là kiêm nhiệm, vẫn còn hạn chế
    về kỹ năng chuyên môn.

    Chưa có cơ chế hỗ trợ, ưu đãi cho cán bộ chuyên trách công nghệ thông tin nên
    rất khó khăn trong việc tuyển dụng, thu hút nguồn nhân lực chất lượng cao vào
    làm việc trong cơ quan nhà nước tại tỉnh.

    **c) Cơ hội**

    Trong thời gian qua, Đảng, Chính phủ luôn quan tâm, coi trọng phát triển ứng dụng
    công nghệ thông tin, đặc biệt là xây dựng chính quyền điện tử và phát triển thành
    phố thông minh nhằm nâng cao năng lực quản lý, nâng cao chất lượng, hiệu quả hoạt
    động kinh tế - xã hội, tạo ra môi trường, cuộc sống tươi đẹp cho người dân, doanh
    nghiệp.

    Bên cạnh đó, các xu hướng ứng dụng công nghệ thông tin trong nước và trên thế
    giới ngày càng nhiều, với xu hướng cuộc cách mạng công nghiệp lần thứ tư, công
    nghệ dữ liệu lớn (Big data), kết nối Internet vạn vật (IoT), trí tuệ nhân tạo
    (AI), xu hướng xây dựng thành phố thông minh tại các nước trên thế giới và tại
    Việt Nam... Những mô hình thành công sẽ là những gợi ý cho tỉnh tham khảo, học
    tập trong quá trình phát triển thành phố thông minh trong thời gian tới.

    Nhận thức về môi trường, về an toàn vệ sinh thực phẩm của xã hội ngày càng cao,
    tạo ra nhu cầu đảm bảo môi trường, đảm bảo phát triển bền vững trở nên cấp thiết.

    **d) Thách thức**

    Với những lợi thế do gần thành phố Hà Nội, Hải Phòng và tỉnh Quảng Ninh, cũng
    đồng thời bị hạn chế rất lớn về việc huy động và thu hút các chuyên gia công nghệ
    thông tin, nguồn nhân lực chất lượng cao tại các tỉnh, thành trong cả nước về
    làm việc tại tỉnh Bắc Giang do chưa có chính sách thu hút sử dụng cán bộ hợp lý.

    Ngân sách tỉnh còn nhiều khó khăn nên đầu tư cho hoạt động công nghệ thông tin
    vẫn ở mức thấp. Việc đầu tư chủ yếu mang tính nhỏ lẻ, tự phát ở từng cơ quan đơn
    vị.

    Nhận thức về vai trò, tầm quan trọng của công nghệ thông tin của các cơ quan,
    đơn vị và doanh nghiệp chưa thực sự đầy đủ.

    _**Đề xuất phát triển:**_

    Từ các phân tích đánh giá thực trạng ở trên, có thể thấy thách thức đặt ra cho
    Bắc Giang là rất lớn nhưng có cơ hội để trong vòng 5 năm đến 10 năm Bắc Giang
    có thể đạt được mục tiêu phát triển đột phá, xây dựng thành phố thông minh phù
    hợp với tiềm năng và thực tế của tỉnh.

    \- Xây dựng Kiến trúc ICT cho đô thị thông minh của tỉnh Bắc Giang.

    \- Đẩy mạnh sử dụng công nghệ thông minh và các ứng dụng thông minh trong xây
    dựng và quản lý đô thị. Cung cấp các dịch vụ thông minh trong các lĩnh vực như
    giáo dục, y tế, nông nghiệp, xây dựng, giao thông, môi trường, năng lượng, an
    toàn để phục vụ cho người dân và nâng cao hiệu quả quản lý nhà nước.

    \- Đẩy mạnh xây dựng và phát triển hạ tầng quản lý đô thị thông minh:

    \+ Xây dựng Trung tâm điều hành thành phố thông minh.

    \+ Xây dựng Trung tâm dữ liệu thành phố thông minh (trung tâm mới dành riêng kết
    nối tất cả các các ứng dụng thông minh của các lĩnh vực).

    \+ Xây dựng nền tảng tích hợp dữ liệu thành phố thông minh.

    \+ Xây dựng Trung tâm an toàn thông tin.

    \+ Xây dựng hệ thống chiếu sáng thông minh; hệ thống cấp nước thông minh; hệ thống
    thoát nước thông minh; hệ thống thu gom và xử lý rác thải thông minh; phát triển
    lưới điện thông minh.

    \+ Mở rộng hệ thống quan trắc và cảnh báo phóng xạ môi trường trong toàn tỉnh.

    \+ Xây dựng trung tâm điều hành giao thông thông minh của tỉnh.

    \+ Mở rộng hệ thống mạng lưới camera giám sát và thiết bị đo mật độ giao thông,
    giám sát an ninh; xây dựng hệ thống cung cấp thông tin, phổ biến tình hình giao
    thông tại các nút, đường giao thông quan trọng của tỉnh.

    \- Tỉnh cần có chiến lược quy hoạch, xây dựng và quản lý đô thị hiện đại đảm bảo
    sự phát triển bền vững.

    \- Cần có chính sách thu hút nguồn nhân lực cao về công nghệ thông tin.

    \- Nâng cao chất lượng nguồn nhân lực và đẩy mạnh liên kết trong nước và quốc
    tế. Đẩy mạnh tốc độ đô thị hóa có quy hoạch, môi trường trong sạch, an toàn, quản
    lý tốt cơ sở hạ tầng để thu hút nhân lực về làm việc tại tỉnh Bắc Giang.'
  - "Public_088\nThách thức triển khai\n\n* **Tốc độ tính toán:** Dù xử lý song song\
    \ mạnh mẽ, thời gian phản ứng hóa học vẫn chậm so với điện tử học tốc độ cao.\n\
    \  * **Độ chính xác và sai số:** Lỗi lai ghép hoặc đột biến có thể gây sai kết\
    \ quả.\n  * **Chi phí tổng hợp DNA:** Dù giảm nhanh, hiện vẫn cao cho ứng dụng\
    \ quy mô lớn.\n  * **An toàn sinh học:** Cần kiểm soát nghiêm ngặt để tránh rủi\
    \ ro sinh học và lây nhiễm.\n  * **Chuẩn hóa và tích hợp:** Chưa có chuẩn chung\
    \ để kết nối máy tính DNA với hệ thống điện tử truyền thống."
  - 'Public_119

    LDA cho bài toán với 2 classes

    Xây dựng hàm mục tiêu

    _Ký hiệu: dữ liệu x_n, phép chiếu y_n = w^T x_n._

    Kỳ vọng mỗi lớp: m_k = (1/N_k) ∑_{n∈C_k} x_n, k=1,2. (1)

    Hiệu kỳ vọng sau chiếu: m_1 − m_2 ⇒ w^T(m_1−m_2). (2)

    Within-class variances (không lấy trung bình): s_k^2 = ∑_{n∈C_k} (y_n − m_k)^2.
    (3)

    Ma trận between-class: S_B = (m_1−m_2)(m_1−m_2)^T. (5)

    Ma trận within-class: S_W = ∑_{k=1}^2 ∑_{n∈C_k} (x_n−m_k)(x_n−m_k)^T. (6)

    **Hàm mục tiêu Fisher (2 lớp):**

    J(w) = (w^T S_B w) / (w^T S_W w). (4,7)'
- source_sentence: Hai dạng chính tấn công khai thác lỗi không kiểm tra đầu vào 
    gì?
  sentences:
  - 'Public_264

    Các loại kiểu Logic bomb

    Logic bomb dựa theo thời gian

    Logic bomb phổ biến nhất là logic bomb theo thời gian, chúng được lập trình để
    tự động kích hoạt vào một thời điểm cụ thể, chẳng hạn như vào ngày kỷ niệm của
    một sự kiện quan trọng. Những logic bomb này có thể gây ra thiệt hại lớn nếu không
    được phát hiện và ngăn chặn kịp thời.'
  - "Public_155\nTấn công bằng mã độc\nTấn công khai thác lỗi không kiểm tra đầu vào\n\
    ### Giới thiệu\nLỗi không kiểm tra đầu vào (Unvalidated input) là một trong các\
    \ dạng lỗ hổng bảo mật phổ biến, trong đó ứng dụng không kiểm tra, hoặc kiểm tra\
    \ không đầy đủ các dữ liệu đầu vào, nhờ đó tin tặc có thể khai thác lỗi để tấn\
    \ công ứng dụng và hệ thống. Dữ liệu đầu vào (Input data) cho ứng dụng rất đa\
    \ dạng, có thể đến từ nhiều nguồn với nhiều định dạng khác nhau. Các dạng dữ liệu\
    \ đầu vào điển hình cho ứng dụng:\n  * Các trường dữ liệu văn bản (text);\n  *\
    \ Các lệnh được truyền qua địa chỉ URL để kích hoạt chương trình;\n  * Các file\
    \ âm thanh, hình ảnh, hoặc đồ họa do người dùng, hoặc các tiến trình khác cung\
    \ cấp;\n  * Các đối số đầu vào trong dòng lệnh;\n  * Các dữ liệu từ mạng hoặc\
    \ từ các nguồn không tin cậy.\nTrên thực tế, tin tặc có thể sử dụng phương pháp\
    \ thủ công, hoặc tự động để kiểm tra các dữ liệu đầu vào và thử tất cả các khả\
    \ năng có thể để khai thác lỗi không kiểm tra đầu vào. Theo thống kê của trang\
    \ web OWASP [(http://www.owasp.org),](http://www.owasp.org/) một trang web chuyên\
    \ về thông kê các lỗi bảo mật ứng dụng web, lỗi không kiểm tra đầu vào luôn chiếm\
    \ vị trí nhóm dẫn đầu các lỗi bảo mật các trang web trong khoảng 5 năm trở lại\
    \ đây.\n### Tấn công khai thác\nCó hai dạng chính tấn công khai thác lỗi không\
    \ kiểm tra đầu vào: (1) cung cấp dữ liệu quá lớn hoặc sai định dạng để gây lỗi\
    \ cho ứng dụng, và (2) chèn mã khai thác vào dữ liệu đầu vào để thực hiện trên\
    \ hệ thống của nạn nhân, nhằm đánh cắp dữ liệu nhạy cảm hoặc thực hiện các hành\
    \ vi phá hoại. Hình 2.18 minh họa tấn công khai thác lỗi không kiểm tra đầu vào\
    \ dạng (1) thông qua việc nhập dữ liệu quá lớn, gây lỗi thực hiện cho trang web.\n\
    |<image_11>||<image_12>|\n_Hình 2.18. Cung cấp dữ liệu quá lớn để gây lỗi cho\
    \ ứng dụng_\nChúng ta minh họa tấn công khai thác lỗi không kiểm tra đầu vào dạng\
    \ (2) bằng việc chèn mã tấn công SQL vào dữ liệu đầu vào, được thực hiện trên\
    \ hệ quản trị cơ sở dữ liệu nhằm đánh cắp, hoặc phá hủy dữ liệu trong cơ sở dữ\
    \ liệu. Giả thiết một trang web tìm kiếm sản phẩm sử dụng câu lệnh SQL sau để\
    \ tìm kiếm các sản phẩm:\n\"SELECT * FROM tbl_products WHERE product_name like\
    \ '%\" + keyword + \"%'\" trong đó _tbl_products_ là bảng lưu thông tin các sản\
    \ phẩm, _product_name_ là trường tên\nsản phẩm và _keyword_ là từ khóa cung cấp\
    \ từ người dùng form tìm kiếm. Nếu người dùng\nnhập từ khóa là \"iPhone 7\", khi\
    \ đó câu lệnh SQL trở thành:\n\"SELECT * FROM tbl_products WHERE product_name\
    \ like '%iPhone 7%'\"\nNếu trong bảng có sản phẩm thỏa mãn điều kiện tìm kiếm,\
    \ câu lệnh SQL sẽ trả về tập bản ghi. Nếu không có sản phẩm nào thỏa mãn điều\
    \ kiện tìm kiếm, câu lệnh SQL sẽ trả về tập bản ghi rỗng. Nếu người dùng nhập\
    \ từ khóa \"iPhone 7'; _DELETE FROM tbl_products;--_ \", khi đó câu lệnh SQL trở\
    \ thành:\n\"SELECT * FROM tbl_products WHERE product_name like '%iPhone 7'; _DELETE\
    \ FROM tbl_products;--_ %'\"\nNhư vậy, câu lệnh SQL được thực hiện trên cơ sở\
    \ dữ liệu gồm 2 câu lệnh: câu lệnh chọn SELECT ban đầu và câu lệnh xóa DELETE\
    \ do tin tặc chèn thêm. Câu lệnh “ _DELETE FROM tbl_products_ ” sẽ xóa tất cả\
    \ các bản ghi trong bảng _tbl_products_. Sở dĩ tin tặc có thể thực hiện điều này\
    \ là do hầu hết các hệ quản trị cơ sở dữ liệu cho phép thực\nhiện nhiều câu lệnh\
    \ SQL theo _mẻ_ (batch), trong đó các câu lệnh được ngăn cách bởi dấu (;). Ngoài\
    \ ra, dấu “--” ở cuối dữ liệu nhập để loại bỏ hiệu lực của phần lệnh còn lại do\
    \ “-- ” là ký hiệu bắt đầu phần chú thích của dòng lệnh. Ngoài DELETE, tin tặc\
    \ có thể chèn thêm các lệnh SQL khác, như INSERT, UPDATE để thực hiện việc chèn\
    \ thêm bản ghi hoặc sửa đổi dữ liệu theo ý đồ tấn công của mình.\n### Phòng chống\n\
    Biện pháp chủ yếu phòng chống tấn công khai thác lỗi không kiểm tra đầu vào là\
    \ lọc dữ liệu đầu vào. Tất cả các dữ liệu đầu vào, đặc biệt dữ liệu nhập từ người\
    \ dùng và từ các nguồn không tin cậy cần được kiểm tra kỹ lưỡng. Các biện pháp\
    \ cụ thể bao gồm:\n  * Kiểm tra kích thước và định dạng dữ liệu đầu vào;\n  *\
    \ Kiểm tra sự hợp lý của nội dung dữ liệu;\n  * Tạo các bộ lọc để lọc bỏ các ký\
    \ tự đặc biệt và các từ khóa của các ngôn ngữ trong các trường hợp cần thiết mà\
    \ kẻ tấn công có thể sử dụng:\n\\+ Các ký tự đặc biệt: *, ', =, --\n\\+ Các từ\
    \ khóa ngôn ngữ: SELECT, INSERT, UPDATE, DELETE, DROP,....\n(với dạng tấn công\
    \ chèn mã SQL)."
  - 'Public_158

    Khái quát về mã hóa khóa đối xứng

    nan

    Mã hóa khóa đối xứng (Symmetric key encryption) hay còn gọi là mã hóa khóa bí
    mật (Secret key encryption) sử dụng một khóa bí mật (Secret key) duy nhất cho
    cả quá trình mã hóa và giải mã. Khóa bí mật được sử dụng trong quá trình mã hóa
    và giải mã còn được gọi là _khóa chia sẻ_ (Shared key) do bên gửi và bên nhận
    cần chia sẻ khóa bí mật một cách an toàn trước khi có thể thực hiện việc mã hóa
    và giải mã. Hình 3.14 minh họa quá trình mã hóa và giải mã sử dụng chung một khóa
    bí mật chia sẻ.

    |<image_1>|

    _Hình 3.14. Mã hóa khóa đối xứng (Symmetric key encryption)_

    Các hệ mã hóa khóa đối xứng thường sử dụng khóa với kích thước tương đối ngắn.
    Một số kích thước khóa được sử dụng phổ biến là 64, 128, 192 và 256 bit. Do sự
    phát triển nhanh về tốc độ tính toán của máy tính, nên các khóa có kích thước
    nhỏ hơn 128 bit được xem là không an toàn và hầu hết các hệ mã hóa khóa đối xứng
    đảm bảo an toàn hiện tại sử dụng khóa có kích thước từ 128 bit trở lên. Ưu điểm
    nổi bật của các hệ mã hóa khóa đối xứng là có độ an toàn cao và tốc độ thực thi
    nhanh. Tuy nhiên, nhược điểm lớn nhất của các hệ mã hóa khóa đối xứng là việc
    quản lý và phân phối khóa rất khó khăn, đặc biệt là trong các môi trường mở như
    mạng Internet do các bên tham gia phiên truyền thông cần thực hiện việc trao đổi
    các khóa bí mật một cách an toàn trước khi có thể sử dụng chúng để mã hóa và giải
    mã các thông điệp trao đổi.

    Một số hệ mã hóa khóa đối xứng tiêu biểu, gồm DES (Data Encryption Standard),
    3- DES (Triple-DES), AES (Advanced Encryption Standard), IDEA (International Data
    Encryption Algorithm), Blowfish, Twofish, RC4 và RC5. Phần tiếp theo của mục này
    là mô tả các giải thuật mã hóa DES, 3-DES và AES do chúng là các giải thuật đã
    và đang được sử dụng rộng rãi nhất trên thực tế.'
- source_sentence: Theo tài liệu Public_119, mục tiêu của LDA  gì?
  sentences:
  - 'Public_496

    MẠNG NƠ-RON NHÂN TẠO

    Mục đích của phần thí nghiệm

    <table>

    <colgroup>

    <col/>

    </colgroup>

    <thead>

    <tr>

    <th><p>Mục đích của phần thí nghiệm:</p>

    <ul>

    <li><p>Hiểu rõ khái niệm Markov Decision Process (MDP).</p></li>

    <li><p>Nắm được các hàm giá trị

    <math><semantics><msup><mi>V</mi><mi>π</mi></msup><annotation>V^{\pi}</annotation></semantics></math>(s),

    <math><semantics><msup><mi>Q</mi><mi>π</mi></msup><annotation>Q^{\pi}</annotation></semantics></math>(s,a)</p></li>

    <li><p>Làm quen với các phương trình Bellman và ý nghĩa tối ưu.</p></li>

    <li><p>Áp dụng các thuật toán Q-learning, SARSA, Policy Gradient,

    Actor-Critic.</p></li>

    <li><p>Biết các kỹ thuật regularization và exploration trong

    RL.</p></li>

    </ul></th>

    </tr>

    </thead>

    <tbody>

    </tbody>

    </table>'
  - 'Public_033

    Nguồn gốc của dòng điện (The Origin of the Current)

    Giới thiệu về điện (Introduction to Electricity)

    Mọi vật, từ nước và không khí đến đá, thực vật và động vật, đều được tạo thành
    từ các hạt nhỏ gọi là **nguyên tử**. Nguyên tử gồm **proton, neutron và electron**.
    Hạt nhân chứa proton (dương) và neutron (trung hòa), các electron (âm) quay quanh
    hạt nhân. Nguyên tử có thể được so sánh với hệ mặt trời, hạt nhân là Mặt Trời,
    electron là các hành tinh quay quanh.

    Các electron có thể bị giải phóng bởi lực từ bên ngoài: từ trường, nhiệt độ, ma
    sát hoặc phản ứng hóa học. Khi electron tự do chuyển từ nguyên tử này sang nguyên
    tử khác, **dòng điện tử** được tạo ra – cơ sở của **dòng điện**.'
  - 'Public_119

    Giới thiệu


    Trong hai bài viết trước, PCA (unsupervised) giữ lại tổng phương sai lớn nhất
    nhưng không dùng nhãn. Trong phân lớp (supervised), tận dụng nhãn thường cho kết
    quả tốt hơn. Ví dụ chiếu lên các hướng d1 (gần PC1) và d2 (gần thành phần phụ):
    d1 có thể làm hai lớp chồng lấn, trong khi d2 tách tốt hơn cho classification.
    Điều này cho thấy giữ lại nhiều phương sai nhất không phải lúc nào cũng tốt cho
    phân lớp. LDA ra đời để tìm phép chiếu tuyến tính (projection matrix) tối đa hóa
    khả năng phân biệt (discriminant). Với C lớp, số chiều mới không vượt quá C−1.'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
---

# SentenceTransformer based on hiieu/halong_embedding

This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [hiieu/halong_embedding](https://huggingface.co/hiieu/halong_embedding). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [hiieu/halong_embedding](https://huggingface.co/hiieu/halong_embedding) <!-- at revision b57776031035f70ed2030d2e35ecc533eb0f8f71 -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("TTHDZ/halong_embedding_finetuned")
# Run inference
sentences = [
    'Theo tài liệu Public_119, mục tiêu của LDA là gì?',
    'Public_119\nGiới thiệu\n\nTrong hai bài viết trước, PCA (unsupervised) giữ lại tổng phương sai lớn nhất nhưng không dùng nhãn. Trong phân lớp (supervised), tận dụng nhãn thường cho kết quả tốt hơn. Ví dụ chiếu lên các hướng d1 (gần PC1) và d2 (gần thành phần phụ): d1 có thể làm hai lớp chồng lấn, trong khi d2 tách tốt hơn cho classification. Điều này cho thấy giữ lại nhiều phương sai nhất không phải lúc nào cũng tốt cho phân lớp. LDA ra đời để tìm phép chiếu tuyến tính (projection matrix) tối đa hóa khả năng phân biệt (discriminant). Với C lớp, số chiều mới không vượt quá C−1.',
    'Public_496\nMẠNG NƠ-RON NHÂN TẠO\nMục đích của phần thí nghiệm\n<table>\n<colgroup>\n<col/>\n</colgroup>\n<thead>\n<tr>\n<th><p>Mục đích của phần thí nghiệm:</p>\n<ul>\n<li><p>Hiểu rõ khái niệm Markov Decision Process (MDP).</p></li>\n<li><p>Nắm được các hàm giá trị\n<math><semantics><msup><mi>V</mi><mi>π</mi></msup><annotation>V^{\\pi}</annotation></semantics></math>(s),\n<math><semantics><msup><mi>Q</mi><mi>π</mi></msup><annotation>Q^{\\pi}</annotation></semantics></math>(s,a)</p></li>\n<li><p>Làm quen với các phương trình Bellman và ý nghĩa tối ưu.</p></li>\n<li><p>Áp dụng các thuật toán Q-learning, SARSA, Policy Gradient,\nActor-Critic.</p></li>\n<li><p>Biết các kỹ thuật regularization và exploration trong\nRL.</p></li>\n</ul></th>\n</tr>\n</thead>\n<tbody>\n</tbody>\n</table>',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 1.0000, 1.0000],
#         [1.0000, 1.0000, 1.0000],
#         [1.0000, 1.0000, 1.0000]])
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset

* Size: 6,765 training samples
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>sentence_2</code>
* Approximate statistics based on the first 1000 samples:
  |         | sentence_0                                                                        | sentence_1                                                                           | sentence_2                                                                          |
  |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
  | type    | string                                                                            | string                                                                               | string                                                                              |
  | details | <ul><li>min: 9 tokens</li><li>mean: 25.48 tokens</li><li>max: 77 tokens</li></ul> | <ul><li>min: 21 tokens</li><li>mean: 324.91 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 306.9 tokens</li><li>max: 512 tokens</li></ul> |
* Samples:
  | sentence_0                                                                                                              | sentence_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | sentence_2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
  |:------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
  | <code>Transistor NPN có các cực được sắp xếp như thế nào?</code>                                                        | <code>Public_574<br>Các loại linh kiện điện tử phổ biến<br>**Transitor**<br>Transistor hay còn gọi là tranzito là một loại linh kiện bán dẫn chủ động. Thường được sử dụng như một phần tử khuếch đại hay khóa điện tử. Với khả năng đáp ứng nhanh, chính xác nên transistor được sử dụng nhiều trong ứng dụng tương tự và số như: mạch khuếch đại, điều chỉnh điện áp, tạo dao động và điều khiển tín hiệu.<br>Tên gọi transistor chính là từ ghép trong Tiếng Anh của “Transfer” và “resistor” cũng tức là điện trở chuyển đổi. Tên gọi này được John R. Pierce đặt năm 1948 sau khi linh kiện này ra đời. Nó có ý nghĩa rằng thực hiện khuếch đại thông qua chuyển đổi điện trở.<br>Chúng ta có thể nói transistor là một linh kiện bán dẫn chủ động được sử dụng trong mạch khuếch đại, đóng ngắt….<br>Về mặt cấu tạo, transistor được tạo thành từ hai lớp bán dẫn điện ghép lại với nhau. Như hình trên chúng ta có thể thấy có hai loại bán dẫn điện là loại p và loại n. Khi ghép một bán dẫn điện âm nằm giữa hai bán dẫn điện dương ta được Transistor...</code>          | <code>Public_028<br>Nguyên lý hoạt động<br>Nguyên lý làm việc của Transistor NPN<br>Khi không có điện áp cấp cho transistor NPN → **không phân cực**.<br>  * **Lớp N (Emitter & Collector):** điện tử tự do là hạt dẫn đa số, lỗ trống là hạt mang điện thiểu số.<br>  * **Lớp P (Base):** điện tử tự do là hạt mang điện thiểu số, lỗ trống là hạt dẫn đa số.<br>Các hạt mang điện luôn di chuyển từ vùng nồng độ cao → nồng độ thấp:<br>  * Điện tử: từ N (n-region) → P (p-region)<br>  * Lỗ trống: từ P (p-region) → N (n-region)<br>Quá trình này tạo ra **vùng nghèo kiệt (depletion region)** tại mối nối **B-E** và **B-C**.<br>### Tại sao vùng nghèo kiệt thâm nhập nhiều hơn về phía pha tạp nhẹ?<br>  * Doping là quá trình thêm tạp chất vào chất bán dẫn để tăng dẫn điện.<br>  * **Pha tạp nặng:** nhiều hạt mang điện, dẫn điện cao<br>  * **Pha tạp nhẹ:** ít hạt mang điện, dẫn điện thấp<br>Trong **Transistor NPN** :<br>  * **Emitter (N):** pha tạp nặng → nhiều điện tử tự do<br>  * **Base (P):** pha tạp nhẹ → ít lỗ trống<br>  * **Collector (N):** pha tạp vừa phải → ...</code>                                                                                                 |
  | <code>Theo tài liệu Public_087, ô nhiễm không khí là thách thức môi trường nghiêm trọng nhất tại đâu ở Việt Nam?</code> | <code>Public_087<br><br><br>Ô nhiễm không khí hiện đang là một trong những thách thức môi trường nghiêm trọng nhất tại Việt Nam, đặc biệt tại các đô thị lớn như Hà Nội và Thành phố Hồ Chí Minh. Sự gia tăng nồng độ bụi mịn PM2.5 vượt ngưỡng cho phép tại nhiều khu vực không chỉ ảnh hưởng trực tiếp đến sức khỏe cộng đồng mà còn đe dọa sự phát triển kinh tế - xã hội bền vững. Trong bối cảnh toàn cầu đang ứng phó với biến đổi khí hậu và các hệ lụy của quá trình đô thị hóa nhanh, nhận diện rõ thực trạng, xác định chính xác nguyên nhân, đánh giá mức độ đóng góp của từng nguồn thải và hiệu quả các giải pháp đã triển khai là cơ sở quan trọng để xây dựng chính sách phù hợp, góp phần nâng cao hiệu lực quản lý chất lượng không khí quốc gia.</code>                                                                                                                                                                                                                                                                                                           | <code>Public_100<br>Xu hướng tương lai<br>nan<br>* Thiết bị nhẹ và gọn: Kính AR dạng kính mắt thông thường, pin lâu hơn.<br>  * Tích hợp AI và học máy: Tự động nhận diện và tái tạo môi trường thực với độ chính xác cao.<br>  * Tương tác đa giác quan: Hỗ trợ cảm giác chạm, âm thanh 3D, mùi hương.<br>  * Metaverse chuyên biệt: Ứng dụng cho giáo dục, y tế, thương mại chứ không chỉ giải trí.<br>  * Hợp tác từ xa nâng cao: Cuộc họp ảo với hình đại diện 3D chân thực, tăng tính kết nối toàn cầu.</code>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
  | <code>Theo tài liệu Public_107, nếu learning rate quá nhỏ, kết quả của thuật toán GD sẽ như thế nào?</code>             | <code>Public_107<br>Gradient Descent cho hàm nhiều biến<br><br>Giả sử ta cần tìm global minimum cho hàm f(θ) trong đó θ ( _theta_ ) là một vector, thường được dùng để ký hiệu tập hợp các tham số của một mô hình cần tối ưu (trong Linear Regression thì các tham số chính là hệ số w). Đạo hàm của hàm số đó tại một điểm θ bất kỳ được ký hiệu là ∇θf(θ) (hình tam giác ngược đọc là _nabla_ ). Tương tự như hàm 1 biến, thuật toán GD cho hàm nhiều biến cũng bắt đầu bằng một điểm dự đoán θ0, sau đó, ở vòng lặp thứ t, quy tắc cập nhật là:<br>θt+1=θt−η∇θf(θt)<br>Hoặc viết dưới dạng đơn giản hơn: θ=θ−η∇θf(θ).<br>Quy tắc cần nhớ: **luôn luôn đi ngược hướng với đạo hàm**.<br>Việc tính toán đạo hàm của các hàm nhiều biến là một kỹ năng cần thiết. Một vài đạo hàm đơn giản có thể được [tìm thấy ở đây](https://machinelearningcoban.com/math/#bang-cac-dao-ham-co-ban).<br>Quay lại với bài toán Linear Regression<br>Trong mục này, chúng ta quay lại với bài toán [Linear Regression](https://machinelearningcoban.com/2016/12/28/linearregression/) ...</code> | <code>Public_582<br>Thông số và kích thước cơ bản<br>nan<br>Các thông số và kích thước cơ bản của trụ nước được quy định tại Bảng 1 và Phụ lục A<br>**Bảng 1 - Thông số và kích thước cơ bản của trụ nước chữa cháy**<br><table><br><colgroup><br><col/><br><col/><br><col/><br></colgroup><br><tbody><br><tr><br><td><strong>Thông số</strong></td><br><td><strong>Trụ nổi</strong></td><br><td><strong>Trụ ngầm</strong></td><br></tr><br><tr><br><td>Áp suất làm việc, MPa (bar), không lớn hơn</td><br><td>1(10)</td><br><td>1(10)</td><br></tr><br><tr><br><td>Đường kính trong thân trụ nước, mm</td><br><td>125 ± 2</td><br><td>125 ± 2</td><br></tr><br><tr><br><td>Chiều cao nâng của van, mm</td><br><td>Từ 24 đến 30</td><br><td>Từ 24 đến 30</td><br></tr><br><tr><br><td>Chiều cao trụ nước, mm</td><br><td>1 500 ± 20</td><br><td>970 ± 20</td><br></tr><br><tr><br><td>Số vòng quay cần thiết để van mở hoàn toàn, vòng, không lớn hơn</td><br><td>15</td><br><td>15</td><br></tr><br><tr><br><td>Hệ số tổn thất áp suất trong trụ nước, s<sup>2</sup>m<sup>-5</sup>,<br>không lớn hơn</td><br><td>1,2x10<sup>3</sup></td><br><td>1,2x10<sup>3</sup></td><br></tr><br><tr><br><td>...</code> |
* Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters:
  ```json
  {
      "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
      "triplet_margin": 5
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `fp16`: True
- `multi_dataset_batch_sampler`: round_robin

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: no
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 8
- `per_device_eval_batch_size`: 8
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 3
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `parallelism_config`: None
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `project`: huggingface
- `trackio_space_id`: trackio
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `hub_revision`: None
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: no
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `liger_kernel_config`: None
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: True
- `prompts`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin
- `router_mapping`: {}
- `learning_rate_mapping`: {}

</details>

### Training Logs
| Epoch  | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.5910 | 500  | 4.997         |
| 1.1820 | 1000 | 5.0017        |
| 1.7730 | 1500 | 5.0006        |
| 2.3641 | 2000 | 5.0006        |
| 2.9551 | 2500 | 5.0005        |


### Framework Versions
- Python: 3.12.11
- Sentence Transformers: 5.1.0
- Transformers: 4.57.1
- PyTorch: 2.7.0+cu126
- Accelerate: 1.11.0
- Datasets: 3.6.0
- Tokenizers: 0.22.1

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### TripletLoss
```bibtex
@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification},
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->