unicorn-team
/

Unicorn-R3

Text Generation

text-generation-inference

Model card Files Files and versions

rin2401 commited on Dec 3, 2025

Commit

8653245

·

verified ·

1 Parent(s): f227ac5

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -162,7 +162,7 @@ special_tokens:
 - Một số phương pháp team thử nhưng chưa thành công / chưa kịp exp:
   + Crawl được hơn 10k dữ liệu multiple choices + answer từ tracnghiem.net -> sinh synthetic thinking -> Training -> kết quả thấp đi trên VMLU nên quyết định bỏ.
-  + Dựa trên 2M SFT, team có phân loại, filter trên radnom 100k để phân loại thành 12 task chính , nhưng chưa kịp mixing để training
 ## 2. Training & Evaluation
@@ -181,7 +181,7 @@ special_tokens:
 - Training
-  + LoRA/FT: Mặc dù lượng dữ liệu nhỏ nhưng kết quả loss + eval cho thấy FT vẫn cho hiệu suất tốt hơn
   + Packing dữ liệu, Ligerkernel, Flex attention giảm mem và tăng tốc độ training để exp được nhiều
   + Optimize lr: 2e-5 - 2e-6
   + Total exp ~40-50exp

 - Một số phương pháp team thử nhưng chưa thành công / chưa kịp exp:
   + Crawl được hơn 10k dữ liệu multiple choices + answer từ tracnghiem.net -> sinh synthetic thinking -> Training -> kết quả thấp đi trên VMLU nên quyết định bỏ.
+  + Dựa trên 2M SFT, team có phân loại, filter trên random 100k để phân loại thành 12 task chính , nhưng chưa kịp mixing để training
 ## 2. Training & Evaluation
 - Training
+  + LoRA/FFT: Mặc dù lượng dữ liệu nhỏ nhưng kết quả loss + eval cho thấy FFT vẫn cho hiệu suất tốt hơn
   + Packing dữ liệu, Ligerkernel, Flex attention giảm mem và tăng tốc độ training để exp được nhiều
   + Optimize lr: 2e-5 - 2e-6
   + Total exp ~40-50exp