unicorn-team
/

Unicorn-VL-R3

Image-Text-to-Text

Model card Files Files and versions

rin2401 commited on Jan 14

Commit

f814031

·

verified ·

1 Parent(s): 46df447

Update README.md

Files changed (1) hide show

README.md +11 -0

README.md CHANGED Viewed

@@ -27,6 +27,16 @@ datasets:
 ## 2. Training & Evaluation
 - Team xây dựng 2 bộ benchmark chính để đánh giá trong quá trình training:
   + Tự động: VMLU - Đánh giá trắc nghiệm
@@ -47,6 +57,7 @@ datasets:
   + Optimize lr: 2e-5 - 2e-6
   + Total exp ~40-50exp
 ## 3. Nộp bài
 - Mô hình tốt nhất của team training được là Qwen3-VL-8B với 74.87 điểm trên VMLU, nhưng 2 task Instruction Following và Function calling thì chất lượng không bằng Qwen3-8B (chỉ có 71.74 trên VMLU).

 ## 2. Training & Evaluation
+| Model | VMLU |
+| :--- | :--- |
+| Qwen3-4B-Thinking-2507 | 70.00 |
+| Qwen3-8B-Thinking | 69.00 |
+| Qwen3-VL-8B-Thinking | 74.10 |
+| **Unicorn-4B-R3** | 70.59 |
+| **Unicorn-R3** | 71.74 |
+| **Unicorn-VL-R3** | **74.87** |
 - Team xây dựng 2 bộ benchmark chính để đánh giá trong quá trình training:
   + Tự động: VMLU - Đánh giá trắc nghiệm
   + Optimize lr: 2e-5 - 2e-6
   + Total exp ~40-50exp
 ## 3. Nộp bài
 - Mô hình tốt nhất của team training được là Qwen3-VL-8B với 74.87 điểm trên VMLU, nhưng 2 task Instruction Following và Function calling thì chất lượng không bằng Qwen3-8B (chỉ có 71.74 trên VMLU).