File size: 2,980 Bytes
b9d0df6
 
 
f29a6df
 
 
 
b9d0df6
 
 
 
 
 
f29a6df
b9d0df6
 
f29a6df
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b9d0df6
f29a6df
 
 
b9d0df6
f29a6df
 
 
 
 
b9d0df6
f29a6df
 
 
 
 
 
 
b9d0df6
f29a6df
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
---
base_model: unsloth/Qwen2.5-7B-Instruct
tags:
- education
- indonesia
- exam-generator
- kurikulum-merdeka
- text-generation-inference
- transformers
- unsloth
- qwen2
license: apache-2.0
language:
- id
- en
---
datasets:
- DimasMP3/Indo-Elementary-School-Exams (custom)
metrics:
- eval_loss: 0.6869
---

# ๐ŸŽ“ Qwen2.5-7B-Indo-Exam-Generator-16bit

[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200" align="right"/>](https://github.com/unslothai/unsloth)

**Developed by:** [Dimas Maulana Putra (DimasMP3)](https://github.com/DimasMP3)  
**Model Type:** Specialized Fine-Tuned for Indonesian Elementary Education  
**Training Status:** Optimal @ Step 500 (Eval Loss: 0.686)

---

## ๐ŸŒŸ Overview
**Qwen2.5-Indo-Exam-Generator** adalah model bahasa yang telah di-finetuning secara khusus untuk menjawab tantangan dunia pendidikan di Indonesia. Model ini dilatih menggunakan dataset berkualitas tinggi sebanyak **4.500+ soal sekolah dasar** yang disesuaikan dengan **Kurikulum Merdeka**.

Model ini bukan sekadar AI umum; ia dirancang untuk berperan sebagai **Guru Digital** yang mampu menghasilkan soal ujian (pilihan ganda) lengkap dengan kunci jawaban dan pembahasan yang akurat.

### โœจ Key Features
- ๐Ÿ‡ฎ๐Ÿ‡ฉ **Native Indonesian Support:** Memahami istilah pendidikan lokal (IPAS, HOTS, Kurikulum Merdeka).
- ๐Ÿ“ **Structured Output:** Konsisten dalam menghasilkan format Soal, Opsi (A-D), Kunci, dan Pembahasan.
- ๐Ÿง  **RAG Ready:** Dioptimalkan untuk bekerja dengan sistem *Retrieval-Augmented Generation* (pgvector/Drizzle).
- ๐Ÿš€ **High Precision:** Fine-tuned dalam format 16-bit untuk akurasi logika yang tajam.

---

## ๐Ÿ“Š Training Results (WandB Metrics)
Training dilakukan dengan pengawasan ketat terhadap *Validation Loss* untuk mencegah halusinasi:

| Metric | Value |
| :--- | :--- |
| **Best Step** | 500 |
| **Validation Loss** | **0.6869** |
| **Training Loss** | 0.3204 |
| **Epoch** | 2.43 |

> **Note:** Berhenti otomatis via *Early Stopping* di Step 650 untuk memastikan bobot terbaik (Step 500) yang tersimpan.

---

## ๐Ÿ› ๏ธ Tech Stack
Model ini lahir dari perpaduan teknologi mutakhir:
- **Base Model:** `unsloth/Qwen2.5-7B-Instruct`
- **Fine-tuning Tool:** [Unsloth](https://github.com/unslothai/unsloth) (2x faster training)
- **Framework:** Huggingface TRL & Transformers
- **Optimization:** LoRA (Rank 128)

---

## ๐Ÿ“– Cara Penggunaan (Inference)

```python
from unsloth import FastLanguageModel
import torch

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "DimasMP3/Qwen2.5-7B-Indo-Exam-Generator-16bit",
    max_seq_length = 2048,
    load_in_4bit = True,
)

prompt = """<|im_start|>system
Anda adalah Guru SD yang ahli. Buatlah soal pilihan ganda berdasarkan konteks materi ini.<|im_end|>
<|im_start|>user
Topik: Ekosistem Laut
Konteks: Terumbu karang adalah tempat tinggal ikan.<|im_end|>
<|im_start|>assistant
"""

# Generate Output...