File size: 2,980 Bytes
b9d0df6 f29a6df b9d0df6 f29a6df b9d0df6 f29a6df b9d0df6 f29a6df b9d0df6 f29a6df b9d0df6 f29a6df b9d0df6 f29a6df | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 | ---
base_model: unsloth/Qwen2.5-7B-Instruct
tags:
- education
- indonesia
- exam-generator
- kurikulum-merdeka
- text-generation-inference
- transformers
- unsloth
- qwen2
license: apache-2.0
language:
- id
- en
---
datasets:
- DimasMP3/Indo-Elementary-School-Exams (custom)
metrics:
- eval_loss: 0.6869
---
# ๐ Qwen2.5-7B-Indo-Exam-Generator-16bit
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200" align="right"/>](https://github.com/unslothai/unsloth)
**Developed by:** [Dimas Maulana Putra (DimasMP3)](https://github.com/DimasMP3)
**Model Type:** Specialized Fine-Tuned for Indonesian Elementary Education
**Training Status:** Optimal @ Step 500 (Eval Loss: 0.686)
---
## ๐ Overview
**Qwen2.5-Indo-Exam-Generator** adalah model bahasa yang telah di-finetuning secara khusus untuk menjawab tantangan dunia pendidikan di Indonesia. Model ini dilatih menggunakan dataset berkualitas tinggi sebanyak **4.500+ soal sekolah dasar** yang disesuaikan dengan **Kurikulum Merdeka**.
Model ini bukan sekadar AI umum; ia dirancang untuk berperan sebagai **Guru Digital** yang mampu menghasilkan soal ujian (pilihan ganda) lengkap dengan kunci jawaban dan pembahasan yang akurat.
### โจ Key Features
- ๐ฎ๐ฉ **Native Indonesian Support:** Memahami istilah pendidikan lokal (IPAS, HOTS, Kurikulum Merdeka).
- ๐ **Structured Output:** Konsisten dalam menghasilkan format Soal, Opsi (A-D), Kunci, dan Pembahasan.
- ๐ง **RAG Ready:** Dioptimalkan untuk bekerja dengan sistem *Retrieval-Augmented Generation* (pgvector/Drizzle).
- ๐ **High Precision:** Fine-tuned dalam format 16-bit untuk akurasi logika yang tajam.
---
## ๐ Training Results (WandB Metrics)
Training dilakukan dengan pengawasan ketat terhadap *Validation Loss* untuk mencegah halusinasi:
| Metric | Value |
| :--- | :--- |
| **Best Step** | 500 |
| **Validation Loss** | **0.6869** |
| **Training Loss** | 0.3204 |
| **Epoch** | 2.43 |
> **Note:** Berhenti otomatis via *Early Stopping* di Step 650 untuk memastikan bobot terbaik (Step 500) yang tersimpan.
---
## ๐ ๏ธ Tech Stack
Model ini lahir dari perpaduan teknologi mutakhir:
- **Base Model:** `unsloth/Qwen2.5-7B-Instruct`
- **Fine-tuning Tool:** [Unsloth](https://github.com/unslothai/unsloth) (2x faster training)
- **Framework:** Huggingface TRL & Transformers
- **Optimization:** LoRA (Rank 128)
---
## ๐ Cara Penggunaan (Inference)
```python
from unsloth import FastLanguageModel
import torch
model, tokenizer = FastLanguageModel.from_pretrained(
model_name = "DimasMP3/Qwen2.5-7B-Indo-Exam-Generator-16bit",
max_seq_length = 2048,
load_in_4bit = True,
)
prompt = """<|im_start|>system
Anda adalah Guru SD yang ahli. Buatlah soal pilihan ganda berdasarkan konteks materi ini.<|im_end|>
<|im_start|>user
Topik: Ekosistem Laut
Konteks: Terumbu karang adalah tempat tinggal ikan.<|im_end|>
<|im_start|>assistant
"""
# Generate Output... |