metadata
language:
- ko
license: other
tags:
- llm
- korean
- orpo
- gguf
FRANKENSTALLM 3B v2 (Byte-Fallback Fixed)
ํ๊ตญ์ด ์ค์ฌ FRANKENSTALLM 3B ORPO ํ์ธํ๋ ์ฒดํฌํฌ์ธํธ์ byte-fallback ํ ํฐ 256๊ฐ๋ฅผ ์ถ๊ฐํ ๋ฒ์ ์
๋๋ค.
llama.cpp/GGUF ์ถ๋ก ์ ์ค๋ฐ๊ฟ(\n) ๋ฑ ๋ฏธ๋ฑ๋ก ๋ฌธ์๋ก ์ธํ ํฌ๋์๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ์ฌ์ฉํฉ๋๋ค.
๋ชจ๋ธ ์์ธ
| ํญ๋ชฉ | ๊ฐ |
|---|---|
| Architecture | LlamaForCausalLM |
| Params | ~3B |
| Hidden size | 2048 |
| Layers | 24 |
| Attention heads | 16 |
| KV heads | 4 |
| Max position | 4096 |
| Vocab size | 64,256 (64,000 + 256 byte-fallback) |
| Training | ORPO (SFT โ ORPO) |
๋ณ๊ฒฝ ์ฌํญ (v2)
- ํ ํฌ๋์ด์ :
byte_fallback=True,<0x00>~`<0xFF>` 256๊ฐ ํ ํฐ ์ถ๊ฐ - ์๋ฒ ๋ฉ: 64,000 โ 64,256 ๋ฆฌ์ฌ์ด์ฆ, ์ ํ ํฐ ์ด๊ธฐํ
- GGUF ๋ณํยทOllama ๋ฐฐํฌ ์ ๋ด๋ผ์ธ ํฌํจ ์ ๋ ฅ ์ ์ ์ฒ๋ฆฌ ํ์ธ
ORPO ํ๊ฐ ์์ฝ (๋์ผ ์ฒดํฌํฌ์ธํธ ๊ธฐ์ค)
- ํ๊ฐ ์ผ์: 2026-03-09
- Preference Accuracy: 76.02%
- Reward Margin: 0.6100
- Eval Loss: 1.7910 โ 1.6250
- KoBEST (0-shot) ํ๊ท : 52.75%
- ์์ฑ ํ์ง: Greedy 3-gram ๋ฐ๋ณต๋ฅ 30.89%, EOS ์ข ๋ฃ์จ 66.67%
- PPL Forgetting: ์ต๋ 4.1% (๊ธฐ์ค <15%)
- ์ข ํฉ: 7/10 ์ฐจ์ ํต๊ณผ, ์ ๋ ์ค์ฝ์ด 63.7/100
์์ธ: ํ๋ก์ ํธ ๋ด reports/2026-03-09_ORPO_EVALUATION_REPORT.md ์ฐธ๊ณ .
Ollama ๋ฐฐํฌ ๋ฒค์น๋งํฌ (Q4_K_M, 2026-03-09)
- ๋ชจ๋ธ๋ช
:
frankenstallm-3b-v2 - ํ ์คํธ ์: 35 (์๋ 20 + ์๋ 15)
- ์๋ ์ฑ์ ํ๊ท : 46.7
- ์นดํ ๊ณ ๋ฆฌ: korean_nlu 100.0, reasoning 50.0, knowledge 75.0, instruction_following 66.7, code 0.0, safety 10.0, repetition_resistance 2.2 ๋ฑ
- ์ง์ฐ: Avg TTFT 16.7 ms, Avg TPS 142.5
์์ธ: reports/2026-03-09_GGUF_DEPLOYMENT_AND_EVAL_REPORT.md, eval/results/frankenstallm-3b-v2/ollama_benchmark_summary.md
์ฌ์ฉ
- Transformers: ์ด ์ฒดํฌํฌ์ธํธ๋ฅผ ๊ทธ๋๋ก
from_pretrained(...)๋ก ๋ก๋ ๊ฐ๋ฅ. - GGUF:
scripts/fix_tokenizer_byte_fallback.py์ ์ฉ ํconvert_hf_to_gguf.pyโllama-quantize๋ก ๋ณํํ v2 ํ์ดํ๋ผ์ธ ์ฌ์ฉ ๊ถ์ฅ.
์ด๋ฏธ ๋ณํ๋ Q4_K_M GGUF๋ Ollama์์frankenstallm-3b-v2๋ก ๋ฐฐํฌ ๊ฐ๋ฅ.
๋ผ์ด์ ์ค
ํ๋ก์ ํธ(FRANKENSTALLM) ๋ผ์ด์ ์ค์ ๋ฐ๋ฆ ๋๋ค.