04. ํ ํฐ ์์ค NLL ๋ถ์ + ์จ๋๋ณ ์์ฑ ๋น๊ต ๋ฆฌํฌํธ
๋ชจ๋ธ: korean_1b_fp8_run1 (~1.19B ํ๋ผ๋ฏธํฐ, 34k steps) ์์ฑ์ผ: 2026-02-26 ๋ชฉ์ : ํ ํฐ ๋จ์ ๋ถ์ ๋ก๊ทธ ๊ฐ๋ฅ๋(Negative Log-Likelihood) ๋ถํฌ ๋ถ์ ๋ฐ ์์ฑ ์จ๋(temperature) ๋ณํ์ ๋ฐ๋ฅธ ์ถ๋ ฅ ํ์ง ๋น๊ต
Part A โ ํ ํฐ ์์ค NLL ๋ถ์
๊ฐ์
ํ ํฐ ์์ค NLL(Negative Log-Likelihood)์ ๋ชจ๋ธ์ด ๊ฐ ํ ํฐ์ ์ผ๋ง๋ ํ์ ์ ๊ฐ๊ณ ์์ธกํ๋์ง๋ฅผ ์ธก์ ํ๋ ์งํ๋ค. NLL์ด ๋ฎ์์๋ก ๋ชจ๋ธ์ด ํด๋น ํ ํฐ์ ๋์ ํ๋ฅ ๋ก ์ ํํ ์์ธกํ์์ ์๋ฏธํ๋ฉฐ, NLL์ด ๋์์๋ก ๋ชจ๋ธ์ด ํด๋น ํ ํฐ์ ์์ธกํ๊ธฐ ์ด๋ ค์ ์(๋ฎ์ ํ๋ฅ ๋ก ์์ธก)์ ์๋ฏธํ๋ค.
- ๋ถ์ ๋์: 2,047 ํ ํฐ (50 batches, stride=2,048)
- ์ธก์ ๋ฐฉ์: ๊ฐ ํ ํฐ์ ๋ํด
โlog P(token | context)๊ณ์ฐ
1. NLL ๋ถํฌ ํ์คํ ๊ทธ๋จ
| NLL ๋ฒ์ | ํ ํฐ ์ | ๋น์จ |
|---|---|---|
| < 1 | 840 | 41.04% |
| 1 ~ 2 | 273 | 13.34% |
| 2 ~ 3 | 200 | 9.77% |
| 3 ~ 5 | 311 | 15.19% |
| 5 ~ 10 | 342 | 16.71% |
| > 10 | 81 | 3.96% |
๊ธฐ์ ํต๊ณ๋
| ์งํ | ๊ฐ |
|---|---|
| ํ๊ท NLL (Mean) | 2.7338 |
| ํ์คํธ์ฐจ (Std) | 3.1106 |
| ์ค์๊ฐ (Median) | 1.6328 |
| ๋ถ์ ํ ํฐ ์ | 2,047 |
2. ๋ถํฌ ํด์ ๋ฐ ๋ถ์
2-1. ๋ถํฌ์ ํํ: ์ค๋ฅธ์ชฝ ๊ผฌ๋ฆฌ ๋ถํฌ (Right-Skewed Distribution)
์ค์๊ฐ(1.63)์ด ํ๊ท (2.73)๋ณด๋ค ํ์ ํ ๋ฎ๋ค. ์ด๋ ๋ถํฌ๊ฐ ์ค๋ฅธ์ชฝ์ผ๋ก ์น์ฐ์น ํํ(right-skewed)์์ ์๋ฏธํ๋ค. ์ฆ, ๋๋ถ๋ถ์ ํ ํฐ์ ๋น๊ต์ ์ฝ๊ฒ ์์ธก๋์ง๋ง, ์์์ ๋งค์ฐ ์ด๋ ค์ด ํ ํฐ์ด ํ๊ท ์ ํฌ๊ฒ ๋์ด์ฌ๋ฆฌ๋ ๊ตฌ์กฐ๋ค.
ํ์คํธ์ฐจ(3.11)๊ฐ ํ๊ท (2.73)๋ณด๋ค ํฌ๋ค๋ ์ฌ์ค๋ ๊ฐ์ ๋ฐฉํฅ์ ๊ฐ๋ฆฌํจ๋ค. ๋ถ์ฐ์ด ํฌ๋ค๋ ๊ฒ์ ๋ชจ๋ธ์ด "์ ์๋ ์์ญ"๊ณผ "๊ฑฐ์ ๋ชจ๋ฅด๋ ์์ญ" ์ฌ์ด์ ๊ฒฉ์ฐจ๊ฐ ํฌ๋ค๋ ๊ฒ์ ๋ปํ๋ค.
2-2. NLL < 1 ๊ตฌ๊ฐ (41.04%): ๋ชจ๋ธ์ด ํ์ ํ๋ ํ ํฐ
์ ์ฒด ํ ํฐ์ ์ฝ 41%๋ NLL์ด 1 ๋ฏธ๋ง์ด๋ค. ์ด๋ ๋ชจ๋ธ์ด ์ด ํ ํฐ๋ค์ ๋งค์ฐ ๋์ ํ๋ฅ (P > e^{-1} โ 0.368, ์ค์ ๋ก๋ ๋ ๋์)๋ก ์์ธกํ๋ค๋ ์๋ฏธ๋ค. ์ด ๊ตฌ๊ฐ์ ์ํ๋ ํ ํฐ๋ค์ ์ฃผ๋ก ๋ค์๊ณผ ๊ฐ๋ค:
- ์กฐ์ฌ: ์/๋/์ด/๊ฐ/์/๋ฅผ/์/์/๋ก ๋ฑ ํ๊ตญ์ด ๋ฌธ๋ฒ ์กฐ์ฌ
- ์ด๋ฏธ: ํ๊ตญ์ด ๋์ฌ/ํ์ฉ์ฌ ์ด๋ฏธ (-๋ค, -๊ณ , -๋ฉฐ, -์ด์ ๋ฑ)
- ๊ตฌ๋์ : ๋ง์นจํ, ์ผํ, ๊ดํธ ๋ฑ
- ๋น๋ฒํ ์ ์์ฌ ๋ฐ ๋ถ์ฌ: ๊ทธ๋ฆฌ๊ณ , ๋ํ, ํ์ง๋ง ๋ฑ
- ํจํด์ด ๋ช ํํ ์ํ์ค: URL, ๋ ์ง, ํฌ๋งทํ๋ ํ ์คํธ ๋ด ๋ฐ๋ณต ํจํด
์ด ๊ฒฐ๊ณผ๋ ๋ชจ๋ธ์ด ํ๊ตญ์ด์ ํํ๋ก ์ ํจํด๊ณผ ๋ฌธ๋ฒ ๊ตฌ์กฐ๋ฅผ ์๋นํ ์ ๋ด์ฌํํ์์ ์์ฌํ๋ค.
2-3. NLL > 5 ๊ตฌ๊ฐ (20.67%): ๋ชจ๋ธ์ด "์ถ์ธก"ํ๋ ํ ํฐ
์ ์ฒด ํ ํฐ์ ์ฝ 20.67%(NLL 5~10 ๊ตฌ๊ฐ 16.71% + NLL > 10 ๊ตฌ๊ฐ 3.96%)๋ ๋ชจ๋ธ์ด ๋งค์ฐ ๋ฎ์ ํ๋ฅ ๋ก ์์ธกํ ํ ํฐ๋ค์ด๋ค. ์ด ๊ตฌ๊ฐ์ ํ ํฐ๋ค์ ์ ํ์ ์ผ๋ก:
- ๊ณ ์ ๋ช ์ฌ: ์ธ๋ช , ์ง๋ช , ๊ธฐ์ ๋ช ๋ฑ โ ์ ๋ฌธ๋งฅ์ผ๋ก๋ถํฐ ์์ธก์ด ์ด๋ ค์
- ์ซ์: ํน์ ์์น๋ ๋ฌธ๋งฅ๋ง์ผ๋ก ์์ธก ๋ถ๊ฐ๋ฅ
- ๋๋ฌธ ๋จ์ด: ํ๋ จ ๋ฐ์ดํฐ์์ ํฌ์ํ๊ฒ ๋ฑ์ฅํ๋ ์ดํ
- ์ธ๋์ด/์๋ฌธ ํ ํฐ: ํ๊ตญ์ด ๋ฌธ๋งฅ ์์ ์ฝ์ ๋ ์ธ๊ตญ์ด ํํ
- ๋์ ๋ฌธ๋งฅ ์์กด๋ ํ ํฐ: ํด๋น ์์น์ ์ ๋ณด๊ฐ ์ด์ ๋ฌธ๋งฅ์ ๊ฑฐ์ ๋ด๊ธฐ์ง ์๋ ๊ฒฝ์ฐ (์: ํน์ ๋น์ , ๋ ์ฐฝ์ ํํ)
2-4. ์ข ํฉ ํ๊ฐ
34k steps ๊ธฐ์ค์ผ๋ก, ๋ชจ๋ธ์ ์ ์ฒด ์ดํ ๋ถํฌ์ 40% ์ด์์ ๋งค์ฐ ๋์ ์ ํ๋๋ก ์ฒ๋ฆฌํ๊ณ ์๋ค. ์ด๋ ๊ธฐ๋ณธ์ ์ธ ํ๊ตญ์ด ์ธ์ด ํจํด ์ต๋์ด ์ด๋ฃจ์ด์ก์์ ๋ณด์ฌ์ค๋ค. ๋ค๋ง, ๋๋จธ์ง ์ฝ 20%์ ์ด๋ ค์ด ํ ํฐ๋ค์ ์ถ๊ฐ ํ์ต์ด๋ ๋ ๊ธด ์ปจํ ์คํธ ์ฒ๋ฆฌ๋ฅผ ํตํด ๊ฐ์ ์ฌ์ง๊ฐ ์๋ค.
3. ๊ฐ์ฅ ์ด๋ ค์ด ํ ํฐ (Highest NLL) Top-15
| ์์ | ํ ํฐ | ํ๊ท NLL | ๊ด์ฐฐ ํ์ |
|---|---|---|---|
| 1 | ๋ถ๋๋ฝ๊ฒ |
16.375 | 1 |
| 2 | ๋ฆฌ๋ฉ |
15.188 | 1 |
| 3 | ๋์ด๊ฐ |
13.688 | 1 |
| 4 | hon |
13.625 | 1 |
| 5 | ์ถ๊ทผ |
13.500 | 1 |
| 6 | ์ฃ |
13.062 | 1 |
| 7 | ๋ชจํฐ์ค |
12.812 | 1 |
| 8 | ๋ธ |
12.812 | 1 |
| 9 | ๊ฐํ |
12.750 | 1 |
| 10 | ๋ง๋ผ |
12.688 | 1 |
| 11 | Ana |
12.604 | 3 |
| 12 | 240 |
12.438 | 1 |
| 13 | ๋น๊ต |
12.438 | 1 |
| 14 | ๋ |
12.375 | 1 |
| 15 | ๊ผผ๊ผผ |
12.375 | 1 |
๋ถ์
ํต๊ณ์ ์ ์์ฑ ์ฃผ์: ๋๋ถ๋ถ์ ํญ๋ชฉ์ด ๊ด์ฐฐ ํ์ 1ํ๋ค. ๋จ์ผ ๊ด์ฐฐ์์ ๋์จ NLL ๊ฐ์ ํด๋น ํ ํฐ์ด ํน์ ๋ฌธ๋งฅ์์ ์ผ๋ง๋ ์ด๋ ค์ ๋์ง๋ฅผ ๋ณด์ฌ์ค ๋ฟ, ํด๋น ํ ํฐ ์ ๋ฐ์ ๋ํ ์ผ๋ฐํ๋ ์ด๋ ต๋ค. Ana (3ํ)๊ฐ ๊ทธ๋๋ง ๋ฐ๋ณต ๊ด์ฐฐ๋ ์ผ์ด์ค๋ค.
ํจํด๋ณ ๋ถ๋ฅ
| ํจํด ์ ํ | ํด๋น ํ ํฐ | ์ด๋ ค์ด ์ด์ |
|---|---|---|
| ๋ณตํฉ ์ด๊ทผ / ํ์ฉํ | ๋ถ๋๋ฝ๊ฒ, ๋์ด๊ฐ, ๊ฐํ, ๋, ๊ผผ๊ผผ |
ํ์ฉ ์ ํ ๋งฅ๋ฝ์ด ๋ค์ํ์ฌ ํน์ ํํ ์์ธก์ด ์ด๋ ค์ |
| ์๋ฌธ ํ ํฐ | hon, Ana |
ํ๊ตญ์ด ๋ฌธ๋งฅ ๋ด ์์ด ์ฝ์ โ ํ ํฌ๋์ด์ ์ฒ๋ฆฌ ๋ฐฉ์์ ๋ฐ๋ผ ๋ถ๋ฆฌ๋ ์ ์์ |
| ์ซ์ | 240 |
์์์ ์์น๋ ๋ฌธ๋งฅ์ผ๋ก ์์ธก ๋ถ๊ฐ๋ฅ |
| ์ธ๋์ด (์์ฐจ) | ๋ฆฌ๋ฉ, ๋ชจํฐ์ค, ๋ธ |
์์ด ๋จ์ด์ ํ๊ตญ์ด ์์ฐจ๋ ์์ด์ ๋ฐ์ ๋ณํ ๊ท์น์ด ๋ถ๊ท์นํ์ฌ ์์ธก์ด ์ด๋ ค์ |
| ์ผ๋ฐ ์ดํ (๋ฌธ๋งฅ ์์กด) | ์ถ๊ทผ, ์ฃ, ๋ง๋ผ, ๋น๊ต |
์ด ๋จ์ด๋ค์ด ๋์ค๊ธฐ ์ ๋ฌธ๋งฅ์ด ๋ค์ ๋จ์ด๋ฅผ ์ถฉ๋ถํ ์ ํํ์ง ์๋ ๊ฒฝ์ฐ |
๋ชจ๋ธ์ด ์๋ฌธ ํ ํฐ๊ณผ ์ธ๋์ด์์ ์ด๋ ค์์ ๊ฒช๋ ๊ฒ์, ํ์ต ๋ฐ์ดํฐ๊ฐ ์ฃผ๋ก ํ๊ตญ์ด๋ก ๊ตฌ์ฑ๋์ด ์์ด ์ด์ค ์ธ์ด ์ ํ(code-switching) ์ํฉ์ ๋ํ ๋ ธ์ถ์ด ์ ํ์ ์ด์๊ธฐ ๋๋ฌธ์ผ๋ก ์ถ์ ๋๋ค.
4. ๊ฐ์ฅ ์ฌ์ด ํ ํฐ (Lowest NLL) Top-11
| ์์ | ํ ํฐ | ํ๊ท NLL | ๊ด์ฐฐ ํ์ |
|---|---|---|---|
| 1 | ๋ธ๋ฌ |
0.000 | 2 |
| 2 | ํฅ |
0.000 | 1 |
| 3 | ๊ท |
0.000 | 1 |
| 4 | ใ |
0.000 | 2 |
| 5 | ๋ |
0.000 | 1 |
| 6 | 27 |
0.000 | 2 |
| 7 | ํก |
0.000 | 2 |
| 8 | ์ |
0.000 | 1 |
| 9 | com |
0.000 | 1 |
| 10 | ์์ |
0.000 | 2 |
| 11 | ์ฅ |
0.000 | 37 |
๋ถ์
NLL = 0.000์ ๋ชจ๋ธ์ด ํด๋น ํ ํฐ์ (์์น์ ์ผ๋ก) ๊ฑฐ์ 100% ํ๋ฅ ๋ก ์์ธกํ์์ ์๋ฏธํ๋ค. ์ด ๊ฐ์ ๋ถ๋์์์ ๋ฐ์ฌ๋ฆผ ๊ฒฐ๊ณผ์ผ ์ ์์ผ๋, ์ฌ์ค์ ํ๋ฅ ์ด 1์ ๋งค์ฐ ๊ทผ์ ํ ๊ฒฝ์ฐ์๋ง ์ด๋ ๊ฒ ๋ํ๋๋ค.
์ฅ (37ํ): ๊ฐ์ฅ ์ฃผ๋ชฉํ ๊ฒฐ๊ณผ
์ฅ์ 37ํ๋ผ๋ ์๋์ ์ธ ๊ด์ฐฐ ํ์๋ฅผ ๊ธฐ๋กํ๋ฉด์๋ NLL = 0.000์ ์ ์งํ๋ค. ํ๊ตญ์ด์์ ์ฅ์ ๋งค์ฐ ๋ค์ํ ๋จ์ด์ ๊ตฌ์ฑ ์์ ์ด๋ค (์์ฅ, ๊ณต์ฅ, ์ฅ๊ด, ์ฅ์, ๊ฒฝ์ฐฐ์์ฅ, ๋์๊ด์ฅ ๋ฑ). ์ด ํ ํฐ์ด ์์ ์ค๋ ํจํด์ด ๋งค์ฐ ๊ท์น์ ์ด์ด์, ๋ชจ๋ธ์ด ์ด์ ๋ฌธ๋งฅ์์ ์ฅ์ด ์ฌ ๊ฒ์ ์ฌ์ค์ ํ์ ํ๋ค๋ ์๋ฏธ๋ค. ์ด๋ ๋ชจ๋ธ์ด ํ๊ตญ์ด ์ดํ ๊ฒฐํฉ ํจํด์ ๊น์ด ํ์ตํ์์ ๊ฐํ๊ฒ ์์ฌํ๋ค.
ํจํด๋ณ ๋ถ๋ฅ
| ํจํด ์ ํ | ํด๋น ํ ํฐ | ์์ธก ๊ฐ๋ฅํ ์ด์ |
|---|---|---|
| ๋งค์ฐ ํํ ์์ | ์ฅ, ๋, ์ |
์ ํ ์์ ์ด ๋ค๋ฐ๋ฅผ ์์ ์ ๊ฐํ๊ฒ ์ ํ |
| ํน์ ๊ธฐํธ / ๊ดํธ | ใ |
๊ดํธ ์์ ์ด๋ฆฌ๋ฉด ๋ซํ๋ ํจํด์ด ๊ฑฐ์ ํ์ค |
| URL ํจํด | com |
URL ๋๋ฉ์ธ ๋ด์์ .com์ ๊ณ ์ ํจํด |
| ์ซ์ ํจํด | 27 |
ํน์ ๋ ์ง/๋ฒํธ ํฌ๋งท ๋ด์์ ์ฐ์์ ์ผ๋ก ๋ฑ์ฅ |
| ํน์ ๋ฌธ๋งฅ์ ์์ | ๋ธ๋ฌ, ์์, ํก |
๊ณ ์ ๋ช ์ฌ๋ ํน์ ํํ ๋ด์์ ์ ํ ํฐ์ด ๋ค๋ฅผ ๊ฒฐ์ |
์ด ๊ฒฐ๊ณผ๋ ๋ชจ๋ธ์ด ํ๊ตญ์ด ํํ์ ๊ฒฐํฉ ํจํด, ์ซ์/๊ธฐํธ ํจํด, URL ๊ตฌ์กฐ ๋ฑ์ ์ ๋ด์ฌํํ์์ ๋ณด์ฌ์ค๋ค.
Part B โ ์จ๋๋ณ ์์ฑ ๋น๊ต (Greedy vs Sampling)
๊ฐ์
์์ฑ ์จ๋(temperature)๋ ์ํํธ๋งฅ์ค ํจ์์์ ๋ก์ง(logit)์ ๋๋๋ ์ค์นผ๋ผ ๊ฐ์ด๋ค. ์จ๋๊ฐ ๋ฎ์์๋ก ํ๋ฅ ๋ถํฌ๊ฐ ๋ ์นด๋ก์์ ธ ๋ชจ๋ธ์ด ๊ฐ์ฅ ํ๋ฅ ๋์ ํ ํฐ์ ์ ํํ๋ ๊ฒฝํฅ์ด ๊ฐํด์ง๊ณ , ์จ๋๊ฐ ๋์์๋ก ๋ถํฌ๊ฐ ํํํด์ ธ ๋ค์ํ ํ ํฐ์ด ์ ํ๋ ๊ฐ๋ฅ์ฑ์ด ๋์์ง๋ค.
์ฌ๊ธฐ์ $T$๋ ์จ๋์ด๊ณ , $z_i$๋ ํ ํฐ $i$์ ๋ํ ๋ก์ง์ด๋ค.
- T = 0 (Greedy): ํญ์ ๊ฐ์ฅ ํ๋ฅ ๋์ ํ ํฐ ์ ํ โ ๊ฒฐ์ ๋ก ์
- T = 0.3: ๋ฎ์ ๋ค์์ฑ, ๋์ ์ ํ๋
- T = 0.8: ์ค๊ฐ ๋ค์์ฑ, ์๋ฏธ ์ฐ๊ด์ฑ ์ ์ง
- T = 1.2: ๋์ ๋ค์์ฑ, ์ ํ๋ ํ๋ฝ
1. ํ๋กฌํํธ: "ํ๊ตญ์ ์๋๋"
| ์จ๋ ์ค์ | ์์ฑ ๊ฒฐ๊ณผ ์์ฝ |
|---|---|
| Greedy (T=0) | "์์ธ์ด๋ค. ์์ธ์ ์ญ์ฌ์ ์ผ๋ก..." โ ํ์ ๋ฐ๋ณต ํดํ |
| Low (T=0.3) | "์์ธ์ด๋ค. ์๋๊ฐ ์์ธ์ธ ์ด์ ๋..." โ ํ์ ๊ตฌ์ญ ์ค๋ช , ๋ฐ๋ณต ์ง์ |
| Normal (T=0.8) | "์์ธ, ์ธ์ฒ, ๊ฒฝ๊ธฐ, ๊ฐ์..." โ ๋ ๋์ด (์๋์ ๊ด๋ จ ์๋ ๋ฐฉํฅ) |
| High (T=1.2) | "์ํ ๋ค์์์์" โ ์์ ํ ์๋ฑํ ๋ฐฉํฅ (hallucination ๊ทน๋ํ) |
์ธ๋ถ ๋ถ์
Greedy (T=0): ์ด๋ฐ์๋ ์ฌ์ค์ ๋ง๋ "์์ธ์ด๋ค"๋ฅผ ์์ฑํ์ง๋ง, ์ดํ ์ญ์ฌ์ ์์ ๋ก ์ ํํ๋ฉด์ "ํ์" ๋ฐ๋ณต์ด ๋ํ๋๋ค. ์ด๋ Greedy ๋์ฝ๋ฉ์ ์ ํ์ ์ธ ํดํ(degeneration) ํ์์ด๋ค โ ๋ชจ๋ธ์ด ํ ๋ฒ ํน์ ํจํด์ ์ง์ ํ๋ฉด ๋น ์ ธ๋์ค๊ธฐ ์ด๋ ต๋ค.
Low (T=0.3): Greedy๋ณด๋ค ์ฝ๊ฐ ๋์ ๋ค์์ฑ์ ๋ณด์ด์ง๋ง, ์ฌ์ ํ ๋ฐ๋ณต ์ง์ ์ด ๋ฐ์ํ๋ค. "์๋๊ฐ ์์ธ์ธ ์ด์ "๋ฅผ ์ค๋ช ํ๋ ค๋ ์๋ ์์ฒด๋ ์๋ฏธ ์์ผ๋, ํ์ต ๋ฐ์ดํฐ์ ํ์ ๊ตฌ์ญ ์ค๋ช ํจํด์ ๊ทธ๋๋ก ์ฌํํ๋ ๊ฒฝํฅ์ด ์๋ค.
Normal (T=0.8): ๋ค์์ฑ์ ๋์์ง์ง๋ง ์ ํ๋๊ฐ ๋จ์ด์ง๋ค. "์๋" ํ๋กฌํํธ์์ ๋(้) ๋์ด๋ก ์ด์ด์ง๋ ๊ฒ์ ์๋ฏธ์ ์ฐ๊ด์ฑ์ ์์ผ๋ ์ง๋ฌธ์ ๋ํ ์ง์ ์ ์ธ ๋ต๋ณ์์ ๋ฒ์ด๋๋ค.
High (T=1.2): "์ํ ๋ค์์์์"๋ผ๋ ์์ ํ ์๋ชป๋ hallucination์ด ๋ฐ์ํ๋ค. ์จ๋๊ฐ ๋์์๋ก ํ๋ฅ ๋ถํฌ๊ฐ ํํํด์ง๋ฏ๋ก, ๋ฎ์ ํ๋ฅ ์ ํ ํฐ๋ ์ ํ๋ ๊ฐ๋ฅ์ฑ์ด ํฌ๊ฒ ๋์์ง๋ค.
๊ฒฐ๋ก : ์ด ์ ํ์ ์ฌ์ค ๊ธฐ๋ฐ Q&A์์๋ T=0.3~0.6 ๋ฒ์๊ฐ ๊ฐ์ฅ ์ ์ ํ๋ค. T=0์ ๋ฐ๋ณต ํดํ๋ฅผ ํผํ๋ฉด์๋, T=0.8 ์ด์์์ ๋ฐ์ํ๋ ์๋ฏธ ์ผํ์ ๋ฐฉ์งํ ์ ์๋ค.
2. ํ๋กฌํํธ: "์ธ๊ณต์ง๋ฅ์ด๋"
| ์จ๋ ์ค์ | ์์ฑ ๊ฒฐ๊ณผ ์์ฝ |
|---|---|
| Greedy (T=0) | "๋ฌด์์ธ๊ฐ?[4] 321 2018.10.1..." โ ๊ฒ์ํ ํฌ๋งท, ์๋ฏธ ์์ |
| Low (T=0.3) | "๋ฌด์์ธ๊ฐ? ๋์งํธ ์๋..." โ ๋ฐ๋ณต์ ๋ชฉ์ฐจ |
| Normal (T=0.8) | "? - 1[2015.12.15] ์ธํฐ๋ท์ด..." โ ๊ฒ์ํ/๋ ์ง ํฌ๋งท |
| High (T=1.2) | "๋ฌด์์ธ๊ฐ? TAG ๊ต์ก..." โ ๋ธ๋ก๊ทธ ํ๊ทธ ํฌ๋งท |
์ธ๋ถ ๋ถ์
์ด ํ๋กฌํํธ์์๋ ๋ชจ๋ ์จ๋์์ ์๋ฏธ ์๋ "์ธ๊ณต์ง๋ฅ ์ค๋ช "์ ์์ฑํ๋ ๋ฐ ์คํจํ๋ค. ๊ณตํต์ ์ผ๋ก ๊ด์ฐฐ๋๋ ํจํด์:
- ๊ฒ์ํ/๋ธ๋ก๊ทธ ํฌ๋งท ์ฌํ (๋ ์ง, ๋ฒํธ, ํ๊ทธ)
- ๋ชฉ์ฐจ ๊ตฌ์กฐ ๋ฐ๋ณต
- ์ ์ ์ธ๊ณต์ง๋ฅ์ ๋ํ ์ค์ง์ ์ค๋ช ์ ๋ถ์ฌ
์คํจ ์์ธ ๋ถ์: ํ์ต ๋ฐ์ดํฐ(์น ํฌ๋กค๋ง ๊ธฐ๋ฐ์ผ๋ก ์ถ์ )์์ "์ธ๊ณต์ง๋ฅ์ด๋"์ด๋ผ๋ ํํ์ด ์ฃผ๋ก ๊ฒ์ํ ์ ๋ชฉ, ๋ธ๋ก๊ทธ ํฌ์คํธ ๋์ ๋ถ, ์จ๋ผ์ธ ๊ฐ์ ๋ชฉ์ฐจ ๋ฑ์ ํฌ๋งท์ผ๋ก ๋ฑ์ฅํ์ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๋ชจ๋ธ์ ํด๋น ํ๋กฌํํธ ์ดํ ๋์ฌ ๋ด์ฉ์ ํ์ต ๋ฐ์ดํฐ์ ๋ถํฌ์ ๋ฐ๋ผ ์์ธกํ๊ธฐ ๋๋ฌธ์, ๊ฒ์ํ ํฌ๋งท ํ ํฐ๋ค์ด ๋์ ํ๋ฅ ๋ก ์ ํ๋ ๊ฒ์ด๋ค.
๊ฐ์ ๋ฐฉํฅ: ์ด ๋ฌธ์ ๋ ๋จ์ํ ์จ๋๋ฅผ ์กฐ์ ํ๋ค๊ณ ํด๊ฒฐ๋์ง ์๋๋ค. ๋ค์ ๋ฐฉ๋ฒ๋ค์ด ํ์ํ๋ค:
- ์ง์-ํ๋(Instruction Tuning): "์ธ๊ณต์ง๋ฅ์ด๋ ๋ฌด์์ธ์ง ์ค๋ช ํ๋ผ"๋ ์์ ๋ช ๋ นํ ๋ฐ์ดํฐ๋ก ํ์ธํ๋
- ๋ฐ์ดํฐ ํ์ง ๊ฐ์ : ๊ฒ์ํ/๋ธ๋ก๊ทธ ๋ ธ์ด์ฆ๋ฅผ ์ ๊ฑฐํ ๊ณ ํ์ง ์ค๋ช ๋ฌธ ๋ฐ์ดํฐ ์ถ๊ฐ
- ์์คํ ํ๋กฌํํธ ํ์ฉ: "๋น์ ์ ๊ต์ก์ฉ AI ์ด์์คํดํธ์ ๋๋ค"์ ๊ฐ์ ์ญํ ๋ถ์ฌ
3. ํ๋กฌํํธ: "๋ด์ด ์ค๋ฉด ๊ฝ์ด ํผ๊ณ "
| ์จ๋ ์ค์ | ์์ฑ ๊ฒฐ๊ณผ ์์ฝ |
|---|---|
| Greedy (T=0) | "๊ฝ์ด ์ง๋ฉด ์ด๋งค๊ฐ ์ด๋ฆฐ๋ค" ๋ฐ๋ณต |
| Low (T=0.3) | "๊ฝ์ด ์ง๋ ๊ณ์ ์๋..." ๋ฐ๋ณต |
| Normal (T=0.8) | "๊ทธ๋๊ฐ ์ค๋ฉด ๊ฝ์ด ํผ๊ณ ..." ์์ ๋ฐ๋ณต |
| High (T=1.2) | "๊ฝ๋ง๋ค ํฅ๊ธฐ๋กญ๋ค...", "๋์ ์ฒ์์ผ๋ก ์ด ๋ด, ๋ด ๋ง์์ ํ ์ด์ด ์ฃผ๋..." ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ์์ |
์ธ๋ถ ๋ถ์
์ด ํ๋กฌํํธ์์๋ ์จ๋๊ฐ ๋์์๋ก ์คํ๋ ค ๋ ๋์ ๊ฒฐ๊ณผ๊ฐ ๋ํ๋๋ ์ญ์ค์ ํ์์ด ๊ด์ฐฐ๋๋ค.
Greedy (T=0): "๊ฝ์ด ์ง๋ฉด ์ด๋งค๊ฐ ์ด๋ฆฐ๋ค"๋ผ๋ ๋จ์ํ ์์ฐ ์ฌ์ดํด ๋ฌ์ฌ๊ฐ ๋ฐ๋ณต๋๋ค. ํ์ต ๋ฐ์ดํฐ์์ ์ด ์กฐํฉ์ด ๊ฐ์ฅ ํํ๊ฒ ๋ฑ์ฅํ๋ ํจํด์ด์์ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๋ฌธํ์ ํํ์ผ๋ก์๋ ๋งค์ฐ ๋น์ฝํ๋ค.
Low (T=0.3): ๋น์ทํ ๋ฐ๋ณต ํจํด์ด ๋ํ๋์ง๋ง, ๊ณ์ ์ ์ ํ์ ๋ํ ์์ ์ด ์ฝ๊ฐ ๋ฑ์ฅํ๋ค.
Normal (T=0.8): "๊ทธ๋๊ฐ ์ค๋ฉด"์ด๋ผ๋ ์์ ์ ํํ์ด ๋ํ๋๊ธฐ ์์ํ๋ค. ์์ ์์๊ฐ ์ฆ๊ฐํ์ง๋ง ์ฌ์ ํ ํน์ ํจํด์ ๋ฐ๋ณตํ๋ค.
High (T=1.2): "๊ฝ๋ง๋ค ํฅ๊ธฐ๋กญ๋ค"์ ๊ฐ์ ๋ค์ํ ๊ฐ๊ฐ ํํ์ด ๋ฑ์ฅํ๊ณ , "๋์ ์ฒ์์ผ๋ก ์ด ๋ด, ๋ด ๋ง์์ ํ ์ด์ด ์ฃผ๋..."๊ณผ ๊ฐ์ ์ฐฝ์์ ์ด๊ณ ์์ฐ์ค๋ฌ์ด ๋ฌธ์ฅ์ด ์์ฑ๋๋ค. ์์ ํ๋กฌํํธ์ ํน์ฑ์, ๋ค์ํ ํํ์ด ๋ชจ๋ ํ์ฉ๋๋ ๊ฐ๋ฐฉ์ ๋งฅ๋ฝ์ด๋ฏ๋ก ๋์ ์จ๋๊ฐ ์คํ๋ ค ์ ๋ฆฌํ๊ฒ ์์ฉํ๋ค.
ํต์ฌ ์ธ์ฌ์ดํธ: ์จ๋์ ์ต์ ๊ฐ์ ํ์คํฌ์ ์ฑ๊ฒฉ์ ๋ฐ๋ผ ํฌ๊ฒ ๋ฌ๋ผ์ง๋ค.
- ์ ๋ต์ด ํ๋์ธ ์ฌ์ค ๊ธฐ๋ฐ ํ์คํฌ โ ๋ฎ์ ์จ๋ ์ ๋ฆฌ
- ๋ค์ํ ํํ์ด ๋ชจ๋ ํ์ฉ๋๋ ์ฐฝ์ ํ์คํฌ โ ๋์ ์จ๋ ์ ๋ฆฌ
4. ์ข ํฉ: ์ต์ Temperature ๊ฐ์ด๋
| ์ฌ์ฉ ๋ชฉ์ | ๊ถ์ฅ Temperature | ์ด์ |
|---|---|---|
| ์ฌ์ค ๊ธฐ๋ฐ Q&A | 0.0 ~ 0.3 | ์ ํ๋ ์ต์ฐ์ ; Greedy์ ๋ฐ๋ณต ํดํ๋ ๋ฐ๋ณต ํ๋ํฐ๋ก ๋ณด์ ๊ฐ๋ฅ |
| ์ผ๋ฐ ํ ์คํธ ์์ฑ | 0.6 ~ 0.8 | ๋ค์์ฑ + ์๋ฏธ ์ฐ๊ด์ฑ์ ๊ท ํ ์ ์ง |
| ์ฐฝ์ / ์ / ์์ค | 0.8 ~ 1.2 | ์ฐฝ์์ฑ ๊ทน๋ํ; ๋ค์ํ ํํ์ด ํ์ฉ๋๋ ๊ฐ๋ฐฉ์ ๋งฅ๋ฝ |
| ์ฝ๋ ์์ฑ | 0.0 ~ 0.2 | ๊ตฌ์กฐ์ ์ ํ๋ ํ์; ๋ฌธ๋ฒ ์ค๋ฅ ์๋ ์ฝ๋ ์ ํธ |
| ์์ฝ / ๋ฒ์ญ | 0.3 ~ 0.5 | ์๋ฌธ ์๋ฏธ ๋ณด์กด + ์์ฐ์ค๋ฌ์ด ํํ ์ฌ์ด ๊ท ํ |
์ถ๊ฐ ๊ถ์ฅ์ฌํญ
๋จ์ํ ์จ๋๋ฅผ ์กฐ์ ํ๋ ๊ฒ ์ธ์๋ ๋ค์ ๊ธฐ๋ฒ์ ๋ณ์ฉํ๋ฉด ํ์ง์ด ํฅ์๋๋ค:
- ๋ฐ๋ณต ํจ๋ํฐ (Repetition Penalty):
repetition_penalty=1.1~1.3โ Greedy ๋์ฝ๋ฉ์์ ๋ฐ๋ณต ํดํ ๋ฐฉ์ง์ ํจ๊ณผ์ - Top-p (Nucleus Sampling):
top_p=0.9~0.95โ ์จ๋์ ํจ๊ป ์ฌ์ฉ ์ ํ๋ฅ ๋ฎ์ ํ ํฐ ์ ํ ์ต์ - Top-k Sampling:
top_k=50โ ์์ k๊ฐ ํ ํฐ๋ง ๊ณ ๋ คํ์ฌ ๋ถํ์ํ hallucination ์ต์
์ข ํฉ ๊ฒฐ๋ก
๋ชจ๋ธ ํํฉ ํ๊ฐ
| ํ๊ฐ ํญ๋ชฉ | ๊ฒฐ๊ณผ | ํด์ |
|---|---|---|
| NLL ํ๊ท | 2.73 | Perplexity โ e^2.73 โ 15.3; 34k steps ๊ธฐ์ค์ผ๋ก ์ํธํ ์์ค |
| ์ NLL ํ ํฐ ๋น์จ | 41% (NLL < 1) | ํ๊ตญ์ด ๊ธฐ๋ณธ ๋ฌธ๋ฒ/์ดํ ํจํด ์ต๋ ์๋ฃ |
| ๊ณ NLL ํ ํฐ ๋น์จ | 21% (NLL > 5) | ๊ณ ์ ๋ช ์ฌ, ์ซ์, ์ธ๋์ด ๋ฑ ์ด๋ ค์ด ํ ํฐ์์ ๊ฐ์ ์ฌ์ง |
| ๋ฐ๋ณต ํดํ | ๋ชจ๋ ๋ฎ์ ์จ๋์์ ๊ด์ฐฐ | ํ์ต ๋จ๊ณ์์๋ ์ ์; RLHF/์ง์ ํ๋์ผ๋ก ํด๊ฒฐ ๊ฐ๋ฅ |
| ์ฐฝ์ ๋ฅ๋ ฅ | T=1.2์์ ์ ์๋ฏธํ ์ถ๋ ฅ | ๊ธฐ์ด์ ์ธ ํ๊ตญ์ด ์ฐฝ์ ๋ฅ๋ ฅ ์กด์ฌ |
๋ค์ ๋จ๊ณ ์ ์ธ
- ๋ฐ๋ณต ํดํ ๋ถ์: Top-30 ์ด๋ ค์ด ํ ํฐ๋ค์ด ์ค์ ๋ก ์ด๋ค ๋ฌธ๋งฅ์์ ๋ฑ์ฅํ๋์ง ์์งํ์ฌ, ํด๋น ๋๋ฉ์ธ ๋ฐ์ดํฐ ๋ณด๊ฐ ์ฌ๋ถ ๊ฒฐ์
- ์จ๋๋ณ ์๋ ํ๊ฐ ์งํ ๋์ : BLEU, BERTScore, ๋ฐ๋ณต๋ฅ (n-gram repetition rate) ๋ฑ ์ ๋ ์งํ์ ํจ๊ป ์จ๋ ์ต์ ํ ์๋ํ
- ์ง์ ํ๋ ๋ฐ์ดํฐ ๊ตฌ์ฑ: "์ธ๊ณต์ง๋ฅ์ด๋" ํ๋กฌํํธ ์คํจ ์ฌ๋ก๋ฅผ ์ฐธ๊ณ ํ์ฌ, ์ค๋ช ๋ฌธ ํ์์ instruction-following ๋ฐ์ดํฐ ์ฐ์ ์์ง
- ํ๋กฌํํธ ์์ง๋์ด๋ง: ํ์ฌ ๋ฒ ์ด์ค ๋ชจ๋ธ ์์ค์์๋ ํ๋กฌํํธ ๋์ "์ค๋ช :" ๋๋ "๋ต:" ๋ฑ์ ์ ๋ ๋ฌธ๊ตฌ ์ถ๊ฐ๋ก ์ถ๋ ฅ ํ์ ์ ์ด ๊ฐ๋ฅ
๋ณธ ๋ฆฌํฌํธ๋ korean_1b_fp8_run1 ์ฒดํฌํฌ์ธํธ ๊ธฐ์ค์ด๋ฉฐ, ์ดํ ์ถ๊ฐ ํ์ต ๋๋ ํ์ธํ๋ ํ ๋์ผ ๋ถ์์ ์ฌ์ค์ํ์ฌ ๊ฐ์ ์ฌ๋ถ๋ฅผ ์ถ์ ํ ๊ฒ์ ๊ถ์ฅํ๋ค.