frankenstallm / source /eval /reports /04_token_analysis_comparison_report.md
pathcosmos's picture
Upload folder using huggingface_hub (#29)
5b1ff4d

04. ํ† ํฐ ์ˆ˜์ค€ NLL ๋ถ„์„ + ์˜จ๋„๋ณ„ ์ƒ์„ฑ ๋น„๊ต ๋ฆฌํฌํŠธ

๋ชจ๋ธ: korean_1b_fp8_run1 (~1.19B ํŒŒ๋ผ๋ฏธํ„ฐ, 34k steps) ์ž‘์„ฑ์ผ: 2026-02-26 ๋ชฉ์ : ํ† ํฐ ๋‹จ์œ„ ๋ถ€์ • ๋กœ๊ทธ ๊ฐ€๋Šฅ๋„(Negative Log-Likelihood) ๋ถ„ํฌ ๋ถ„์„ ๋ฐ ์ƒ์„ฑ ์˜จ๋„(temperature) ๋ณ€ํ™”์— ๋”ฐ๋ฅธ ์ถœ๋ ฅ ํ’ˆ์งˆ ๋น„๊ต


Part A โ€” ํ† ํฐ ์ˆ˜์ค€ NLL ๋ถ„์„

๊ฐœ์š”

ํ† ํฐ ์ˆ˜์ค€ NLL(Negative Log-Likelihood)์€ ๋ชจ๋ธ์ด ๊ฐ ํ† ํฐ์„ ์–ผ๋งˆ๋‚˜ ํ™•์‹ ์„ ๊ฐ–๊ณ  ์˜ˆ์ธกํ•˜๋Š”์ง€๋ฅผ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ๋‹ค. NLL์ด ๋‚ฎ์„์ˆ˜๋ก ๋ชจ๋ธ์ด ํ•ด๋‹น ํ† ํฐ์„ ๋†’์€ ํ™•๋ฅ ๋กœ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ–ˆ์Œ์„ ์˜๋ฏธํ•˜๋ฉฐ, NLL์ด ๋†’์„์ˆ˜๋ก ๋ชจ๋ธ์ด ํ•ด๋‹น ํ† ํฐ์„ ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์› ์Œ(๋‚ฎ์€ ํ™•๋ฅ ๋กœ ์˜ˆ์ธก)์„ ์˜๋ฏธํ•œ๋‹ค.

  • ๋ถ„์„ ๋Œ€์ƒ: 2,047 ํ† ํฐ (50 batches, stride=2,048)
  • ์ธก์ • ๋ฐฉ์‹: ๊ฐ ํ† ํฐ์— ๋Œ€ํ•ด โˆ’log P(token | context) ๊ณ„์‚ฐ

1. NLL ๋ถ„ํฌ ํžˆ์Šคํ† ๊ทธ๋žจ

NLL ๋ฒ”์œ„ ํ† ํฐ ์ˆ˜ ๋น„์œจ
< 1 840 41.04%
1 ~ 2 273 13.34%
2 ~ 3 200 9.77%
3 ~ 5 311 15.19%
5 ~ 10 342 16.71%
> 10 81 3.96%

๊ธฐ์ˆ  ํ†ต๊ณ„๋Ÿ‰

์ง€ํ‘œ ๊ฐ’
ํ‰๊ท  NLL (Mean) 2.7338
ํ‘œ์ค€ํŽธ์ฐจ (Std) 3.1106
์ค‘์•™๊ฐ’ (Median) 1.6328
๋ถ„์„ ํ† ํฐ ์ˆ˜ 2,047

2. ๋ถ„ํฌ ํ•ด์„ ๋ฐ ๋ถ„์„

2-1. ๋ถ„ํฌ์˜ ํ˜•ํƒœ: ์˜ค๋ฅธ์ชฝ ๊ผฌ๋ฆฌ ๋ถ„ํฌ (Right-Skewed Distribution)

์ค‘์•™๊ฐ’(1.63)์ด ํ‰๊ท (2.73)๋ณด๋‹ค ํ˜„์ €ํžˆ ๋‚ฎ๋‹ค. ์ด๋Š” ๋ถ„ํฌ๊ฐ€ ์˜ค๋ฅธ์ชฝ์œผ๋กœ ์น˜์šฐ์นœ ํ˜•ํƒœ(right-skewed)์ž„์„ ์˜๋ฏธํ•œ๋‹ค. ์ฆ‰, ๋Œ€๋ถ€๋ถ„์˜ ํ† ํฐ์€ ๋น„๊ต์  ์‰ฝ๊ฒŒ ์˜ˆ์ธก๋˜์ง€๋งŒ, ์†Œ์ˆ˜์˜ ๋งค์šฐ ์–ด๋ ค์šด ํ† ํฐ์ด ํ‰๊ท ์„ ํฌ๊ฒŒ ๋Œ์–ด์˜ฌ๋ฆฌ๋Š” ๊ตฌ์กฐ๋‹ค.

ํ‘œ์ค€ํŽธ์ฐจ(3.11)๊ฐ€ ํ‰๊ท (2.73)๋ณด๋‹ค ํฌ๋‹ค๋Š” ์‚ฌ์‹ค๋„ ๊ฐ™์€ ๋ฐฉํ–ฅ์„ ๊ฐ€๋ฆฌํ‚จ๋‹ค. ๋ถ„์‚ฐ์ด ํฌ๋‹ค๋Š” ๊ฒƒ์€ ๋ชจ๋ธ์ด "์ž˜ ์•„๋Š” ์˜์—ญ"๊ณผ "๊ฑฐ์˜ ๋ชจ๋ฅด๋Š” ์˜์—ญ" ์‚ฌ์ด์˜ ๊ฒฉ์ฐจ๊ฐ€ ํฌ๋‹ค๋Š” ๊ฒƒ์„ ๋œปํ•œ๋‹ค.

2-2. NLL < 1 ๊ตฌ๊ฐ„ (41.04%): ๋ชจ๋ธ์ด ํ™•์‹ ํ•˜๋Š” ํ† ํฐ

์ „์ฒด ํ† ํฐ์˜ ์•ฝ 41%๋Š” NLL์ด 1 ๋ฏธ๋งŒ์ด๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ์ด ํ† ํฐ๋“ค์„ ๋งค์šฐ ๋†’์€ ํ™•๋ฅ (P > e^{-1} โ‰ˆ 0.368, ์‹ค์ œ๋กœ๋Š” ๋” ๋†’์Œ)๋กœ ์˜ˆ์ธกํ–ˆ๋‹ค๋Š” ์˜๋ฏธ๋‹ค. ์ด ๊ตฌ๊ฐ„์— ์†ํ•˜๋Š” ํ† ํฐ๋“ค์€ ์ฃผ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค:

  • ์กฐ์‚ฌ: ์€/๋Š”/์ด/๊ฐ€/์„/๋ฅผ/์˜/์—/๋กœ ๋“ฑ ํ•œ๊ตญ์–ด ๋ฌธ๋ฒ• ์กฐ์‚ฌ
  • ์–ด๋ฏธ: ํ•œ๊ตญ์–ด ๋™์‚ฌ/ํ˜•์šฉ์‚ฌ ์–ด๋ฏธ (-๋‹ค, -๊ณ , -๋ฉฐ, -์–ด์„œ ๋“ฑ)
  • ๊ตฌ๋‘์ : ๋งˆ์นจํ‘œ, ์‰ผํ‘œ, ๊ด„ํ˜ธ ๋“ฑ
  • ๋นˆ๋ฒˆํ•œ ์ ‘์†์‚ฌ ๋ฐ ๋ถ€์‚ฌ: ๊ทธ๋ฆฌ๊ณ , ๋˜ํ•œ, ํ•˜์ง€๋งŒ ๋“ฑ
  • ํŒจํ„ด์ด ๋ช…ํ™•ํ•œ ์‹œํ€€์Šค: URL, ๋‚ ์งœ, ํฌ๋งทํ™”๋œ ํ…์ŠคํŠธ ๋‚ด ๋ฐ˜๋ณต ํŒจํ„ด

์ด ๊ฒฐ๊ณผ๋Š” ๋ชจ๋ธ์ด ํ•œ๊ตญ์–ด์˜ ํ˜•ํƒœ๋ก ์  ํŒจํ„ด๊ณผ ๋ฌธ๋ฒ• ๊ตฌ์กฐ๋ฅผ ์ƒ๋‹นํžˆ ์ž˜ ๋‚ด์žฌํ™”ํ–ˆ์Œ์„ ์‹œ์‚ฌํ•œ๋‹ค.

2-3. NLL > 5 ๊ตฌ๊ฐ„ (20.67%): ๋ชจ๋ธ์ด "์ถ”์ธก"ํ•˜๋Š” ํ† ํฐ

์ „์ฒด ํ† ํฐ์˜ ์•ฝ 20.67%(NLL 5~10 ๊ตฌ๊ฐ„ 16.71% + NLL > 10 ๊ตฌ๊ฐ„ 3.96%)๋Š” ๋ชจ๋ธ์ด ๋งค์šฐ ๋‚ฎ์€ ํ™•๋ฅ ๋กœ ์˜ˆ์ธกํ•œ ํ† ํฐ๋“ค์ด๋‹ค. ์ด ๊ตฌ๊ฐ„์˜ ํ† ํฐ๋“ค์€ ์ „ํ˜•์ ์œผ๋กœ:

  • ๊ณ ์œ ๋ช…์‚ฌ: ์ธ๋ช…, ์ง€๋ช…, ๊ธฐ์—…๋ช… ๋“ฑ โ€” ์•ž ๋ฌธ๋งฅ์œผ๋กœ๋ถ€ํ„ฐ ์˜ˆ์ธก์ด ์–ด๋ ค์›€
  • ์ˆซ์ž: ํŠน์ • ์ˆ˜์น˜๋Š” ๋ฌธ๋งฅ๋งŒ์œผ๋กœ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅ
  • ๋“œ๋ฌธ ๋‹จ์–ด: ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ํฌ์†Œํ•˜๊ฒŒ ๋“ฑ์žฅํ•˜๋Š” ์–ดํœ˜
  • ์™ธ๋ž˜์–ด/์˜๋ฌธ ํ† ํฐ: ํ•œ๊ตญ์–ด ๋ฌธ๋งฅ ์•ˆ์— ์‚ฝ์ž…๋œ ์™ธ๊ตญ์–ด ํ‘œํ˜„
  • ๋†’์€ ๋ฌธ๋งฅ ์˜์กด๋„ ํ† ํฐ: ํ•ด๋‹น ์œ„์น˜์˜ ์ •๋ณด๊ฐ€ ์ด์ „ ๋ฌธ๋งฅ์— ๊ฑฐ์˜ ๋‹ด๊ธฐ์ง€ ์•Š๋Š” ๊ฒฝ์šฐ (์˜ˆ: ํŠน์ • ๋น„์œ , ๋…์ฐฝ์  ํ‘œํ˜„)

2-4. ์ข…ํ•ฉ ํ‰๊ฐ€

34k steps ๊ธฐ์ค€์œผ๋กœ, ๋ชจ๋ธ์€ ์ „์ฒด ์–ดํœ˜ ๋ถ„ํฌ์˜ 40% ์ด์ƒ์„ ๋งค์šฐ ๋†’์€ ์ •ํ™•๋„๋กœ ์ฒ˜๋ฆฌํ•˜๊ณ  ์žˆ๋‹ค. ์ด๋Š” ๊ธฐ๋ณธ์ ์ธ ํ•œ๊ตญ์–ด ์–ธ์–ด ํŒจํ„ด ์Šต๋“์ด ์ด๋ฃจ์–ด์กŒ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค. ๋‹ค๋งŒ, ๋‚˜๋จธ์ง€ ์•ฝ 20%์˜ ์–ด๋ ค์šด ํ† ํฐ๋“ค์€ ์ถ”๊ฐ€ ํ•™์Šต์ด๋‚˜ ๋” ๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ๋ฅผ ํ†ตํ•ด ๊ฐœ์„  ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.


3. ๊ฐ€์žฅ ์–ด๋ ค์šด ํ† ํฐ (Highest NLL) Top-15

์ˆœ์œ„ ํ† ํฐ ํ‰๊ท  NLL ๊ด€์ฐฐ ํšŸ์ˆ˜
1 ๋ถ€๋“œ๋Ÿฝ๊ฒŒ 16.375 1
2 ๋ฆฌ๋”ฉ 15.188 1
3 ๋„˜์–ด๊ฐ€ 13.688 1
4 hon 13.625 1
5 ์ถœ๊ทผ 13.500 1
6 ์ฃ„ 13.062 1
7 ๋ชจํ„ฐ์Šค 12.812 1
8 ๋ธ 12.812 1
9 ๊ฐ‡ํžˆ 12.750 1
10 ๋งˆ๋ผ 12.688 1
11 Ana 12.604 3
12 240 12.438 1
13 ๋น„๊ต 12.438 1
14 ๋†’ 12.375 1
15 ๊ผผ๊ผผ 12.375 1

๋ถ„์„

ํ†ต๊ณ„์  ์œ ์˜์„ฑ ์ฃผ์˜: ๋Œ€๋ถ€๋ถ„์˜ ํ•ญ๋ชฉ์ด ๊ด€์ฐฐ ํšŸ์ˆ˜ 1ํšŒ๋‹ค. ๋‹จ์ผ ๊ด€์ฐฐ์—์„œ ๋‚˜์˜จ NLL ๊ฐ’์€ ํ•ด๋‹น ํ† ํฐ์ด ํŠน์ • ๋ฌธ๋งฅ์—์„œ ์–ผ๋งˆ๋‚˜ ์–ด๋ ค์› ๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค„ ๋ฟ, ํ•ด๋‹น ํ† ํฐ ์ „๋ฐ˜์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™”๋Š” ์–ด๋ ต๋‹ค. Ana (3ํšŒ)๊ฐ€ ๊ทธ๋‚˜๋งˆ ๋ฐ˜๋ณต ๊ด€์ฐฐ๋œ ์ผ€์ด์Šค๋‹ค.

ํŒจํ„ด๋ณ„ ๋ถ„๋ฅ˜

ํŒจํ„ด ์œ ํ˜• ํ•ด๋‹น ํ† ํฐ ์–ด๋ ค์šด ์ด์œ 
๋ณตํ•ฉ ์–ด๊ทผ / ํ™œ์šฉํ˜• ๋ถ€๋“œ๋Ÿฝ๊ฒŒ, ๋„˜์–ด๊ฐ€, ๊ฐ‡ํžˆ, ๋†’, ๊ผผ๊ผผ ํ™œ์šฉ ์ „ํ›„ ๋งฅ๋ฝ์ด ๋‹ค์–‘ํ•˜์—ฌ ํŠน์ • ํ˜•ํƒœ ์˜ˆ์ธก์ด ์–ด๋ ค์›€
์˜๋ฌธ ํ† ํฐ hon, Ana ํ•œ๊ตญ์–ด ๋ฌธ๋งฅ ๋‚ด ์˜์–ด ์‚ฝ์ž… โ€” ํ† ํฌ๋‚˜์ด์ € ์ฒ˜๋ฆฌ ๋ฐฉ์‹์— ๋”ฐ๋ผ ๋ถ„๋ฆฌ๋  ์ˆ˜ ์žˆ์Œ
์ˆซ์ž 240 ์ž„์˜์˜ ์ˆ˜์น˜๋Š” ๋ฌธ๋งฅ์œผ๋กœ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅ
์™ธ๋ž˜์–ด (์Œ์ฐจ) ๋ฆฌ๋”ฉ, ๋ชจํ„ฐ์Šค, ๋ธ ์˜์–ด ๋‹จ์–ด์˜ ํ•œ๊ตญ์–ด ์Œ์ฐจ๋Š” ์›์–ด์˜ ๋ฐœ์Œ ๋ณ€ํ™˜ ๊ทœ์น™์ด ๋ถˆ๊ทœ์น™ํ•˜์—ฌ ์˜ˆ์ธก์ด ์–ด๋ ค์›€
์ผ๋ฐ˜ ์–ดํœ˜ (๋ฌธ๋งฅ ์˜์กด) ์ถœ๊ทผ, ์ฃ„, ๋งˆ๋ผ, ๋น„๊ต ์ด ๋‹จ์–ด๋“ค์ด ๋‚˜์˜ค๊ธฐ ์ „ ๋ฌธ๋งฅ์ด ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ์ถฉ๋ถ„ํžˆ ์ œํ•œํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ

๋ชจ๋ธ์ด ์˜๋ฌธ ํ† ํฐ๊ณผ ์™ธ๋ž˜์–ด์—์„œ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๊ฒƒ์€, ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ๋กœ ํ•œ๊ตญ์–ด๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์–ด ์ด์ค‘ ์–ธ์–ด ์ „ํ™˜(code-switching) ์ƒํ™ฉ์— ๋Œ€ํ•œ ๋…ธ์ถœ์ด ์ œํ•œ์ ์ด์—ˆ๊ธฐ ๋•Œ๋ฌธ์œผ๋กœ ์ถ”์ •๋œ๋‹ค.


4. ๊ฐ€์žฅ ์‰ฌ์šด ํ† ํฐ (Lowest NLL) Top-11

์ˆœ์œ„ ํ† ํฐ ํ‰๊ท  NLL ๊ด€์ฐฐ ํšŸ์ˆ˜
1 ๋ธ”๋Ÿฌ 0.000 2
2 ํฅ 0.000 1
3 ๊ท€ 0.000 1
4 ใ€• 0.000 2
5 ๋‚˜ 0.000 1
6 27 0.000 2
7 ํ†ก 0.000 2
8 ์ƒ 0.000 1
9 com 0.000 1
10 ์‹œ์•„ 0.000 2
11 ์žฅ 0.000 37

๋ถ„์„

NLL = 0.000์€ ๋ชจ๋ธ์ด ํ•ด๋‹น ํ† ํฐ์„ (์ˆ˜์น˜์ ์œผ๋กœ) ๊ฑฐ์˜ 100% ํ™•๋ฅ ๋กœ ์˜ˆ์ธกํ–ˆ์Œ์„ ์˜๋ฏธํ•œ๋‹ค. ์ด ๊ฐ’์€ ๋ถ€๋™์†Œ์ˆ˜์  ๋ฐ˜์˜ฌ๋ฆผ ๊ฒฐ๊ณผ์ผ ์ˆ˜ ์žˆ์œผ๋‚˜, ์‚ฌ์‹ค์ƒ ํ™•๋ฅ ์ด 1์— ๋งค์šฐ ๊ทผ์ ‘ํ•œ ๊ฒฝ์šฐ์—๋งŒ ์ด๋ ‡๊ฒŒ ๋‚˜ํƒ€๋‚œ๋‹ค.

์žฅ (37ํšŒ): ๊ฐ€์žฅ ์ฃผ๋ชฉํ•  ๊ฒฐ๊ณผ

์žฅ์€ 37ํšŒ๋ผ๋Š” ์••๋„์ ์ธ ๊ด€์ฐฐ ํšŸ์ˆ˜๋ฅผ ๊ธฐ๋กํ•˜๋ฉด์„œ๋„ NLL = 0.000์„ ์œ ์ง€ํ–ˆ๋‹ค. ํ•œ๊ตญ์–ด์—์„œ ์žฅ์€ ๋งค์šฐ ๋‹ค์–‘ํ•œ ๋‹จ์–ด์˜ ๊ตฌ์„ฑ ์Œ์ ˆ์ด๋‹ค (์‹œ์žฅ, ๊ณต์žฅ, ์žฅ๊ด€, ์žฅ์†Œ, ๊ฒฝ์ฐฐ์„œ์žฅ, ๋„์„œ๊ด€์žฅ ๋“ฑ). ์ด ํ† ํฐ์ด ์•ž์— ์˜ค๋Š” ํŒจํ„ด์ด ๋งค์šฐ ๊ทœ์น™์ ์ด์–ด์„œ, ๋ชจ๋ธ์ด ์ด์ „ ๋ฌธ๋งฅ์—์„œ ์žฅ์ด ์˜ฌ ๊ฒƒ์„ ์‚ฌ์‹ค์ƒ ํ™•์‹ ํ–ˆ๋‹ค๋Š” ์˜๋ฏธ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ํ•œ๊ตญ์–ด ์–ดํœ˜ ๊ฒฐํ•ฉ ํŒจํ„ด์„ ๊นŠ์ด ํ•™์Šตํ–ˆ์Œ์„ ๊ฐ•ํ•˜๊ฒŒ ์‹œ์‚ฌํ•œ๋‹ค.

ํŒจํ„ด๋ณ„ ๋ถ„๋ฅ˜

ํŒจํ„ด ์œ ํ˜• ํ•ด๋‹น ํ† ํฐ ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ์ด์œ 
๋งค์šฐ ํ”ํ•œ ์Œ์ ˆ ์žฅ, ๋‚˜, ์ƒ ์„ ํ–‰ ์Œ์ ˆ์ด ๋’ค๋”ฐ๋ฅผ ์Œ์ ˆ์„ ๊ฐ•ํ•˜๊ฒŒ ์ œํ•œ
ํŠน์ˆ˜ ๊ธฐํ˜ธ / ๊ด„ํ˜ธ ใ€• ๊ด„ํ˜ธ ์Œ์€ ์—ด๋ฆฌ๋ฉด ๋‹ซํžˆ๋Š” ํŒจํ„ด์ด ๊ฑฐ์˜ ํ™•์‹ค
URL ํŒจํ„ด com URL ๋„๋ฉ”์ธ ๋‚ด์—์„œ .com์€ ๊ณ ์ • ํŒจํ„ด
์ˆซ์ž ํŒจํ„ด 27 ํŠน์ • ๋‚ ์งœ/๋ฒˆํ˜ธ ํฌ๋งท ๋‚ด์—์„œ ์—ฐ์†์ ์œผ๋กœ ๋“ฑ์žฅ
ํŠน์ • ๋ฌธ๋งฅ์˜ ์Œ์ ˆ ๋ธ”๋Ÿฌ, ์‹œ์•„, ํ†ก ๊ณ ์œ ๋ช…์‚ฌ๋‚˜ ํŠน์ • ํ‘œํ˜„ ๋‚ด์—์„œ ์•ž ํ† ํฐ์ด ๋’ค๋ฅผ ๊ฒฐ์ •

์ด ๊ฒฐ๊ณผ๋Š” ๋ชจ๋ธ์ด ํ•œ๊ตญ์–ด ํ˜•ํƒœ์†Œ ๊ฒฐํ•ฉ ํŒจํ„ด, ์ˆซ์ž/๊ธฐํ˜ธ ํŒจํ„ด, URL ๊ตฌ์กฐ ๋“ฑ์„ ์ž˜ ๋‚ด์žฌํ™”ํ–ˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.


Part B โ€” ์˜จ๋„๋ณ„ ์ƒ์„ฑ ๋น„๊ต (Greedy vs Sampling)

๊ฐœ์š”

์ƒ์„ฑ ์˜จ๋„(temperature)๋Š” ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜์—์„œ ๋กœ์ง“(logit)์„ ๋‚˜๋ˆ„๋Š” ์Šค์นผ๋ผ ๊ฐ’์ด๋‹ค. ์˜จ๋„๊ฐ€ ๋‚ฎ์„์ˆ˜๋ก ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ๋‚ ์นด๋กœ์›Œ์ ธ ๋ชจ๋ธ์ด ๊ฐ€์žฅ ํ™•๋ฅ  ๋†’์€ ํ† ํฐ์„ ์„ ํƒํ•˜๋Š” ๊ฒฝํ–ฅ์ด ๊ฐ•ํ•ด์ง€๊ณ , ์˜จ๋„๊ฐ€ ๋†’์„์ˆ˜๋ก ๋ถ„ํฌ๊ฐ€ ํ‰ํƒ„ํ•ด์ ธ ๋‹ค์–‘ํ•œ ํ† ํฐ์ด ์„ ํƒ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง„๋‹ค.

Pโ€ฒ(xi)=expโก(zi/T)โˆ‘jexpโก(zj/T)P'(x_i) = \frac{\exp(z_i / T)}{\sum_j \exp(z_j / T)}

์—ฌ๊ธฐ์„œ $T$๋Š” ์˜จ๋„์ด๊ณ , $z_i$๋Š” ํ† ํฐ $i$์— ๋Œ€ํ•œ ๋กœ์ง“์ด๋‹ค.

  • T = 0 (Greedy): ํ•ญ์ƒ ๊ฐ€์žฅ ํ™•๋ฅ  ๋†’์€ ํ† ํฐ ์„ ํƒ โ†’ ๊ฒฐ์ •๋ก ์ 
  • T = 0.3: ๋‚ฎ์€ ๋‹ค์–‘์„ฑ, ๋†’์€ ์ •ํ™•๋„
  • T = 0.8: ์ค‘๊ฐ„ ๋‹ค์–‘์„ฑ, ์˜๋ฏธ ์—ฐ๊ด€์„ฑ ์œ ์ง€
  • T = 1.2: ๋†’์€ ๋‹ค์–‘์„ฑ, ์ •ํ™•๋„ ํ•˜๋ฝ

1. ํ”„๋กฌํ”„ํŠธ: "ํ•œ๊ตญ์˜ ์ˆ˜๋„๋Š”"

์˜จ๋„ ์„ค์ • ์ƒ์„ฑ ๊ฒฐ๊ณผ ์š”์•ฝ
Greedy (T=0) "์„œ์šธ์ด๋‹ค. ์„œ์šธ์€ ์—ญ์‚ฌ์ ์œผ๋กœ..." โ†’ ํ•œ์–‘ ๋ฐ˜๋ณต ํ‡ดํ™”
Low (T=0.3) "์„œ์šธ์ด๋‹ค. ์ˆ˜๋„๊ฐ€ ์„œ์šธ์ธ ์ด์œ ๋Š”..." โ†’ ํ–‰์ •๊ตฌ์—ญ ์„ค๋ช…, ๋ฐ˜๋ณต ์ง„์ž…
Normal (T=0.8) "์„œ์šธ, ์ธ์ฒœ, ๊ฒฝ๊ธฐ, ๊ฐ•์›..." โ†’ ๋„ ๋‚˜์—ด (์ˆ˜๋„์™€ ๊ด€๋ จ ์—†๋Š” ๋ฐฉํ–ฅ)
High (T=1.2) "์•„ํ…Œ๋„ค์˜€์ž–์•„์š”" โ†’ ์™„์ „ํžˆ ์—‰๋šฑํ•œ ๋ฐฉํ–ฅ (hallucination ๊ทน๋Œ€ํ™”)

์„ธ๋ถ€ ๋ถ„์„

Greedy (T=0): ์ดˆ๋ฐ˜์—๋Š” ์‚ฌ์‹ค์— ๋งž๋Š” "์„œ์šธ์ด๋‹ค"๋ฅผ ์ƒ์„ฑํ•˜์ง€๋งŒ, ์ดํ›„ ์—ญ์‚ฌ์  ์„œ์ˆ ๋กœ ์ „ํ™˜ํ•˜๋ฉด์„œ "ํ•œ์–‘" ๋ฐ˜๋ณต์ด ๋‚˜ํƒ€๋‚œ๋‹ค. ์ด๋Š” Greedy ๋””์ฝ”๋”ฉ์˜ ์ „ํ˜•์ ์ธ ํ‡ดํ™”(degeneration) ํ˜„์ƒ์ด๋‹ค โ€” ๋ชจ๋ธ์ด ํ•œ ๋ฒˆ ํŠน์ • ํŒจํ„ด์— ์ง„์ž…ํ•˜๋ฉด ๋น ์ ธ๋‚˜์˜ค๊ธฐ ์–ด๋ ต๋‹ค.

Low (T=0.3): Greedy๋ณด๋‹ค ์•ฝ๊ฐ„ ๋‚˜์€ ๋‹ค์–‘์„ฑ์„ ๋ณด์ด์ง€๋งŒ, ์—ฌ์ „ํžˆ ๋ฐ˜๋ณต ์ง„์ž…์ด ๋ฐœ์ƒํ•œ๋‹ค. "์ˆ˜๋„๊ฐ€ ์„œ์šธ์ธ ์ด์œ "๋ฅผ ์„ค๋ช…ํ•˜๋ ค๋Š” ์‹œ๋„ ์ž์ฒด๋Š” ์˜๋ฏธ ์žˆ์œผ๋‚˜, ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ํ–‰์ •๊ตฌ์—ญ ์„ค๋ช… ํŒจํ„ด์„ ๊ทธ๋Œ€๋กœ ์žฌํ˜„ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ๋‹ค.

Normal (T=0.8): ๋‹ค์–‘์„ฑ์€ ๋†’์•„์ง€์ง€๋งŒ ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง„๋‹ค. "์ˆ˜๋„" ํ”„๋กฌํ”„ํŠธ์—์„œ ๋„(้“) ๋‚˜์—ด๋กœ ์ด์–ด์ง€๋Š” ๊ฒƒ์€ ์˜๋ฏธ์  ์—ฐ๊ด€์„ฑ์€ ์žˆ์œผ๋‚˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ง์ ‘์ ์ธ ๋‹ต๋ณ€์—์„œ ๋ฒ—์–ด๋‚œ๋‹ค.

High (T=1.2): "์•„ํ…Œ๋„ค์˜€์ž–์•„์š”"๋ผ๋Š” ์™„์ „ํžˆ ์ž˜๋ชป๋œ hallucination์ด ๋ฐœ์ƒํ•œ๋‹ค. ์˜จ๋„๊ฐ€ ๋†’์„์ˆ˜๋ก ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ํ‰ํƒ„ํ•ด์ง€๋ฏ€๋กœ, ๋‚ฎ์€ ํ™•๋ฅ ์˜ ํ† ํฐ๋„ ์„ ํƒ๋  ๊ฐ€๋Šฅ์„ฑ์ด ํฌ๊ฒŒ ๋†’์•„์ง„๋‹ค.

๊ฒฐ๋ก : ์ด ์œ ํ˜•์˜ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ Q&A์—์„œ๋Š” T=0.3~0.6 ๋ฒ”์œ„๊ฐ€ ๊ฐ€์žฅ ์ ์ ˆํ•˜๋‹ค. T=0์˜ ๋ฐ˜๋ณต ํ‡ดํ™”๋ฅผ ํ”ผํ•˜๋ฉด์„œ๋„, T=0.8 ์ด์ƒ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์˜๋ฏธ ์ผํƒˆ์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค.


2. ํ”„๋กฌํ”„ํŠธ: "์ธ๊ณต์ง€๋Šฅ์ด๋ž€"

์˜จ๋„ ์„ค์ • ์ƒ์„ฑ ๊ฒฐ๊ณผ ์š”์•ฝ
Greedy (T=0) "๋ฌด์—‡์ธ๊ฐ€?[4] 321 2018.10.1..." โ†’ ๊ฒŒ์‹œํŒ ํฌ๋งท, ์˜๋ฏธ ์—†์Œ
Low (T=0.3) "๋ฌด์—‡์ธ๊ฐ€? ๋””์ง€ํ„ธ ์‹œ๋Œ€..." โ†’ ๋ฐ˜๋ณต์  ๋ชฉ์ฐจ
Normal (T=0.8) "? - 1[2015.12.15] ์ธํ„ฐ๋„ท์ด..." โ†’ ๊ฒŒ์‹œํŒ/๋‚ ์งœ ํฌ๋งท
High (T=1.2) "๋ฌด์—‡์ธ๊ฐ€? TAG ๊ต์œก..." โ†’ ๋ธ”๋กœ๊ทธ ํƒœ๊ทธ ํฌ๋งท

์„ธ๋ถ€ ๋ถ„์„

์ด ํ”„๋กฌํ”„ํŠธ์—์„œ๋Š” ๋ชจ๋“  ์˜จ๋„์—์„œ ์˜๋ฏธ ์žˆ๋Š” "์ธ๊ณต์ง€๋Šฅ ์„ค๋ช…"์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์‹คํŒจํ–ˆ๋‹ค. ๊ณตํ†ต์ ์œผ๋กœ ๊ด€์ฐฐ๋˜๋Š” ํŒจํ„ด์€:

  • ๊ฒŒ์‹œํŒ/๋ธ”๋กœ๊ทธ ํฌ๋งท ์žฌํ˜„ (๋‚ ์งœ, ๋ฒˆํ˜ธ, ํƒœ๊ทธ)
  • ๋ชฉ์ฐจ ๊ตฌ์กฐ ๋ฐ˜๋ณต
  • ์ •์ž‘ ์ธ๊ณต์ง€๋Šฅ์— ๋Œ€ํ•œ ์‹ค์งˆ์  ์„ค๋ช…์€ ๋ถ€์žฌ

์‹คํŒจ ์›์ธ ๋ถ„์„: ํ•™์Šต ๋ฐ์ดํ„ฐ(์›น ํฌ๋กค๋ง ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”์ •)์—์„œ "์ธ๊ณต์ง€๋Šฅ์ด๋ž€"์ด๋ผ๋Š” ํ‘œํ˜„์ด ์ฃผ๋กœ ๊ฒŒ์‹œํŒ ์ œ๋ชฉ, ๋ธ”๋กœ๊ทธ ํฌ์ŠคํŠธ ๋„์ž…๋ถ€, ์˜จ๋ผ์ธ ๊ฐ•์˜ ๋ชฉ์ฐจ ๋“ฑ์˜ ํฌ๋งท์œผ๋กœ ๋“ฑ์žฅํ–ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค. ๋ชจ๋ธ์€ ํ•ด๋‹น ํ”„๋กฌํ”„ํŠธ ์ดํ›„ ๋‚˜์˜ฌ ๋‚ด์šฉ์„ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ์— ๋”ฐ๋ผ ์˜ˆ์ธกํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๊ฒŒ์‹œํŒ ํฌ๋งท ํ† ํฐ๋“ค์ด ๋†’์€ ํ™•๋ฅ ๋กœ ์„ ํƒ๋œ ๊ฒƒ์ด๋‹ค.

๊ฐœ์„  ๋ฐฉํ–ฅ: ์ด ๋ฌธ์ œ๋Š” ๋‹จ์ˆœํžˆ ์˜จ๋„๋ฅผ ์กฐ์ •ํ•œ๋‹ค๊ณ  ํ•ด๊ฒฐ๋˜์ง€ ์•Š๋Š”๋‹ค. ๋‹ค์Œ ๋ฐฉ๋ฒ•๋“ค์ด ํ•„์š”ํ•˜๋‹ค:

  1. ์ง€์‹œ-ํŠœ๋‹(Instruction Tuning): "์ธ๊ณต์ง€๋Šฅ์ด๋ž€ ๋ฌด์—‡์ธ์ง€ ์„ค๋ช…ํ•˜๋ผ"๋Š” ์‹์˜ ๋ช…๋ นํ˜• ๋ฐ์ดํ„ฐ๋กœ ํŒŒ์ธํŠœ๋‹
  2. ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฐœ์„ : ๊ฒŒ์‹œํŒ/๋ธ”๋กœ๊ทธ ๋…ธ์ด์ฆˆ๋ฅผ ์ œ๊ฑฐํ•œ ๊ณ ํ’ˆ์งˆ ์„ค๋ช…๋ฌธ ๋ฐ์ดํ„ฐ ์ถ”๊ฐ€
  3. ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ ํ™œ์šฉ: "๋‹น์‹ ์€ ๊ต์œก์šฉ AI ์–ด์‹œ์Šคํ„ดํŠธ์ž…๋‹ˆ๋‹ค"์™€ ๊ฐ™์€ ์—ญํ•  ๋ถ€์—ฌ

3. ํ”„๋กฌํ”„ํŠธ: "๋ด„์ด ์˜ค๋ฉด ๊ฝƒ์ด ํ”ผ๊ณ "

์˜จ๋„ ์„ค์ • ์ƒ์„ฑ ๊ฒฐ๊ณผ ์š”์•ฝ
Greedy (T=0) "๊ฝƒ์ด ์ง€๋ฉด ์—ด๋งค๊ฐ€ ์—ด๋ฆฐ๋‹ค" ๋ฐ˜๋ณต
Low (T=0.3) "๊ฝƒ์ด ์ง€๋Š” ๊ณ„์ ˆ์—๋Š”..." ๋ฐ˜๋ณต
Normal (T=0.8) "๊ทธ๋Œ€๊ฐ€ ์˜ค๋ฉด ๊ฝƒ์ด ํ”ผ๊ณ ..." ์‹œ์  ๋ฐ˜๋ณต
High (T=1.2) "๊ฝƒ๋งˆ๋‹ค ํ–ฅ๊ธฐ๋กญ๋‹ค...", "๋‚œ์ƒ ์ฒ˜์Œ์œผ๋กœ ์ด ๋ด„, ๋‚ด ๋งˆ์Œ์„ ํ™• ์—ด์–ด ์ฃผ๋Š”..." ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฌ์šด ์„œ์ˆ 

์„ธ๋ถ€ ๋ถ„์„

์ด ํ”„๋กฌํ”„ํŠธ์—์„œ๋Š” ์˜จ๋„๊ฐ€ ๋†’์„์ˆ˜๋ก ์˜คํžˆ๋ ค ๋” ๋‚˜์€ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜ํƒ€๋‚˜๋Š” ์—ญ์„ค์  ํ˜„์ƒ์ด ๊ด€์ฐฐ๋œ๋‹ค.

Greedy (T=0): "๊ฝƒ์ด ์ง€๋ฉด ์—ด๋งค๊ฐ€ ์—ด๋ฆฐ๋‹ค"๋ผ๋Š” ๋‹จ์ˆœํ•œ ์ž์—ฐ ์‚ฌ์ดํด ๋ฌ˜์‚ฌ๊ฐ€ ๋ฐ˜๋ณต๋œ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ์—์„œ ์ด ์กฐํ•ฉ์ด ๊ฐ€์žฅ ํ”ํ•˜๊ฒŒ ๋“ฑ์žฅํ•˜๋Š” ํŒจํ„ด์ด์—ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค. ๋ฌธํ•™์  ํ‘œํ˜„์œผ๋กœ์„œ๋Š” ๋งค์šฐ ๋นˆ์•ฝํ•˜๋‹ค.

Low (T=0.3): ๋น„์Šทํ•œ ๋ฐ˜๋ณต ํŒจํ„ด์ด ๋‚˜ํƒ€๋‚˜์ง€๋งŒ, ๊ณ„์ ˆ์˜ ์ „ํ™˜์— ๋Œ€ํ•œ ์„œ์ˆ ์ด ์•ฝ๊ฐ„ ๋“ฑ์žฅํ•œ๋‹ค.

Normal (T=0.8): "๊ทธ๋Œ€๊ฐ€ ์˜ค๋ฉด"์ด๋ผ๋Š” ์€์œ ์  ํ‘œํ˜„์ด ๋‚˜ํƒ€๋‚˜๊ธฐ ์‹œ์ž‘ํ•œ๋‹ค. ์‹œ์  ์š”์†Œ๊ฐ€ ์ฆ๊ฐ€ํ•˜์ง€๋งŒ ์—ฌ์ „ํžˆ ํŠน์ • ํŒจํ„ด์„ ๋ฐ˜๋ณตํ•œ๋‹ค.

High (T=1.2): "๊ฝƒ๋งˆ๋‹ค ํ–ฅ๊ธฐ๋กญ๋‹ค"์™€ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ๊ฐ๊ฐ ํ‘œํ˜„์ด ๋“ฑ์žฅํ•˜๊ณ , "๋‚œ์ƒ ์ฒ˜์Œ์œผ๋กœ ์ด ๋ด„, ๋‚ด ๋งˆ์Œ์„ ํ™• ์—ด์–ด ์ฃผ๋Š”..."๊ณผ ๊ฐ™์€ ์ฐฝ์˜์ ์ด๊ณ  ์ž์—ฐ์Šค๋Ÿฌ์šด ๋ฌธ์žฅ์ด ์ƒ์„ฑ๋œ๋‹ค. ์‹œ์  ํ”„๋กฌํ”„ํŠธ์˜ ํŠน์„ฑ์ƒ, ๋‹ค์–‘ํ•œ ํ‘œํ˜„์ด ๋ชจ๋‘ ํ—ˆ์šฉ๋˜๋Š” ๊ฐœ๋ฐฉ์  ๋งฅ๋ฝ์ด๋ฏ€๋กœ ๋†’์€ ์˜จ๋„๊ฐ€ ์˜คํžˆ๋ ค ์œ ๋ฆฌํ•˜๊ฒŒ ์ž‘์šฉํ–ˆ๋‹ค.

ํ•ต์‹ฌ ์ธ์‚ฌ์ดํŠธ: ์˜จ๋„์˜ ์ตœ์ ๊ฐ’์€ ํƒœ์Šคํฌ์˜ ์„ฑ๊ฒฉ์— ๋”ฐ๋ผ ํฌ๊ฒŒ ๋‹ฌ๋ผ์ง„๋‹ค.

  • ์ •๋‹ต์ด ํ•˜๋‚˜์ธ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ํƒœ์Šคํฌ โ†’ ๋‚ฎ์€ ์˜จ๋„ ์œ ๋ฆฌ
  • ๋‹ค์–‘ํ•œ ํ‘œํ˜„์ด ๋ชจ๋‘ ํ—ˆ์šฉ๋˜๋Š” ์ฐฝ์ž‘ ํƒœ์Šคํฌ โ†’ ๋†’์€ ์˜จ๋„ ์œ ๋ฆฌ

4. ์ข…ํ•ฉ: ์ตœ์  Temperature ๊ฐ€์ด๋“œ

์‚ฌ์šฉ ๋ชฉ์  ๊ถŒ์žฅ Temperature ์ด์œ 
์‚ฌ์‹ค ๊ธฐ๋ฐ˜ Q&A 0.0 ~ 0.3 ์ •ํ™•๋„ ์ตœ์šฐ์„ ; Greedy์˜ ๋ฐ˜๋ณต ํ‡ดํ™”๋Š” ๋ฐ˜๋ณต ํŽ˜๋„ํ‹ฐ๋กœ ๋ณด์™„ ๊ฐ€๋Šฅ
์ผ๋ฐ˜ ํ…์ŠคํŠธ ์ƒ์„ฑ 0.6 ~ 0.8 ๋‹ค์–‘์„ฑ + ์˜๋ฏธ ์—ฐ๊ด€์„ฑ์˜ ๊ท ํ˜• ์œ ์ง€
์ฐฝ์ž‘ / ์‹œ / ์†Œ์„ค 0.8 ~ 1.2 ์ฐฝ์˜์„ฑ ๊ทน๋Œ€ํ™”; ๋‹ค์–‘ํ•œ ํ‘œํ˜„์ด ํ—ˆ์šฉ๋˜๋Š” ๊ฐœ๋ฐฉ์  ๋งฅ๋ฝ
์ฝ”๋“œ ์ƒ์„ฑ 0.0 ~ 0.2 ๊ตฌ์กฐ์  ์ •ํ™•๋„ ํ•„์ˆ˜; ๋ฌธ๋ฒ• ์˜ค๋ฅ˜ ์—†๋Š” ์ฝ”๋“œ ์„ ํ˜ธ
์š”์•ฝ / ๋ฒˆ์—ญ 0.3 ~ 0.5 ์›๋ฌธ ์˜๋ฏธ ๋ณด์กด + ์ž์—ฐ์Šค๋Ÿฌ์šด ํ‘œํ˜„ ์‚ฌ์ด ๊ท ํ˜•

์ถ”๊ฐ€ ๊ถŒ์žฅ์‚ฌํ•ญ

๋‹จ์ˆœํžˆ ์˜จ๋„๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ ์™ธ์—๋„ ๋‹ค์Œ ๊ธฐ๋ฒ•์„ ๋ณ‘์šฉํ•˜๋ฉด ํ’ˆ์งˆ์ด ํ–ฅ์ƒ๋œ๋‹ค:

  • ๋ฐ˜๋ณต ํŒจ๋„ํ‹ฐ (Repetition Penalty): repetition_penalty=1.1~1.3 โ€” Greedy ๋””์ฝ”๋”ฉ์—์„œ ๋ฐ˜๋ณต ํ‡ดํ™” ๋ฐฉ์ง€์— ํšจ๊ณผ์ 
  • Top-p (Nucleus Sampling): top_p=0.9~0.95 โ€” ์˜จ๋„์™€ ํ•จ๊ป˜ ์‚ฌ์šฉ ์‹œ ํ™•๋ฅ  ๋‚ฎ์€ ํ† ํฐ ์„ ํƒ ์–ต์ œ
  • Top-k Sampling: top_k=50 โ€” ์ƒ์œ„ k๊ฐœ ํ† ํฐ๋งŒ ๊ณ ๋ คํ•˜์—ฌ ๋ถˆํ•„์š”ํ•œ hallucination ์–ต์ œ

์ข…ํ•ฉ ๊ฒฐ๋ก 

๋ชจ๋ธ ํ˜„ํ™ฉ ํ‰๊ฐ€

ํ‰๊ฐ€ ํ•ญ๋ชฉ ๊ฒฐ๊ณผ ํ•ด์„
NLL ํ‰๊ท  2.73 Perplexity โ‰ˆ e^2.73 โ‰ˆ 15.3; 34k steps ๊ธฐ์ค€์œผ๋กœ ์–‘ํ˜ธํ•œ ์ˆ˜์ค€
์ € NLL ํ† ํฐ ๋น„์œจ 41% (NLL < 1) ํ•œ๊ตญ์–ด ๊ธฐ๋ณธ ๋ฌธ๋ฒ•/์–ดํœ˜ ํŒจํ„ด ์Šต๋“ ์™„๋ฃŒ
๊ณ  NLL ํ† ํฐ ๋น„์œจ 21% (NLL > 5) ๊ณ ์œ ๋ช…์‚ฌ, ์ˆซ์ž, ์™ธ๋ž˜์–ด ๋“ฑ ์–ด๋ ค์šด ํ† ํฐ์—์„œ ๊ฐœ์„  ์—ฌ์ง€
๋ฐ˜๋ณต ํ‡ดํ™” ๋ชจ๋“  ๋‚ฎ์€ ์˜จ๋„์—์„œ ๊ด€์ฐฐ ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋Š” ์ •์ƒ; RLHF/์ง€์‹œ ํŠœ๋‹์œผ๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ
์ฐฝ์ž‘ ๋Šฅ๋ ฅ T=1.2์—์„œ ์œ ์˜๋ฏธํ•œ ์ถœ๋ ฅ ๊ธฐ์ดˆ์ ์ธ ํ•œ๊ตญ์–ด ์ฐฝ์ž‘ ๋Šฅ๋ ฅ ์กด์žฌ

๋‹ค์Œ ๋‹จ๊ณ„ ์ œ์–ธ

  1. ๋ฐ˜๋ณต ํ‡ดํ™” ๋ถ„์„: Top-30 ์–ด๋ ค์šด ํ† ํฐ๋“ค์ด ์‹ค์ œ๋กœ ์–ด๋–ค ๋ฌธ๋งฅ์—์„œ ๋“ฑ์žฅํ•˜๋Š”์ง€ ์ˆ˜์ง‘ํ•˜์—ฌ, ํ•ด๋‹น ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ ๋ณด๊ฐ• ์—ฌ๋ถ€ ๊ฒฐ์ •
  2. ์˜จ๋„๋ณ„ ์ž๋™ ํ‰๊ฐ€ ์ง€ํ‘œ ๋„์ž…: BLEU, BERTScore, ๋ฐ˜๋ณต๋ฅ (n-gram repetition rate) ๋“ฑ ์ •๋Ÿ‰ ์ง€ํ‘œ์™€ ํ•จ๊ป˜ ์˜จ๋„ ์ตœ์ ํ™” ์ž๋™ํ™”
  3. ์ง€์‹œ ํŠœ๋‹ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ: "์ธ๊ณต์ง€๋Šฅ์ด๋ž€" ํ”„๋กฌํ”„ํŠธ ์‹คํŒจ ์‚ฌ๋ก€๋ฅผ ์ฐธ๊ณ ํ•˜์—ฌ, ์„ค๋ช…๋ฌธ ํ˜•์‹์˜ instruction-following ๋ฐ์ดํ„ฐ ์šฐ์„  ์ˆ˜์ง‘
  4. ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง: ํ˜„์žฌ ๋ฒ ์ด์Šค ๋ชจ๋ธ ์ˆ˜์ค€์—์„œ๋Š” ํ”„๋กฌํ”„ํŠธ ๋์— "์„ค๋ช…:" ๋˜๋Š” "๋‹ต:" ๋“ฑ์˜ ์œ ๋„ ๋ฌธ๊ตฌ ์ถ”๊ฐ€๋กœ ์ถœ๋ ฅ ํ˜•์‹ ์ œ์–ด ๊ฐ€๋Šฅ

๋ณธ ๋ฆฌํฌํŠธ๋Š” korean_1b_fp8_run1 ์ฒดํฌํฌ์ธํŠธ ๊ธฐ์ค€์ด๋ฉฐ, ์ดํ›„ ์ถ”๊ฐ€ ํ•™์Šต ๋˜๋Š” ํŒŒ์ธํŠœ๋‹ ํ›„ ๋™์ผ ๋ถ„์„์„ ์žฌ์‹ค์‹œํ•˜์—ฌ ๊ฐœ์„  ์—ฌ๋ถ€๋ฅผ ์ถ”์ ํ•  ๊ฒƒ์„ ๊ถŒ์žฅํ•œ๋‹ค.