Charm2Hwang commited on
Commit
bb37fbb
ยท
verified ยท
1 Parent(s): be9ed13

Update KOREAN_README.md

Browse files
Files changed (1) hide show
  1. KOREAN_README.md +6 -5
KOREAN_README.md CHANGED
@@ -3,9 +3,10 @@
3
  # โ‚ฉON: ํ•œ๊ตญ ๊ธˆ์œต์„ ์œ„ํ•œ LLM
4
 
5
  ## ์†Œ๊ฐœ
6
- โ‚ฉON์€ ํ•œ๊ตญ ๊ธˆ์œต ๋ถ„์•ผ์˜ ์ž‘์—…์— ํŠนํ™”๋˜์–ด ๋‹ค์–‘ํ•œ AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์‹ ๋ขฐ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ž…๋‹ˆ๋‹ค.
7
  โ‚ฉON ๊ฐœ๋ฐœ์˜ ํ•ต์‹ฌ ๋ชฉ์ ์€ ์—ฐ๊ตฌ์˜ ๊ฐœ๋ฐฉ์„ฑ์„ ์ด‰์ง„ํ•˜๊ณ , ์—„๊ฒฉํ•œ ๊ธˆ์œต ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ๋งˆ๋ จํ•˜๋ฉฐ, ํ•œ๊ตญ ๊ธˆ์œต ํŠนํ™” ์–ธ์–ด ๋ชจ๋ธ ํ•™์Šต์— ์žˆ์–ด ์ตœ์ ์˜ ์‹ค์ฒœ ์‚ฌ๋ก€๋ฅผ ํ™•๋ฆฝํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
8
- โ‚ฉON ๋ชจ๋ธ์˜ 2๋‹จ๊ณ„ ์ถ”๋ก  ๋ฐฉ์‹์€ ์ž์ฒด์ ์œผ๋กœ ์˜ค๋ฅ˜๋ฅผ ์ˆ˜์ •ํ•˜๋Š” ์ถ”๋ก  ๊ณผ์ •์„ ๊ฑฐ์นœ ๋’ค ๊ฒฐ๋ก ์  ์š”์•ฝ์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ, ๊ธˆ์œต ์˜์‚ฌ๊ฒฐ์ • ํ”„๋กœ์„ธ์Šค์˜ ๋ช…ํ™•์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.
 
9
 
10
  ## KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ
11
 
@@ -53,7 +54,7 @@ KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ๋Š” ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํ•œ๊ตญ ๊ธˆ
53
 
54
  - **์˜ˆ์„ **: ์ฃผ๋กœ Supervised Fine-tuning (SFT)๋ฅผ ํ™œ์šฉํ•˜์˜€์œผ๋ฉฐ, ํŠนํžˆ ๊ตญ๋‚ด ๊ธฐ์—… ๋ถ„์„(Domestic Company Analysis) ๋ถ€๋ฌธ์—์„œ ๋‘๋“œ๋Ÿฌ์ง„ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
55
  ์ด ๋ถ„์•ผ์—์„œ๋Š” ์ƒ๋‹นํ•œ ๊ฐœ์„ ์ด ์ด๋ฃจ์–ด์กŒ์œผ๋‚˜, ์žฌ๋ฌดํšŒ๊ณ„, ๊ธˆ์œต์‹œ์žฅ ๋ถ€๋ฌธ์—์„œ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์€ ์ƒ๋Œ€์ ์œผ๋กœ ๋ฏธ๋ฏธํ–ˆ์Šต๋‹ˆ๋‹ค.
56
- ๋Œ€๋ถ€๋ถ„์˜ ๋ชจ๋ธ์ด ๊ฐ„๋‹จํ•œ SFT ์ ‘๊ทผ๋ฒ•์„ ์ฑ„ํƒํ–ˆ์ง€๋งŒ, ์ผ๋ถ€ ํŒ€์€ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ๊ธฐ๋ฒ•์ธ Continual Pre-training (CPT)์„ ์‹คํ—˜ํ•˜๊ธฐ๋„ ํ•˜์˜€์œผ๋‚˜, ์ž‘์€ ๊ทœ๋ชจ์—์„œ์˜ CPT๋Š” ๊ทธ ํšจ๊ณผ๊ฐ€ ๋ช…ํ™•ํžˆ ์ž…์ฆ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.
57
 
58
  <figure style="text-align: center;">
59
  <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
@@ -63,8 +64,8 @@ KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ๋Š” ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํ•œ๊ตญ ๊ธˆ
63
  </figure>
64
 
65
  - **๋ณธ์„ **: ์˜ˆ์„ ๊ณผ ๋‹ฌ๋ฆฌ ๊ณ ๋„ํ™”๋œ ๋‹ค๋‹จ๊ณ„ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์ด ๋งŽ์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
66
- ํŠนํžˆ, ์—ฌ๋Ÿฌ ํŒ€๋“ค์€ ์ปค๋ฆฌํ˜๋Ÿผ ๊ธฐ๋ฐ˜์˜ SFT ์ „๋žต์„ ์ ์šฉํ•˜์—ฌ, ๊ฐ„๋‹จํ•œ ํ”„๋กฌํ”„ํŠธ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ Evolve Instruct์™€ ๊ฐ™์€ ๋ฐฉ๋ฒ•์œผ๋กœ ์ƒ์„ฑ๋œ ๋” ๋‚œ์ด๋„ ๋†’์€ ์‚ฌ๋ก€๋กœ ์ ์ฐจ ๋ฐœ์ „์‹œํ‚ค๋Š” ๋ฐฉ์‹์„ ์ทจํ–ˆ์Šต๋‹ˆ๋‹ค.
67
- ์ตœ์ƒ์œ„ ์„ฑ๋Šฅ์„ ๋ณด์ธ ๋ชจ๋ธ๋“ค์€ ์ถ”๊ฐ€๋กœ LLM-as-a-Judge ๊ธฐ๋ฒ•์œผ๋กœ ํ‰๊ฐ€๋œ ์‘๋‹ต๋“ค์„ ํ™œ์šฉํ•˜์—ฌ Direct Preference Optimization (DPO) ๋ฐ Kahneman Tversky Optimization (KTO)์™€ ๊ฐ™์€ ์„ ํ˜ธ๋„ ์ตœ์ ํ™” ๊ธฐ์ˆ ์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ๋”์šฑ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.
68
  ํŠนํžˆ Hi-Q ํŒ€์€ Continual Pre-training๊ณผ SFT ๋ฐ DPO๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ฐฉ์‹์˜ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆํ•˜์—ฌ ๊ด„๋ชฉํ•  ๋งŒํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋ฃจ์—ˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์ฒด๊ณ„์ ์ด๊ณ  ๋‹ค๋‹จ๊ณ„์ ์ธ ํ›ˆ๋ จ ๊ณผ์ •์˜ ๊ฐ€์น˜๋ฅผ ๋ช…ํ™•ํžˆ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
69
 
70
  <figure style="text-align: center;">
 
3
  # โ‚ฉON: ํ•œ๊ตญ ๊ธˆ์œต์„ ์œ„ํ•œ LLM
4
 
5
  ## ์†Œ๊ฐœ
6
+ โ‚ฉON์€ ํ•œ๊ตญ ๊ธˆ์œต ๋ถ„์•ผ์— ํŠนํ™”๋œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)๋กœ, ๋‹ค์–‘ํ•œ AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์‹ ๋ขฐ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
7
  โ‚ฉON ๊ฐœ๋ฐœ์˜ ํ•ต์‹ฌ ๋ชฉ์ ์€ ์—ฐ๊ตฌ์˜ ๊ฐœ๋ฐฉ์„ฑ์„ ์ด‰์ง„ํ•˜๊ณ , ์—„๊ฒฉํ•œ ๊ธˆ์œต ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ๋งˆ๋ จํ•˜๋ฉฐ, ํ•œ๊ตญ ๊ธˆ์œต ํŠนํ™” ์–ธ์–ด ๋ชจ๋ธ ํ•™์Šต์— ์žˆ์–ด ์ตœ์ ์˜ ์‹ค์ฒœ ์‚ฌ๋ก€๋ฅผ ํ™•๋ฆฝํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
8
+ โ‚ฉON์˜ 2๋‹จ๊ณ„ ์ถ”๋ก  ๋ฐฉ์‹์€ ์ž์ฒด ์˜ค๋ฅ˜ ์ˆ˜์ • ๊ณผ์ •์„ ๊ฑฐ์นœ ํ›„ ๊ฒฐ๋ก ์  ์š”์•ฝ์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ, ๊ธˆ์œต ์˜์‚ฌ๊ฒฐ์ • ํ”„๋กœ์„ธ์Šค์˜ ๋ช…ํ™•์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.
9
+
10
 
11
  ## KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ
12
 
 
54
 
55
  - **์˜ˆ์„ **: ์ฃผ๋กœ Supervised Fine-tuning (SFT)๋ฅผ ํ™œ์šฉํ•˜์˜€์œผ๋ฉฐ, ํŠนํžˆ ๊ตญ๋‚ด ๊ธฐ์—… ๋ถ„์„(Domestic Company Analysis) ๋ถ€๋ฌธ์—์„œ ๋‘๋“œ๋Ÿฌ์ง„ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
56
  ์ด ๋ถ„์•ผ์—์„œ๋Š” ์ƒ๋‹นํ•œ ๊ฐœ์„ ์ด ์ด๋ฃจ์–ด์กŒ์œผ๋‚˜, ์žฌ๋ฌดํšŒ๊ณ„, ๊ธˆ์œต์‹œ์žฅ ๋ถ€๋ฌธ์—์„œ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์€ ์ƒ๋Œ€์ ์œผ๋กœ ๋ฏธ๋ฏธํ–ˆ์Šต๋‹ˆ๋‹ค.
57
+ ๋Œ€๋ถ€๋ถ„์˜ ๋ชจ๋ธ์€ ๊ฐ„๋‹จํ•œ SFT ์ ‘๊ทผ๋ฒ•์„ ์ฑ„ํƒํ–ˆ์œผ๋‚˜, ์ผ๋ถ€ ํŒ€์€ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ๊ธฐ๋ฒ•์ธ Continual Pre-training (CPT)์„ ์‹คํ—˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์†Œ๊ทœ๋ชจ์—์„œ์˜ CPT๋Š” ๊ทธ ํšจ๊ณผ๊ฐ€ ๋ช…ํ™•ํžˆ ์ž…์ฆ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.
58
 
59
  <figure style="text-align: center;">
60
  <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
 
64
  </figure>
65
 
66
  - **๋ณธ์„ **: ์˜ˆ์„ ๊ณผ ๋‹ฌ๋ฆฌ ๊ณ ๋„ํ™”๋œ ๋‹ค๋‹จ๊ณ„ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์ด ๋งŽ์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
67
+ ํŠนํžˆ, ์—ฌ๋Ÿฌ ํŒ€๋“ค์€ ์ปค๋ฆฌํ˜๋Ÿผ ๊ธฐ๋ฐ˜์˜ SFT ์ „๋žต์„ ์ ์šฉํ•˜์—ฌ, ๊ฐ„๋‹จํ•œ ํ”„๋กฌํ”„ํŠธ์—์„œ ์‹œ์ž‘ํ•ด ์ ์ฐจ Evolve Instruct์™€ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ๋” ๋ณต์žกํ•œ ์‚ฌ๋ก€๋กœ ๋ฐœ์ „์‹œ์ผœ ๋‚˜๊ฐ”์Šต๋‹ˆ๋‹ค.
68
+ ์ตœ์ƒ์œ„ ์„ฑ๋Šฅ์„ ๋ณด์ธ ๋ชจ๋ธ๋“ค์€ ์ถ”๊ฐ€๋กœ LLM-as-a-Judge ๊ธฐ๋ฒ•์œผ๋กœ ํ‰๊ฐ€๋œ ์‘๋‹ต๋“ค์„ ํ™œ์šฉํ•˜์—ฌ Direct Preference Optimization (DPO) ๋ฐ Kahneman Tversky Optimization (KTO)์™€ ๊ฐ™์€ ์„ ํ˜ธ๋„ ์ตœ์ ํ™” ๊ธฐ์ˆ ์„ ์ด์šฉํ•ด ์„ฑ๋Šฅ์„ ๋”์šฑ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.
69
  ํŠนํžˆ Hi-Q ํŒ€์€ Continual Pre-training๊ณผ SFT ๋ฐ DPO๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ฐฉ์‹์˜ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆํ•˜์—ฌ ๊ด„๋ชฉํ•  ๋งŒํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋ฃจ์—ˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์ฒด๊ณ„์ ์ด๊ณ  ๋‹ค๋‹จ๊ณ„์ ์ธ ํ›ˆ๋ จ ๊ณผ์ •์˜ ๊ฐ€์น˜๋ฅผ ๋ช…ํ™•ํžˆ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
70
 
71
  <figure style="text-align: center;">