KRX-Data
/

WON-Reasoning

Safetensors

qwen2

Model card Files Files and versions

xet

Community

Charm2Hwang commited on Apr 11, 2025

Commit

bb37fbb

verified ·

1 Parent(s): be9ed13

Update KOREAN_README.md

Browse files

Files changed (1) hide show

KOREAN_README.md +6 -5

KOREAN_README.md CHANGED Viewed

@@ -3,9 +3,10 @@
 # ₩ON: 한국 금융을 위한 LLM
 ## 소개
-₩ON은 한국 금융 분야의 작업에 특화되어 다양한 AI 애플리케이션에서 신뢰성과 투명성을 높이기 위해 설계된 대규모 언어 모델(LLM)입니다.
 ₩ON 개발의 핵심 목적은 연구의 개방성을 촉진하고, 엄격한 금융 추론 능력을 평가할 수 있는 기준을 마련하며, 한국 금융 특화 언어 모델 학습에 있어 최적의 실천 사례를 확립하는 것입니다.
-₩ON 모델의 2단계 추론 방식은 자체적으로 오류를 수정하는 추론 과정을 거친 뒤 결론적 요약을 제공함으로써, 금융 의사결정 프로세스의 명확성과 정확성을 높이는 데 효과적입니다.
 ## KRX 금융 언어 모델 경진대회
@@ -53,7 +54,7 @@ KRX 금융 언어 모델 경진대회는 대형 언어 모델(LLM)의 한국 금
 - **예선**: 주로 Supervised Fine-tuning (SFT)를 활용하였으며, 특히 국내 기업 분석(Domestic Company Analysis) 부문에서 두드러진 성과를 보였습니다.
 이 분야에서는 상당한 개선이 이루어졌으나, 재무회계, 금융시장 부문에서의 성능 향상은 상대적으로 미미했습니다.
-대부분의 모델이 간단한 SFT 접근법을 채택했지만, 일부 팀은 추가적인 훈련 기법인 Continual Pre-training (CPT)을 실험하기도 하였으나, 작은 규모에서의 CPT는 그 효과가 명확히 입증되지 않았습니다.
 <figure style="text-align: center;">
   <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="샘플 이미지" style="display: block; margin: auto;">
@@ -63,8 +64,8 @@ KRX 금융 언어 모델 경진대회는 대형 언어 모델(LLM)의 한국 금
 </figure>
 - **본선**: 예선과 달리 고도화된 다단계 학습 방법론이 많이 사용되었습니다.
-특히, 여러 팀들은 커리큘럼 기반의 SFT 전략을 적용하여, 간단한 프롬프트부터 시작하여 Evolve Instruct와 같은 방법으로 생성된 더 난이도 높은 사례로 점차 발전시키는 방식을 취했습니다.
-최상위 성능을 보인 모델들은 추가로 LLM-as-a-Judge 기법으로 평가된 응답들을 활용하여 Direct Preference Optimization (DPO) 및 Kahneman Tversky Optimization (KTO)와 같은 선호도 최적화 기술을 통해 성능을 더욱 향상시켰습니다.
 특히 Hi-Q 팀은 Continual Pre-training과 SFT 및 DPO를 결합한 방식의 효과성을 입증하여 괄목할 만한 성능 향상을 이루었으며, 이를 통해 체계적이고 다단계적인 훈련 과정의 가치를 명확히 보여주었습니다.
 <figure style="text-align: center;">

 # ₩ON: 한국 금융을 위한 LLM
 ## 소개
+₩ON은 한국 금융 분야에 특화된 대규모 언어 모델(LLM)로, 다양한 AI 애플리케이션에서 신뢰성과 투명성을 높이기 위해 설계되었습니다.
 ₩ON 개발의 핵심 목적은 연구의 개방성을 촉진하고, 엄격한 금융 추론 능력을 평가할 수 있는 기준을 마련하며, 한국 금융 특화 언어 모델 학습에 있어 최적의 실천 사례를 확립하는 것입니다.
+₩ON의 2단계 추론 방식은 자체 오류 수정 과정을 거친 후 결론적 요약을 제공함으로써, 금융 의사결정 프로세스의 명확성과 정확성을 높이는 데 효과적입니다.
 ## KRX 금융 언어 모델 경진대회
 - **예선**: 주로 Supervised Fine-tuning (SFT)를 활용하였으며, 특히 국내 기업 분석(Domestic Company Analysis) 부문에서 두드러진 성과를 보였습니다.
 이 분야에서는 상당한 개선이 이루어졌으나, 재무회계, 금융시장 부문에서의 성능 향상은 상대적으로 미미했습니다.
+대부분의 모델은 간단한 SFT 접근법을 채택했으나, 일부 팀은 추가적인 훈련 기법인 Continual Pre-training (CPT)을 실험했습니다. 그러나 소규모에서의 CPT는 그 효과가 명확히 입증되지 않았습니다.
 <figure style="text-align: center;">
   <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="샘플 이미지" style="display: block; margin: auto;">
 </figure>
 - **본선**: 예선과 달리 고도화된 다단계 학습 방법론이 많이 사용되었습니다.
+특히, 여러 팀들은 커리큘럼 기반의 SFT 전략을 적용하여, 간단한 프롬프트에서 시작해 점차 Evolve Instruct와 같은 방식으로 더 복잡한 사례로 발전시켜 나갔습니다.
+최상위 성능을 보인 모델들은 추가로 LLM-as-a-Judge 기법으로 평가된 응답들을 활용하여 Direct Preference Optimization (DPO) 및 Kahneman Tversky Optimization (KTO)와 같은 선호도 최적화 기술을 이용해 성능을 더욱 향상시켰습니다.
 특히 Hi-Q 팀은 Continual Pre-training과 SFT 및 DPO를 결합한 방식의 효과성을 입증하여 괄목할 만한 성능 향상을 이루었으며, 이를 통해 체계적이고 다단계적인 훈련 과정의 가치를 명확히 보여주었습니다.
 <figure style="text-align: center;">