Update model card for DPO v4

Browse files

Files changed (1) hide show

README.md +178 -3

README.md CHANGED Viewed

@@ -1,3 +1,178 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+language:
+  - ko
+  - en
+library_name: transformers
+tags:
+  - finance
+  - korean
+  - stock-analysis
+  - reasoning
+  - dpo
+base_model: Qwen/Qwen2.5-7B-Instruct
+pipeline_tag: text-generation
+---
+# VELA (Vector-Encoded Learning Agent)
+**한국 주식시장 전문 AI 애널리스트**
+VELA는 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 언어 모델입니다.
+## Model Details
+| 항목 | 내용 |
+|------|------|
+| **Base Model** | Qwen/Qwen2.5-7B-Instruct |
+| **Training Stage** | SFT + DPO v4 |
+| **Parameters** | 7.6B |
+| **Context Length** | 8,192 tokens |
+| **Precision** | BFloat16 |
+| **License** | Apache 2.0 |
+## Training Pipeline
+```
+Qwen2.5-7B-Instruct
+        ↓
+   SFT (930K samples)
+   - 한국 주식 뉴스 분석
+   - 리서치 리포트 생성
+   - Reasoning Trace 학습
+        ↓
+   DPO v4 (7,681 pairs)
+   - 중국어/영어 leak 교정
+   - 한국어 출력 강화
+   - 형식 준수 향상
+        ↓
+     VELA v1.0
+```
+## Capabilities
+- **뉴스 영향 분석**: 주식 관련 뉴스의 시장 영향도 예측
+- **리서치 리포트 생성**: 구조화된 투자 분석 보고서 작성
+- **Reasoning Trace**: 단계별 분석 사고과정 생성
+- **다중 소스 종합**: 뉴스, 시세, 수급 데이터 통합 분석
+## Usage
+### Transformers
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+model = AutoModelForCausalLM.from_pretrained(
+    "intrect/vela",
+    torch_dtype=torch.bfloat16,
+    device_map="auto"
+)
+tokenizer = AutoTokenizer.from_pretrained("intrect/vela")
+messages = [
+    {"role": "system", "content": "당신은 한국 주식 전문 애널리스트입니다."},
+    {"role": "user", "content": "삼성전자 HBM 사업 전망을 분석해주세요."}
+]
+text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+inputs = tokenizer(text, return_tensors="pt").to(model.device)
+outputs = model.generate(
+    **inputs,
+    max_new_tokens=1024,
+    temperature=0.7,
+    do_sample=True
+)
+print(tokenizer.decode(outputs[0], skip_special_tokens=True))
+```
+### vLLM (Recommended for Production)
+```python
+from vllm import LLM, SamplingParams
+llm = LLM(model="intrect/vela", dtype="bfloat16")
+params = SamplingParams(temperature=0.7, max_tokens=1024)
+prompts = ["삼성전자 HBM 시장 전망을 분석해주세요."]
+outputs = llm.generate(prompts, params)
+```
+### MLX (Apple Silicon)
+MLX 변환 모델은 별도 저장소에서 제공 예정입니다.
+## Output Format
+VELA는 다음과 같은 구조화된 출력을 생성합니다:
+```markdown
+## Executive Summary
+[2-3문장 핵심 요약]
+## Key Metrics
+| 지표 | 수치 |
+|------|------|
+| 현재가 | ₩XX,XXX |
+| PER | XX.X |
+| ...  | ... |
+## 시장 동향 분석
+[상세 분석]
+## 리스크 요인
+- 리스크 1
+- 리스크 2
+## 투자 의견
+[종합 의견]
+```
+## Training Data
+| 데이터셋 | 샘플 수 | 용도 |
+|----------|---------|------|
+| 한국 주식 뉴스 | 412K | SFT 기반 데이터 |
+| 리서치 리포트 | 50K | 분석 형식 학습 |
+| Reasoning Traces | 5K | 사고과정 학습 |
+| DPO Pairs | 7.7K | 선호도 정렬 |
+## DPO v4 Improvements
+DPO v4는 다음 문제들을 해결합니다:
+- ✅ **중국어 leak 제거**: 중국어 문자 출력 방지
+- ✅ **영어 leak 감소**: 불필요한 영어 사용 최소화
+- ✅ **형식 준수**: 지정된 출력 형식 엄격 준수
+- ✅ **한국어 품질**: 자연스러운 한국어 표현
+## Limitations
+- 실시간 시세 데이터 접근 불가 (외부 API 필요)
+- 투자 조언이 아닌 정보 제공 목적
+- 8K 컨텍스트 제한으로 긴 문서 처리 한계
+## Citation
+```bibtex
+@misc{vela2025,
+  title={VELA: Vector-Encoded Learning Agent for Korean Stock Analysis},
+  author={intrect},
+  year={2025},
+  publisher={Hugging Face},
+  url={https://huggingface.co/intrect/vela}
+}
+```
+## Version History
+| 버전 | 날짜 | 변경사항 |
+|------|------|----------|
+| v1.0 (DPO v4) | 2025-01-28 | DPO v4 병합, 중국어/영어 leak 해결 |
+| v0.9 (SFT) | 2025-01-15 | SFT 베이스 모델 공개 |
+---
+**Disclaimer**: 이 모델의 출력은 투자 조언이 아닙니다. 모든 투자 결정은 본인의 판단과 책임 하에 이루어져야 합니다.