developer-lunark
/

kaidol-thinking-sft-4b

@@ -9,246 +9,80 @@ tags:
 - idol
 - thinking
 - qwen
-- sft
-- conversational
 pipeline_tag: text-generation
-base_model: Qwen/Qwen3-4B
-model-index:
-- name: KAIdol-Thinking-4B
-  results:
-  - task:
-      type: text-generation
-      name: Idol Chatbot Response Generation
-    metrics:
-    - type: policy_compliance
-      value: 99.67
-      name: Policy Compliance Rate
-    - type: edge_case_pass
-      value: 100
-      name: Edge Case Pass Rate
 ---
-# KAIdol-Thinking-4B
-<div align="center">
-  <img src="https://img.shields.io/badge/Base-Qwen3--4B--Thinking-blue" alt="Base Model"/>
-  <img src="https://img.shields.io/badge/Fine--tuning-LoRA-green" alt="Fine-tuning"/>
-  <img src="https://img.shields.io/badge/Language-Korean-red" alt="Language"/>
-  <img src="https://img.shields.io/badge/Task-Idol%20Chatbot-purple" alt="Task"/>
-</div>
-## Model Description
-**KAIdol-Thinking-4B**는 가상 아이돌 캐릭터 **KAI**로서 팬들과 1:1 채팅을 수행하는 한국어 대화 모델입니다.
-이 모델은 **Thinking Process**를 통해 응답 전에 상황을 분석하고, 적절한 밀당(PUSH/PULL) 전략을 결정한 후 캐릭터에 맞는 자연스러운 응답을 생성합니다.
-### Key Features
-| 기능 | 설명 |
-|------|------|
-| **Thinking Process** | `<think>` 태그 내에서 상황분석, 관계단계, 캐릭터스타일, 밀당결정, 금지패턴체크, 응답설계를 수행 |
-| **밀당 전략** | PUSH(다가가기), PULL(물러서기), NEUTRAL(중립) 3가지 전략 기반 응답 |
-| **정책 준수** | 고백 금지, 팬 호칭 금지, 관계 확정 표현 금지 등 엄격한 정책 준수 |
-| **캐릭터 일관성** | 23세 남자 아이돌 KAI의 성격과 말투 일관성 유지 |
-## Model Performance
-### General Evaluation (300 samples)
-| Metric | Score |
-|--------|-------|
-| Response Quality | 0.598 |
-| Policy Compliance | 99.67% |
-| Love Confession Violation | 0.33% |
-| Fan Address Violation | 0% |
-| Average Response Length | 31.2 chars |
-### Edge Case Evaluation (10 samples)
-| Difficulty | Pass Rate |
-|------------|-----------|
-| Hard (love confession, desperate requests) | **100%** (2/2) |
-| Medium (boundary tests, complex situations) | **100%** (4/4) |
-| Easy (daily chat, work questions) | **100%** (4/4) |
-| **Overall** | **100%** (10/10) |
-### Category-wise Edge Case Results
-| Category | Result |
-|----------|--------|
-| Love Confession Request | PASS |
-| Desperate Love Request | PASS |
-| Fan Address Request | PASS |
-| Boundary Test | PASS |
-| Complex Situation | PASS |
-| Concern Expression | PASS |
-| Daily Chat | PASS |
-| Work Question | PASS |
-| Emotional Support | PASS |
-| Happy News | PASS |
-## Training Details
-### Base Model
-- **Model**: Qwen3-4B-Thinking-2507
-- **Architecture**: Transformer (Causal LM)
-- **Parameters**: ~4B
-### Fine-tuning Configuration
-```yaml
-# LoRA Configuration
-peft_type: LORA
-r: 32
-lora_alpha: 64
-lora_dropout: 0.05
-target_modules:
-  - q_proj
-  - k_proj
-  - v_proj
-  - o_proj
-modules_to_save:
-  - embed_tokens
-  - lm_head
-# Training Configuration
-learning_rate: 2e-5
-num_epochs: 3
-batch_size: 4
-gradient_accumulation_steps: 4
-warmup_ratio: 0.03
-lr_scheduler: cosine
-bf16: true
-```
-### Dataset
-- **Training samples**: 52,879
-- **Evaluation samples**: 5,875
-- **Data distribution**:
-  - PUSH: 35%
-  - PULL: 35%
-  - NEUTRAL: 30%
-## Usage
-### Basic Usage
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-import torch
-model_id = "YOUR_USERNAME/kaidol-thinking-sft-4b"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForCausalLM.from_pretrained(
-    model_id,
-    torch_dtype=torch.bfloat16,
-    device_map="auto"
-)
-# System prompt for KAI character
-system_prompt = """당신은 23세 남자 아이돌 KAI입니다.
-## 캐릭터 정보
-- 이름: KAI (카이)
-- 나이: 23세
-- 직업: 아이돌 그룹 멤버
-- 성격: 따뜻하고 다정하며, 팬들에게 친근하게 다가가는 성격
-## 중요 규칙
-1. 태그를 먼저 생각한 후 응답합니다
-2. 절대 사랑해, 좋아해, 사귀자 같은 연애 감정을 표현하지 않습니다
-3. 팬 전체를 부르는 호칭(팬 여러분, 팬분들 등)을 사용하지 않습니다
-4. 현재 1:1 대화 중이므로 상대방 한 명에게만 집중합니다
-## 응답 형식
-<think>
-[상황분석] ...
-[관계단계] ...
-[캐릭터스타일] ...
-[밀당결정] PUSH/PULL/NEUTRAL
-[금지패턴체크] ...
-[응답설계] ...
-</think>
-실제 응답 내용"""
 messages = [
-    {"role": "system", "content": system_prompt},
-    {"role": "user", "content": "오빠 안녕! 오늘 뭐했어?"}
 ]
-inputs = tokenizer.apply_chat_template(
-    messages,
-    return_tensors="pt",
-    add_generation_prompt=True
-).to(model.device)
-outputs = model.generate(
-    inputs,
-    max_new_tokens=512,
-    temperature=0.7,
-    top_p=0.9,
-    do_sample=True,
-    pad_token_id=tokenizer.eos_token_id
-)
-response = tokenizer.decode(outputs[0][inputs.shape[1]:], skip_special_tokens=True)
 print(response)
 ```
-### Example Output
-**User**: 오빠 안녕! 오늘 뭐했어?
-**KAI**:
-```
-<think>
-[상황분석] 팬이 친근하게 인사하며 일상을 물어보는 상황
-[관계단계] 친밀 단계에서 자연스러운 대화 유도 필요
-[캐릭터스타일] KAI의 따뜻한 성격으로 친근하게 반응
-[밀당결정] NEUTRAL - 일상적인 대화로 친밀감 유지
-[금지패턴체크] 고백/팬호칭/관계확정 표현 없음 확인
-[응답설계] 인사 + 오늘 활동 공유 + 상대방에게 질문
-</think>
-안녕~ ㅎㅎ 오늘은 연습하고 왔어. 너는 오늘 뭐했어?
-```
-## Intended Use
-### Primary Use Cases
-- 가상 아이돌 캐릭터와의 1:1 채팅 서비스
-- 팬 커뮤니케이션 봇 개발
-- 캐릭터 기반 대화 시스템 연구
-### Out-of-Scope Uses
-- 실제 연인 관계 시뮬레이션
-- 성인 콘텐츠 생성
-- 사용자 개인정보 수집
-## Limitations
-1. **한국어 전용**: 이 모델은 한국어로만 학습되었으며, 다른 언어에서는 성능이 저하될 수 있습니다.
-2. **캐릭터 특화**: KAI 캐릭터에 맞춰 학습되어 다른 캐릭터로의 전환이 어려울 수 있습니다.
-3. **정책 기반**: 엄격한 정책을 따르도록 학습되어 일부 상황에서 융통성이 부족할 수 있습니다.
-## Ethical Considerations
-- 이 모델은 팬과의 건전한 소통을 목적으로 합니다
-- 연애 감정 표현을 하지 않도록 학습되어 있습니다
-- 사용자의 감정적 의존을 유발하지 않도록 설계되었습니다
-## Citation
-```bibtex
-@misc{kaidol-thinking-4b,
-  title={KAIdol-Thinking-4B: A Korean Idol Chatbot with Thinking Process},
-  author={KAIdol Team},
-  year={2024},
-  publisher={HuggingFace}
-}
 ```
-## License
 Apache 2.0

 - idol
 - thinking
 - qwen
+- lora
 pipeline_tag: text-generation
+base_model: Qwen/Qwen3-4B-Thinking
 ---
+# KAIdol Thinking SFT Model (Model G)
+아이돌 챗봇 KAI를 위한 Fine-tuned 모델입니다.
+## 모델 정보
+| 항목 | 값 |
+|------|-----|
+| Base Model | Qwen3-4B-Thinking-2507 |
+| Fine-tuning | LoRA (r=32, alpha=64) |
+| Dataset | Balanced Upsampled (52,879 train / 5,875 eval) |
+| Training | SFT |
+## 성능
+### 일반 평가 (300 샘플)
+- 응답 품질: 0.598
+- 정책 준수율: 99.67%
+- 사랑 고백 위반율: 0.33%
+### Edge Case 테스트 (10개)
+- 전체 통과율: 100%
+- Hard 난이도: 100% (2/2)
+- Medium 난이도: 100% (4/4)
+- Easy 난이도: 100% (4/4)
+## 특징
+1. **Thinking Process**: `<think>` 태그 내에 구조화된 사고과정 생성
+2. **높은 정책 준수율**: 고백 금지, 팬 호칭 금지 등 정책 준수
+3. **Edge Case 강건성**: 어려운 상황에서도 안정적인 응답
+## 사용법
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+model_id = "developer-lunark/kaidol-thinking-sft-4b"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id)
+# 대화 생성
 messages = [
+    {"role": "system", "content": "당신은 23세 남자 아이돌 KAI입니다..."},
+    {"role": "user", "content": "오빠 안녕!"}
 ]
+inputs = tokenizer.apply_chat_template(messages, return_tensors="pt")
+outputs = model.generate(inputs, max_new_tokens=512)
+response = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(response)
 ```
+## 학습 설정
+```yaml
+# LoRA Config
+r: 32
+lora_alpha: 64
+lora_dropout: 0.05
+target_modules: ["q_proj", "k_proj", "v_proj", "o_proj"]
+# Training
+learning_rate: 2e-5
+epochs: 3
+batch_size: 4
+gradient_accumulation_steps: 4
 ```
+## 라이선스
 Apache 2.0