Spaces:

alex4cip
/

simple-chat

Sleeping

alex4cip Claude commited on Oct 20

Commit

c6d4144

1 Parent(s): fb55a82

feat: Add better Korean language models

**Model Changes:**
- Remove: skt/kogpt2-base-v2 (poor conversation quality)
- Add: beomi/llama-2-ko-7b (Llama 2 based Korean model, 14GB)
- Add: kyujinpy/KoT-Llama2-7B-Chat (Korean optimized Llama 2, 14GB)
- Add: nlpai-lab/kullm-polyglot-5.8b-v2 (Korea Univ NLP lab model, 12GB)
- Keep: beomi/KoAlpaca-Polyglot-5.8B (existing model, 12GB)

**Model Summary:**
- Total: 7 models (3 English, 4 Korean)
- All Korean models have memory warnings (12-14GB RAM required)
- Korean models are not suitable for HF Spaces free tier

**Documentation Updates:**
- Updated README with new model list and specifications
- Added performance notes for Korean models
- Updated examples to use new Korean models
- Clarified that Korean models require GPU tier on HF Spaces

**Important Notes:**
- Korean models provide better conversation quality
- All Korean models require high memory (12-14GB)
- Free tier users should stick to English models only
- GPU recommended for acceptable performance

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

Files changed (2) hide show

README.md +15 -11
app.py +20 -7

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ license: mit
 ## ✨ 주요 기능
-- **다중 모델 지원**: 5개 모델 (영어 3개, 한글 2개)
 - **로컬 실행**: Transformers 라이브러리로 로컬에서 모델 실행
 - **API 제한 없음**: 인터넷 연결 없이도 작동 (첫 다운로드 후)
 - **자동 세션 관리**: 모델 변경 시 대화 자동 초기화
@@ -30,8 +30,10 @@ license: mit
 3. **GPT-2** - 범용 텍스트 생성 모델 (~500MB)
 ### 한글 모델
-4. **KoGPT-2** - SKT의 한글 특화 모델 (~500MB)
-5. **KoAlpaca 5.8B** - 대화형 한글 모델, 고사양 필요 (~12GB)
 ## 🚀 로컬 실행 방법
@@ -122,21 +124,23 @@ simple-chatbot-gradio/
 ## ⚠️ 제한사항 및 주의사항
 ### 성능
-- **CPU 실행**: GPU 없이 CPU에서 실행되므로 응답이 느릴 수 있습니다 (5-10초)
-- **메모리**: 모델 크기에 따라 1-8GB RAM 필요
-- **첫 실행**: 모델 다운로드로 시간 소요 (350MB~12GB)
 ### 모델별 특성
 - **영어 모델**: 한글 입력 시 부자연스러운 응답
-- **한글 모델**: 영어 입력 시 성능 저하
-- **KoAlpaca 5.8B**: 8GB+ RAM 필요, CPU에서 매우 느림
 ### Hugging Face Spaces 배포
 - **무료 tier**: CPU 인스턴스만 제공 (16GB RAM)
 - **Space Sleep**: 48시간 비활성 시 자동 sleep, 첫 로딩 느림
-- **메모리 제한**: KoAlpaca 5.8B는 무료 tier에서 실행 불가 (8GB+ 필요)
-- **첫 실행**: 모델 다운로드로 1-3분 소요
-- **권장 모델**: DialoGPT Small/Medium, GPT-2, KoGPT-2 (무료 tier에서 안정적)
 ## 🔧 개발 및 커스터마이징

 ## ✨ 주요 기능
+- **다중 모델 지원**: 7개 모델 (영어 3개, 한글 4개)
 - **로컬 실행**: Transformers 라이브러리로 로컬에서 모델 실행
 - **API 제한 없음**: 인터넷 연결 없이도 작동 (첫 다운로드 후)
 - **자동 세션 관리**: 모델 변경 시 대화 자동 초기화
 3. **GPT-2** - 범용 텍스트 생성 모델 (~500MB)
 ### 한글 모델
+4. **Llama-2-Ko 7B** - Llama 2 기반 한글 대화형 모델 (~14GB, 고사양)
+5. **KoT-Llama2-7B-Chat** - 한국어 최적화 Llama 2 대화 모델 (~14GB, 고사양)
+6. **KoAlpaca 5.8B** - 한글 대화형 모델 (~12GB, 고사양)
+7. **KULLM-Polyglot 5.8B** - 고려대 NLP 연구실 한글 대화 모델 (~12GB, 고사양)
 ## 🚀 로컬 실행 방법
 ## ⚠️ 제한사항 및 주의사항
 ### 성능
+- **CPU 실행**: GPU 없이 CPU에서 실행되므로 응답이 느릴 수 있습니다 (5-30초)
+- **메모리**: 모델 크기에 따라 1-16GB RAM 필요
+- **첫 실행**: 모델 다운로드로 시간 소요 (350MB~14GB)
 ### 모델별 특성
 - **영어 모델**: 한글 입력 시 부자연스러운 응답
+- **한글 모델 (Llama 2 기반)**: 대화 품질 우수하지만 메모리 많이 필요 (14GB+)
+- **한글 모델 (Polyglot 기반)**: 중간 크기, 대화 품질 양호 (12GB+)
+- **모든 한글 모델**: CPU 환경에서 매우 느림, GPU 권장
 ### Hugging Face Spaces 배포
 - **무료 tier**: CPU 인스턴스만 제공 (16GB RAM)
 - **Space Sleep**: 48시간 비활성 시 자동 sleep, 첫 로딩 느림
+- **메모리 제한**: 한글 모델들은 무료 tier에서 실행 불가 (12-14GB 필요)
+- **첫 실행**: 모델 다운로드로 1-5분 소요
+- **권장 모델**: DialoGPT Small/Medium, GPT-2만 무료 tier에서 안정적
+- **한글 대화**: 무료 tier에서는 한글 모델 사용 불가, 유료 GPU tier 필요
 ## 🔧 개발 및 커스터마이징

app.py CHANGED Viewed

@@ -32,16 +32,29 @@ MODELS = {
         "max_length": 80,
         "language": "en",
     },
-    "skt/kogpt2-base-v2": {
-        "name": "KoGPT-2 (한글 특화)",
-        "max_length": 100,
         "language": "ko",
     },
     "beomi/KoAlpaca-Polyglot-5.8B": {
-        "name": "KoAlpaca 5.8B (한글 대화형, ⚠️ 8GB+ RAM 필요)",
         "max_length": 150,
         "language": "ko",
-        "warning": "이 모델은 8GB 이상의 메모리가 필요합니다. HF Spaces 무료 tier에서는 메모리 부족으로 실행되지 않을 수 있습니다.",
     },
 }
@@ -225,8 +238,8 @@ with gr.Blocks(
         examples=[
             ["Hello! How are you?", "microsoft/DialoGPT-small"],
             ["Tell me a joke", "microsoft/DialoGPT-medium"],
-            ["안녕하세요! 오늘 날씨가 좋네요.", "skt/kogpt2-base-v2"],
-            ["인공지능에 대해 설명해주세요.", "skt/kogpt2-base-v2"],
         ],
     )

         "max_length": 80,
         "language": "en",
     },
+    "beomi/llama-2-ko-7b": {
+        "name": "Llama-2-Ko 7B (한글 대화형, ⚠️ 14GB+ RAM 필요)",
+        "max_length": 150,
+        "language": "ko",
+        "warning": "이 모델은 14GB 이상의 메모리가 필요합니다. HF Spaces 무료 tier에서는 메모리 부족으로 실행되지 않을 수 있습니다.",
+    },
+    "kyujinpy/KoT-Llama2-7B-Chat": {
+        "name": "KoT-Llama2-7B-Chat (한글 대화, ⚠️ 14GB+ RAM 필요)",
+        "max_length": 150,
         "language": "ko",
+        "warning": "이 모델은 14GB 이상의 메모리가 필요합니다. HF Spaces 무료 tier에서는 메모리 부족으로 실행되지 않을 수 있습니다.",
     },
     "beomi/KoAlpaca-Polyglot-5.8B": {
+        "name": "KoAlpaca 5.8B (한글 대화형, ⚠️ 12GB+ RAM 필요)",
+        "max_length": 150,
+        "language": "ko",
+        "warning": "이 모델은 12GB 이상의 메모리가 필요합니다. HF Spaces 무료 tier에서는 메모리 부족으로 실행되지 않을 수 있습니다.",
+    },
+    "nlpai-lab/kullm-polyglot-5.8b-v2": {
+        "name": "KULLM-Polyglot 5.8B (한글 대화, ⚠️ 12GB+ RAM 필요)",
         "max_length": 150,
         "language": "ko",
+        "warning": "이 모델은 12GB 이상의 메모리가 필요합니다. HF Spaces 무료 tier에서는 메모리 부족으로 실행되지 않을 수 있습니다.",
     },
 }
         examples=[
             ["Hello! How are you?", "microsoft/DialoGPT-small"],
             ["Tell me a joke", "microsoft/DialoGPT-medium"],
+            ["안녕하세요! 오늘 날씨가 어때요?", "beomi/llama-2-ko-7b"],
+            ["인공지능에 대해 간단히 설명해주세요.", "kyujinpy/KoT-Llama2-7B-Chat"],
         ],
     )