Update README.md
Browse files
README.md
CHANGED
|
@@ -1,6 +1,28 @@
|
|
| 1 |
---
|
| 2 |
license: apache-2.0
|
| 3 |
-
|
| 4 |
-
-
|
| 5 |
-
|
| 6 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
license: apache-2.0
|
| 3 |
+
tags:
|
| 4 |
+
- gguf
|
| 5 |
+
- llama.cpp
|
| 6 |
+
- Qwen
|
| 7 |
+
- 한국어
|
| 8 |
+
---
|
| 9 |
+
|
| 10 |
+
# Qwen3 0.6B - GGUF 포맷 (float16)
|
| 11 |
+
|
| 12 |
+
이 저장소는 [Qwen3 0.6B](https://huggingface.co/Qwen/Qwen1.5-0.5B) 모델을 [`llama.cpp`](https://github.com/ggerganov/llama.cpp)의 변환 도구를 사용하여 GGUF 포맷으로 변환한 버전입니다. 이 포맷은 `llama.cpp`, `llamafile`, `llm`, `text-generation-webui` 등에서 사용할 수 있습니다.
|
| 13 |
+
|
| 14 |
+
## 🔧 변환 정보
|
| 15 |
+
|
| 16 |
+
- 변환 스크립트: `llama.cpp/convert.py`
|
| 17 |
+
- 출력 형식: `GGUF` (`--outtype f16`)
|
| 18 |
+
- 모델 크기: 0.6B 파라미터
|
| 19 |
+
- 원본 모델: `Qwen/Qwen1.5-0.5B`
|
| 20 |
+
|
| 21 |
+
## 🧠 모델 구조
|
| 22 |
+
|
| 23 |
+
Qwen3 계열은 Transformer 기반 언어 모델로, 다양한 언어와 작업에 사용할 수 있습니다. 본 모델은 **한국어 지원 여부에 따라 사용자가 실험적으로 확인**해 보시는 것을 권장합니다.
|
| 24 |
+
|
| 25 |
+
## 🧪 예시 사용법 (`llama.cpp`)
|
| 26 |
+
|
| 27 |
+
```bash
|
| 28 |
+
./main -m qwen3-0.6b.gguf -p "안녕하세요. 자기소개를 해 주세요."
|