codebasic
/

Qwen3-0.6B-GGUF

Model card Files Files and versions

lseongjoo commited on Jul 6, 2025

Commit

3a57577

·

verified ·

1 Parent(s): 69b865b

Update README.md

Files changed (1) hide show

README.md +26 -4

README.md CHANGED Viewed

@@ -1,6 +1,28 @@
 ---
 license: apache-2.0
-base_model:
-- Qwen/Qwen3-0.6B
-pipeline_tag: text2text-generation
----

 ---
 license: apache-2.0
+tags:
+- gguf
+- llama.cpp
+- Qwen
+- 한국어
+---
+# Qwen3 0.6B - GGUF 포맷 (float16)
+이 저장소는 [Qwen3 0.6B](https://huggingface.co/Qwen/Qwen1.5-0.5B) 모델을 [`llama.cpp`](https://github.com/ggerganov/llama.cpp)의 변환 도구를 사용하여 GGUF 포맷으로 변환한 버전입니다. 이 포맷은 `llama.cpp`, `llamafile`, `llm`, `text-generation-webui` 등에서 사용할 수 있습니다.
+## 🔧 변환 정보
+- 변환 스크립트: `llama.cpp/convert.py`
+- 출력 형식: `GGUF` (`--outtype f16`)
+- 모델 크기: 0.6B 파라미터
+- 원본 모델: `Qwen/Qwen1.5-0.5B`
+## 🧠 모델 구조
+Qwen3 계열은 Transformer 기반 언어 모델로, 다양한 언어와 작업에 사용할 수 있습니다. 본 모델은 **한국어 지원 여부에 따라 사용자가 실험적으로 확인**해 보시는 것을 권장합니다.
+## 🧪 예시 사용법 (`llama.cpp`)
+```bash
+./main -m qwen3-0.6b.gguf -p "안녕하세요. 자기소개를 해 주세요."