그.. 대충 해명을 하자면, 이런 vllm 모델은 처음 GRPO로 파인튜닝하는데, 왜인진 모르겠으나 이미지 인식하는 부분이 gguf로 변환하니까 안되네요. 근데 Q4_K_M으로 양자화 해놔도 한국어를 매우 잘 구사합니다. 대충 Q4_K_M 기준 vram 4.3GB 쓰네요. 대충 GGUF로 만들어 뒀으니 프롬프팅해서 쓰십쇼

Uploaded finetuned model

  • Developed by: kenonix
  • License: apache-2.0
  • Finetuned from model : unsloth/gemma-3-4b-it-unsloth-bnb-4bit

This gemma3 model was trained 2x faster with Unsloth and Huggingface's TRL library.

Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for kenonix/gemma-3-ko-4B-1

Finetuned
(1100)
this model
Finetunes
1 model
Quantizations
3 models