Knowledge distillation · GGUF · Ollama · llama.cpp · Qwen · Gemma · offline inference · edge AI · quantization