LiquidAI
/

LeapBundles

Add 4-bit quantization for Qwen3-1.7B

by Paulescu - opened Dec 22, 2025

←

This PR is in draft mode

Files changed (1) hide show

Qwen3-1.7B-GGUF/Q4_0.json ADDED Viewed

+{
+  "inference_type": "llama.cpp/text-to-text",
+  "schema_version": "1.0.0",
+  "load_time_parameters": {
+    "model": "https://huggingface.co/unsloth/Qwen3-1.7B-GGUF/resolve/main/Qwen3-1.7B-Q4_0.gguf"
+  },
+  "generation_time_parameters": {
+    "sampling_parameters": {
+      "temperature": 0.7,
+      "top_p": 0.8,
+      "repetition_penalty": 1.5
+    }
+  }
+}