add other quants

Files changed (5) hide show

README.md CHANGED Viewed

@@ -18,8 +18,10 @@ This repository contains the Chatter-70M model, a lightweight casual chat langua
 ## Model Variants
-- `model_q4_k_m.gguf`: 4-bit quantized version optimized for efficiency
-- `model_fp16.gguf`: 16-bit floating point version
 - `model.safetensors`: Original model weights in SafeTensors format
 ## Configuration Files

 ## Model Variants
+- `model-Q4_K_M.gguf`: 4-bit quantized version
+- `model-Q6_K.gguf`: 6-bit quantized version
+- `model-Q8_0.gguf`: 8-bit quantized version
+- `model-FP16.gguf`: 16-bit floating point version
 - `model.safetensors`: Original model weights in SafeTensors format
 ## Configuration Files

model_fp16.gguf → model-FP16.gguf RENAMED Viewed

File without changes

model_q4_k_m.gguf → model-Q4_K_M.gguf RENAMED Viewed

File without changes

model-Q6_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:16e94a57998d0ff4390b58e8010f9919b905d57dd7a3002b7fea296471652082
+size 58747808

model-Q8_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3cb568f72e3fee2a1d6f0f96b93ca36c9d2b7cfc3f392c6b3594bb01e652f92c
+size 75826080