ggerganov
/

presets

ggerganov HF Staff commited on Jan 27

Commit

3e4b4d8

verified ·

1 Parent(s): 8afd2c6

presets : add GLM4.7 flash without thinking

Files changed (1) hide show

preset.ini CHANGED Viewed

@@ -165,7 +165,16 @@ batch-size  = 4096
 ubatch-size = 4096
 top-p       = 0.95
 top-k       = 0
-min-p       = 0.01
 temp        = 1.0
 [nemotron-nano-3-30b-hf]

 ubatch-size = 4096
 top-p       = 0.95
 top-k       = 0
+temp        = 0.2
+chat-template-kwargs = {"enable_thinking": false}
+[glm-4.7-flash-hf-thinking]
+hf          = ggml-org/GLM-4.7-Flash-GGUF:Q8_0
+ctx-size    = 202752
+batch-size  = 4096
+ubatch-size = 4096
+top-p       = 0.95
+top-k       = 0
 temp        = 1.0
 [nemotron-nano-3-30b-hf]