Xorbits
/

chatglm2-6B-GGML

Bojun-Feng commited on Jul 6, 2023

Commit

14a1730

1 Parent(s): d8d84d4

Add q8_0 model to README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -19,7 +19,7 @@ GGML files are for CPU + GPU inference using [chatglm.cpp](https://github.com/li
 | chatglm2-ggml-q4_1.bin | q4_1 | 4 | 3.9 GB  |
 | chatglm2-ggml-q5_0.bin | q5_0 | 5 | 4.3 GB  |
 | chatglm2-ggml-q5_1.bin | q5_1 | 5 | 4.7 GB  |
-| chatglm2-ggml-q5_1.bin | q8_0 | 8 | 6.6 GB  |
 # How to run in xorbits-inference

 | chatglm2-ggml-q4_1.bin | q4_1 | 4 | 3.9 GB  |
 | chatglm2-ggml-q5_0.bin | q5_0 | 5 | 4.3 GB  |
 | chatglm2-ggml-q5_1.bin | q5_1 | 5 | 4.7 GB  |
+| chatglm2-ggml-q8_0.bin | q8_0 | 8 | 6.6 GB  |
 # How to run in xorbits-inference