leoterry commited on
Commit
5d5163c
·
1 Parent(s): 7553d50

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -1
README.md CHANGED
@@ -3,4 +3,11 @@ license: apache-2.0
3
  language:
4
  - zh
5
  - en
6
- ---
 
 
 
 
 
 
 
 
3
  language:
4
  - zh
5
  - en
6
+ ---
7
+ - 使用chatglm.cpp这个工具来进行模型量化,它是基于GGML库实现的量化工具,除了可以量化 ChatGLM 系列的 LLM 外,还支持其他比如 BaiChuan、CodeGeeX、InternLM 等 LLM 的量化。
8
+ chatglm.cpp 除了提供量化功能外,还提供了多种运行量化模型的方式,包括源码编译运行、Python 代码运行、 Web 服务和 API 服务等,这些运行方式可以让我们在不同的场景下使用量化后的模型。
9
+ - 基础模型:chatglm3-6b
10
+ - 使用q4_0这个量化类型来进行量化,其他的量化类型可以参考 chatglm.cpp 的文档。
11
+ ```
12
+ python chatglm.cpp/chatglm_cpp/convert.py -i ./chatglm3-6b -t q4_0 -o chatglm-ggml.bin
13
+ ```