Update README_zh.md
Browse files- README_zh.md +4 -0
README_zh.md
CHANGED
|
@@ -112,6 +112,10 @@ FLM-101B的训练代码基于Megatron-LM框架修改,将在近期开源。
|
|
| 112 |
FLM-101B 现阶段训练的 token 数比较少,在知识(特别是专业知识)方面有较大进步空间。另一方面,模型的推理目前没有进行优化因此推理资源占用较高,速度受限。为此,我们将很快在推理侧支持Flash Attention。
|
| 113 |
如果您对这两方面,或其他方面有改进需求,欢迎在 github 提issue,我们会尽快响应。谢谢!
|
| 114 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 115 |
## 引用
|
| 116 |
|
| 117 |
<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
|
|
|
|
| 112 |
FLM-101B 现阶段训练的 token 数比较少,在知识(特别是专业知识)方面有较大进步空间。另一方面,模型的推理目前没有进行优化因此推理资源占用较高,速度受限。为此,我们将很快在推理侧支持Flash Attention。
|
| 113 |
如果您对这两方面,或其他方面有改进需求,欢迎在 github 提issue,我们会尽快响应。谢谢!
|
| 114 |
|
| 115 |
+
## 致谢
|
| 116 |
+
|
| 117 |
+
本项目受国家科技重大专项(No. 2022ZD0116314)支持。
|
| 118 |
+
|
| 119 |
## 引用
|
| 120 |
|
| 121 |
<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
|