ClueAI
/

ChatYuan-7B

Text Generation

text2text-generation

text-generation-inference

Model card Files Files and versions

ClueAI commited on Jun 3, 2023

Commit

08392eb

·

1 Parent(s): be30bc4

Update README.md

Files changed (1) hide show

README.md +8 -3

README.md CHANGED Viewed

@@ -1,9 +1,13 @@
 ---
 language:
-- en
 - zh
-license: gpl-3.0
 ---
 ChatYuan-7B是一个支持中英双语的功能型对话语言大模型。它是基于LLama-7B模型上继续进行三阶段训练的模型。
 三阶段如下：
 1. 在中文通用语料上继续预训练500亿中文token
@@ -17,7 +21,8 @@ ChatYuan-7B是一个支持中英双语的功能型对话语言大模型。它是
 为了遵守LLaMA模型许可证，我们将ChatYuan-7B权重发布为增量权重。您可以将我们的增量权重与原始的LLaMA权重相加，得到ChatYuan-7B权重。
 1. 通过原始[LLaMA-7B](https://github.com/facebookresearch/llama)生成LLaMA的hf模型(LLaMA-7B-HF)，可以参考[指导](https://huggingface.co/docs/transformers/main/model_doc/llama), 也可以直接使用[llama-7b-hf](https://huggingface.co/decapoda-research/llama-7b-hf)
-2. 合并LLaMA-7B的hf模型和ChatYuan-7B模型
 ### 合并脚本
 ```shell
 python3 apply_delta.py --base ~/model_weights/LLaMA-7B-HF --delta ~/model_weights/ChatYuan-7B --target ~/model_weights/ChatYuan-7B-merge

 ---
+license: gpl-3.0
+tags:
+- text2text-generation
+pipeline_tag: text2text-generation
 language:
 - zh
+- en
 ---
 ChatYuan-7B是一个支持中英双语的功能型对话语言大模型。它是基于LLama-7B模型上继续进行三阶段训练的模型。
 三阶段如下：
 1. 在中文通用语料上继续预训练500亿中文token
 为了遵守LLaMA模型许可证，我们将ChatYuan-7B权重发布为增量权重。您可以将我们的增量权重与原始的LLaMA权重相加，得到ChatYuan-7B权重。
 1. 通过原始[LLaMA-7B](https://github.com/facebookresearch/llama)生成LLaMA的hf模型(LLaMA-7B-HF)，可以参考[指导](https://huggingface.co/docs/transformers/main/model_doc/llama), 也可以直接使用[llama-7b-hf](https://huggingface.co/decapoda-research/llama-7b-hf)
+2. 合并LLaMA-7B的hf模型和ChatYuan-7B模型成ChatYuan-7B-merge
 ### 合并脚本
 ```shell
 python3 apply_delta.py --base ~/model_weights/LLaMA-7B-HF --delta ~/model_weights/ChatYuan-7B --target ~/model_weights/ChatYuan-7B-merge