CausalLM
/

7B

Text Generation

text-generation-inference

Model card Files Files and versions

JosephusCheung commited on Nov 5, 2023

Commit

e4a0d4d

·

1 Parent(s): 4d49d73

Update README.md

Files changed (1) hide show

README.md +25 -1

README.md CHANGED Viewed

@@ -90,6 +90,18 @@ Hard acc:48.03
 **Zero-shot ACC 0.5921152388172858** (Outperforms WizardMath-7B and Qwen-7B)
 # 因果语言模型 7B - 与 Meta LLaMA 2 完全兼容
 使用无需远程/外部代码的transformers库加载模型，AutoModelForCausalLM和AutoTokenizer（或者手动指定LlamaForCausalLM加载LM， GPT2Tokenizer加载Tokenizer），并且模型量化与GGUF（llama.cpp）、GPTQ、AWQ完全兼容。
@@ -144,4 +156,16 @@ STEM准确率：61.67
 ## GSM8K
-**零样本准确率0.5921152388172858** （优于WizardMath-7B和Qwen-7B）

 **Zero-shot ACC 0.5921152388172858** (Outperforms WizardMath-7B and Qwen-7B)
+## MT-Behch on DPO Version
+| Model                     | MT-Bench     |
+| ------------------------- | ------------ |
+| GPT-4                     | 8.99         |
+| GPT-3.5-Turbo             | 7.94         |
+|                           |              |
+| Zephyr-7b-β (Overfitting) | 7.34         |
+| Zephyr-7b-α               | 6.88         |
+|                           |              |
+| **[CausalLM/14B-DPO-α](https://huggingface.co/CausalLM/14B-DPO-alpha)**    | **7.618868** |
+| **[CausalLM/7B-DPO-α](https://huggingface.co/CausalLM/7B-DPO-alpha)**     | **7.038125** |
 # 因果语言模型 7B - 与 Meta LLaMA 2 完全兼容
 使用无需远程/外部代码的transformers库加载模型，AutoModelForCausalLM和AutoTokenizer（或者手动指定LlamaForCausalLM加载LM， GPT2Tokenizer加载Tokenizer），并且模型量化与GGUF（llama.cpp）、GPTQ、AWQ完全兼容。
 ## GSM8K
+**零样本准确率0.5921152388172858** （优于WizardMath-7B和Qwen-7B）
+## DPO 版本的 MT-Behch
+| Model                     | MT-Bench     |
+| ------------------------- | ------------ |
+| GPT-4                     | 8.99         |
+| GPT-3.5-Turbo             | 7.94         |
+|                           |              |
+| Zephyr-7b-β (Overfitting) | 7.34         |
+| Zephyr-7b-α               | 6.88         |
+|                           |              |
+| **[CausalLM/14B-DPO-α](https://huggingface.co/CausalLM/14B-DPO-alpha)**    | **7.618868** |
+| **[CausalLM/7B-DPO-α](https://huggingface.co/CausalLM/7B-DPO-alpha)**     | **7.038125** |