CausalLM
/

14B

Text Generation

text-generation-inference

Model card Files Files and versions

JosephusCheung commited on Nov 5, 2023

Commit

a0e926c

·

1 Parent(s): 97ca638

Update README.md

Files changed (1) hide show

README.md +12 -0

README.md CHANGED Viewed

@@ -188,6 +188,18 @@ STEM准确率：66.71
 在 [AlpacaEval Leaderboard](https://tatsu-lab.github.io/alpaca_eval/) 胜率 **88.26%** [view raw](https://github.com/tatsu-lab/alpaca_eval/blob/3a47dcd81c56f6a8e6a5711f2754013919fbe90a/results/causallm-14b/model_outputs.json)
 ## 其他语言
 我们目前无法为非 QA 任务（英语和中文以外的语言）生成准确的基准模板。 不过，我们将在不久的将来开发其他语言版本的 QA-Task 挑战。
 ### 日文基准

 在 [AlpacaEval Leaderboard](https://tatsu-lab.github.io/alpaca_eval/) 胜率 **88.26%** [view raw](https://github.com/tatsu-lab/alpaca_eval/blob/3a47dcd81c56f6a8e6a5711f2754013919fbe90a/results/causallm-14b/model_outputs.json)
+## DPO 版本的 MT-Behch
+| Model                     | MT-Bench     |
+| ------------------------- | ------------ |
+| GPT-4                     | 8.99         |
+| GPT-3.5-Turbo             | 7.94         |
+|                           |              |
+| Zephyr-7b-β (Overfitting) | 7.34         |
+| Zephyr-7b-α               | 6.88         |
+|                           |              |
+| **[CausalLM/14B-DPO-α](https://huggingface.co/CausalLM/14B-DPO-alpha)**    | **7.618868** |
+| **[CausalLM/7B-DPO-α](https://huggingface.co/CausalLM/7B-DPO-alpha)**     | **7.038125** |
 ## 其他语言
 我们目前无法为非 QA 任务（英语和中文以外的语言）生成准确的基准模板。 不过，我们将在不久的将来开发其他语言版本的 QA-Task 挑战。
 ### 日文基准