RedHatAI
/

DeepSeek-R1-Distill-Llama-8B-FP8-dynamic

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

nm-research commited on Feb 6, 2025

Commit

14375d3

·

verified ·

1 Parent(s): 105bf8d

add v1 evals

Files changed (1) hide show

README.md +8 -8

README.md CHANGED Viewed

@@ -141,14 +141,14 @@ lm_eval \
 | Metric                                   | deepseek-ai/DeepSeek-R1-Distill-Llama-8B             | neuralmagic-ent/DeepSeek-R1-Distill-Llama-8B-FP8-Dynamic |
 |-----------------------------------------|:---------------------------------:|:-------------------------------------------:|
-| ARC-Challenge (Acc-Norm, 25-shot)       |                             |                                        |
-| GSM8K (Strict-Match, 5-shot)            |          83.62                   |                                        |
-| HellaSwag (Acc-Norm, 10-shot)           |          77.09                   |             77.13                      |
-| MMLU (Acc, 5-shot)                      |                            |                                     |
-| TruthfulQA (MC2, 0-shot)                |          50.84                   |             50.61                      |
-| Winogrande (Acc, 5-shot)                |          68.03                   |             66.93                           |
-| **Average Score**                       | ****                        | ****                                   |
-| **Recovery (%)**                            | **100.00**                       | ****                                   |
 #### OpenLLM Leaderboard V2 evaluation scores

 | Metric                                   | deepseek-ai/DeepSeek-R1-Distill-Llama-8B             | neuralmagic-ent/DeepSeek-R1-Distill-Llama-8B-FP8-Dynamic |
 |-----------------------------------------|:---------------------------------:|:-------------------------------------------:|
+| ARC-Challenge (Acc-Norm, 25-shot)       |          45.05                   |               44.88                         |
+| GSM8K (Strict-Match, 5-shot)            |          62.77                   |              61.49                          |
+| HellaSwag (Acc-Norm, 10-shot)           |          76.78                   |             76.68                     |
+| MMLU (Acc, 5-shot)                      |          55.65                  |               55.82                      |
+| TruthfulQA (MC2, 0-shot)                |          50.55                   |             49.92                      |
+| Winogrande (Acc, 5-shot)                |          68.51                   |             67.72                           |
+| **Average Score**                       | **59.88**                        | **59.42**                                   |
+| **Recovery (%)**                            | **100.00**                       | **99.22**                                   |
 #### OpenLLM Leaderboard V2 evaluation scores