nm-testing
/

Llama-3.1-70B-Instruct-FP8-block

Text Generation

compressed-tensors

Model card Files Files and versions

krishnateja95 commited on Oct 14, 2025

Commit

27f1436

·

verified ·

1 Parent(s): 0a7399a

Update README.md

Files changed (1) hide show

README.md +120 -1

README.md CHANGED Viewed

@@ -166,4 +166,123 @@ The model was evaluated on the OpenLLMv1 leaderboard task, using [lm-evaluation-
   ```
-</details>

   ```
+</details>
+### Accuracy
+<table>
+  <thead>
+    <tr>
+      <th>Category</th>
+      <th>Metric</th>
+      <th>meta-llama/Llama-3.1-70B-Instruct</th>
+      <th>nm-testing/Llama-3.1-70B-Instruct-FP8-block</th>
+      <th>Recovery (%)</th>
+    </tr>
+  </thead>
+  <tbody>
+    <!-- OpenLLM Leaderboard V1 -->
+    <tr>
+      <td rowspan="7"><b>OpenLLM V1</b></td>
+      <td>ARC-Challenge (Acc-Norm, 25-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>GSM8K (Strict-Match, 5-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>HellaSwag (Acc-Norm, 10-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>MMLU (Acc, 5-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>TruthfulQA (MC2, 0-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>Winogrande (Acc, 5-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td><b>Average Score</b></td>
+      <td><b>abc</b></td>
+      <td><b>ijk</b></td>
+      <td><b>xyz</b></td>
+    </tr>
+    <!-- OpenLLM Leaderboard V2 -->
+    <tr>
+      <td rowspan="7"><b>OpenLLM V2</b></td>
+      <td>IFEval (Inst Level Strict Acc, 0-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>BBH (Acc-Norm, 3-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>Math-Hard (Exact-Match, 4-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>GPQA (Acc-Norm, 0-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>MUSR (Acc-Norm, 0-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td>MMLU-Pro (Acc, 5-shot)</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td>xyz</td>
+    </tr>
+    <tr>
+      <td><b>Average Score</b></td>
+      <td><b>abc</b></td>
+      <td><b>ijk</b></td>
+      <td><b>xyz</b></td>
+    </tr>
+    <!-- HumanEval -->
+    <tr>
+      <td rowspan="2"><b>Coding</b></td>
+      <td>HumanEval Pass@1</td>
+      <td>abc</td>
+      <td>ijk</td>
+      <td><b>xyz</b></td>
+    </tr>
+  </tbody>
+</table>