Dans-DiscountModels
/

TinyMistral-v2.5-MiniPile-Guidelines-E1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Adding Evaluation Results

#1

by leaderboard-pr-bot - opened Mar 4, 2024

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

Files changed (1) hide show

README.md +20 -7

README.md CHANGED Viewed

@@ -1,16 +1,16 @@
 ---
 tags:
 - generated_from_trainer
 base_model: Locutusque/TinyMistral-248M-v2.5
 model-index:
 - name: TinyMistral-v2.5-MiniPile-Guidelines-E1/
   results: []
-datasets:
-- JeanKaddour/minipile
-- epfl-llm/guidelines
-license: apache-2.0
-language:
-- en
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -149,4 +149,17 @@ The following hyperparameters were used during training:
 - Transformers 4.37.0.dev0
 - Pytorch 2.0.1+cu117
 - Datasets 2.15.0
-- Tokenizers 0.15.0

 ---
+language:
+- en
+license: apache-2.0
 tags:
 - generated_from_trainer
+datasets:
+- JeanKaddour/minipile
+- epfl-llm/guidelines
 base_model: Locutusque/TinyMistral-248M-v2.5
 model-index:
 - name: TinyMistral-v2.5-MiniPile-Guidelines-E1/
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 - Transformers 4.37.0.dev0
 - Pytorch 2.0.1+cu117
 - Datasets 2.15.0
+- Tokenizers 0.15.0
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_Dans-DiscountModels__TinyMistral-v2.5-MiniPile-Guidelines-E1)
+|             Metric              |Value|
+|---------------------------------|----:|
+|Avg.                             |29.16|
+|AI2 Reasoning Challenge (25-Shot)|26.54|
+|HellaSwag (10-Shot)              |25.65|
+|MMLU (5-Shot)                    |23.44|
+|TruthfulQA (0-shot)              |49.90|
+|Winogrande (5-shot)              |49.41|
+|GSM8k (5-shot)                   | 0.00|