Harshvir
/

Llama-2-7B-physics

Text Generation

text-generation-inference

Model card Files Files and versions

Llama-2-7B-physics / README.md

leaderboard-pr-bot's picture

leaderboard-pr-bot

Adding Evaluation Results

ace5084 over 2 years ago

|

922 Bytes

datasets:
  - camel-ai/physics

Trained on a sample of camel-ai/physics dataset.

Base Model: NousResearch/Llama-2-7b-chat-hf

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	45.44
ARC (25-shot)	52.9
HellaSwag (10-shot)	77.71
MMLU (5-shot)	48.83
TruthfulQA (0-shot)	48.93
Winogrande (5-shot)	71.9
GSM8K (5-shot)	7.05
DROP (3-shot)	10.78