dongbobo
/

task-generator-benchmark-artifact

dongbobo commited on Jan 21

Commit

24f4979

verified ·

1 Parent(s): 5db0ea9

Upload submission/results.json with huggingface_hub

Files changed (1) hide show

submission/results.json ADDED Viewed

+{
+  "repo_name": "task-generator-benchmark-artifact",
+  "max_step": 1000,
+  "ordered_benchmarks": [
+    "code_generation",
+    "common_sense",
+    "creative_writing",
+    "dialogue_generation",
+    "instruction_following",
+    "knowledge_retrieval",
+    "logical_reasoning",
+    "math_reasoning",
+    "question_answering",
+    "reading_comprehension",
+    "safety_evaluation",
+    "sentiment_analysis",
+    "summarization",
+    "text_classification",
+    "translation"
+  ],
+  "scores": {
+    "code_generation": 0.2296,
+    "common_sense": 0.1144,
+    "creative_writing": 0.2872,
+    "dialogue_generation": 0.002,
+    "instruction_following": 0.116,
+    "knowledge_retrieval": 0.0116,
+    "logical_reasoning": 0.3168,
+    "math_reasoning": 0.1948,
+    "question_answering": 0.3828,
+    "reading_comprehension": 0.0908,
+    "safety_evaluation": 0.3308,
+    "sentiment_analysis": 0.3784,
+    "summarization": 0.1708,
+    "text_classification": 0.0128,
+    "translation": 0.0796
+  }
+}