daytoy-models
/

test

Afar

Venda

Eval Results

Model card Files Files and versions

xet

Community

daytoy-models commited on Jan 18, 2024

Commit

fc55c6b

verified ·

1 Parent(s): 8b9e0b3

Update README.md

Browse files

Files changed (1) hide show

README.md +185 -6

README.md CHANGED Viewed

@@ -1,4 +1,185 @@
-   type: nuprl/MultiPL-E
       name: MultiPL-HumanEval (R)
     metrics:
     - name: pass@1
@@ -75,11 +256,9 @@
       type: pass@1
       value: 0.3229
       verified: false
-extra_gated_prompt: >-
-  ## Model License Agreement Please read the BigCode [OpenRAIL-M
-  license](https://huggingface.co/spaces/bigcode/bigcode-model-license-agreement)
-  agreement before accepting it.
 extra_gated_fields:
   I accept the above license agreement, and will use the Model complying with the set of use restrictions and sharing requirements: checkbox
 language:

+---
+pipeline_tag: text-generation
+inference: true
+widget:
+- text: 'def print_hello_world():'
+  example_title: Hello world
+  group: Python
+license: bigcode-openrail-m
+datasets:
+- bigcode/the-stack-dedup
+metrics:
+- code_eval
+library_name: transformers
+tags:
+- code
+model-index:
+- name: StarCoder
+  results:
+  - task:
+      type: text-generation
+    dataset:
+      type: openai_humaneval1
+      name: HumanEval1
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.408
+      verified: false
+    - name: pass@2
+      type: pass@2
+      value: 0.12345
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: openai_humaneval
+      name: HumanEval
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value:
+        dataset:
+          type: openai_humaneval
+          name: HumanEval
+      args: haha
+      verified: false
+- name: StarCoder2
+  results:
+  - task:
+      type: text-generation
+    dataset:
+      type: mbpp
+      name: MBPP
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.527
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: ds1000
+      name: DS-1000 (Overall Completion)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.26
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (C++)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3155
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (C#)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.2101
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (D)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.1357
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Go)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.1761
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Java)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3022
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Julia)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.2302
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (JavaScript)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3079
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Lua)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.2389
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (PHP)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.2608
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Perl)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.1734
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL-HumanEval (Python)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 0.3357
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: nuprl/MultiPL-E
       name: MultiPL-HumanEval (R)
     metrics:
     - name: pass@1
       type: pass@1
       value: 0.3229
       verified: false
+extra_gated_prompt: "## Model License Agreement Please read the BigCode [OpenRAIL-M\
+  \ license](https://huggingface.co/spaces/bigcode/bigcode-model-license-agreement)\
+  \ agreement before accepting it.\n  "
 extra_gated_fields:
   I accept the above license agreement, and will use the Model complying with the set of use restrictions and sharing requirements: checkbox
 language: