instruction-pretrain
/

InstructLM-500M

Text Generation

text-generation-inference

Model card Files Files and versions

instruction-pretrain commited on Jun 19, 2024

Commit

8a5e3ac

·

verified ·

1 Parent(s): 6bcbd8a

Update README.md

Files changed (1) hide show

README.md +8 -1

README.md CHANGED Viewed

@@ -1,3 +1,10 @@
 # Instruction Pre-Training: Language Models are Supervised Multitask Learners
 This repo contains the **context-based instruction synthesizer** used in our paper **Instruction Pre-Training: Language Models are Supervised Multitask Learners**.
@@ -22,7 +29,7 @@ pip install -e .
 2. Evalaute
 ```bash
 MODEL=instruction-pretrain/InstructLM-500M
-add_bos_token=True # this flag is needed because lm-eval-harness set add_bos_token to False by default, but ours require add_bos_token to be True
 accelerate launch -m lm_eval --model hf \
     --model_args pretrained=${MODEL},add_bos_token=${add_bos_token},dtype=float16  \

+---
+license: apache-2.0
+datasets:
+- tiiuae/falcon-refinedweb
+language:
+- en
+---
 # Instruction Pre-Training: Language Models are Supervised Multitask Learners
 This repo contains the **context-based instruction synthesizer** used in our paper **Instruction Pre-Training: Language Models are Supervised Multitask Learners**.
 2. Evalaute
 ```bash
 MODEL=instruction-pretrain/InstructLM-500M
+add_bos_token=True # this flag is needed because lm-eval-harness set add_bos_token to False by default, but ours requires add_bos_token to be True
 accelerate launch -m lm_eval --model hf \
     --model_args pretrained=${MODEL},add_bos_token=${add_bos_token},dtype=float16  \