trl-lib
/

rloo_tldr

@@ -1,5 +1,6 @@
 ---
 base_model: cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr
 library_name: transformers
 model_name: rloo_tldr
 tags:
@@ -11,7 +12,7 @@ licence: license
 # Model Card for rloo_tldr
-This model is a fine-tuned version of [cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr](https://huggingface.co/cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
 base_model: cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr
+datasets: trl-lib/tldr
 library_name: transformers
 model_name: rloo_tldr
 tags:
 # Model Card for rloo_tldr
+This model is a fine-tuned version of [cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr](https://huggingface.co/cleanrl/EleutherAI_pythia-1b-deduped__sft__tldr) on the [trl-lib/tldr](https://huggingface.co/datasets/trl-lib/tldr) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start