ComparisonPO
/

Llama-3-Base-8B-DPO

Llama-3-Base-8B-DPO / README.md

Update README.md

6b2a4f5 verified 9 months ago

112 Bytes

metadata

license: mit
datasets:
  - trl-lib/ultrafeedback_binarized
base_model:
  - princeton-nlp/Llama-3-Base-8B-SFT