dfrees
/

llama-1b-instruct-dpo

4-bit precision

Model card Files Files and versions

llama-1b-instruct-dpo / training_args.bin

Commit History

Uploading merged DPO-trained model

11e04b0
verified

dfrees commited on Oct 8, 2024

Uploading merged DPO-trained model

350e24b
verified

dfrees commited on Oct 8, 2024

Uploading merged DPO-trained model

411221a
verified

dfrees commited on Oct 8, 2024