Phat-Dat
/

Llama-3.2-1B-RLHF-DPO

Text Generation

text-generation-inference

Model card Files Files and versions

Llama-3.2-1B-RLHF-DPO

Commit History

Add tokenizer

12fd15f
verified

Phat-Dat commited on Nov 11, 2025

Add DPO (RLHF) aligned model ckpt

562bc0c
verified

Phat-Dat commited on Nov 11, 2025

initial commit

0c1d3f8
verified

Phat-Dat commited on Nov 11, 2025