rokugatsu
/

LLM2025_Advanced_DPO_5

Commit History

Upload DPO-trained Qwen3-4B-Instruct-2507 model

561bb07
verified

rokugatsu commited on 1 day ago