GOVINDFROM
/

MindGamesColonelBlutto

Reinforcement Learning

graph-neural-networks

preference-learning

llm-distillation

Model card Files Files and versions

MindGamesColonelBlutto / dpo_model

16.1 GB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

GOVINDFROM's picture

Upload DPO model

83fc425 verified 4 months ago