billyenrizky
/

ReFusion-8B-MDPO

Reinforcement Learning

discrete-flow-matching

web-action-planning

sequence-level-rl

Model card Files Files and versions

ReFusion-8B-MDPO / step_10

115 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

billyenrizky's picture

Upload ReFusion-8B-MDPO checkpoint

18b0049 verified 20 days ago