billyenrizky
/

ReFusion-8B-MDPO

Reinforcement Learning

discrete-flow-matching

web-action-planning

sequence-level-rl

Model card Files Files and versions

ReFusion-8B-MDPO

460 MB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

billyenrizky's picture

Update research title to: Concentrate or Collapse

2da374e verified about 2 months ago