Spaces:

Dev-CrafterX
/

preference-lab

Sleeping

App Files Files Community

preference-lab / tests

Commit History

fix: clamp grader rewards to strictly (0, 1) to pass OpenEnv validation bounds

f3f7bc4

Sibam commited on Apr 7

feat: PreferenceLab complete - RLHF preference simulation OpenEnv environment

b9664a2

Sibam commited on Apr 5

fix: conform to OpenEnv base interface contract

7574c9a

Sibam commited on Apr 5

PreferenceLab OpenEnv environment for RLHF preference simulation

cdf485e

Sibam commited on Apr 4