Spaces:

iteratehack
/

deepbattler

Paused

App Files Files Community

deepbattler / RL

532 kB

Ctrl+K

Ctrl+K

2 contributors

History: 3 commits

lbtwyk

Update README to focus on RL training pipeline

fed1ca7 7 months ago

eval_battleground_rlaif.py

22.8 kB
Upload folder using huggingface_hub 7 months ago
eval_battleground_rlaif_gamehistory.py

25.6 kB
Upload folder using huggingface_hub 7 months ago
eval_gsm8k_qwen.py

27.8 kB
Upload folder using huggingface_hub 7 months ago
flatten_game_history.py

5.71 kB
Upload folder using huggingface_hub 7 months ago
gsm8k_test.json

381 kB
Upload folder using huggingface_hub 7 months ago
infer_battleground_cloud.py

11.8 kB
Update README to focus on RL training pipeline 7 months ago
rewrite_battleground_rewards.py

1.99 kB
Upload folder using huggingface_hub 7 months ago
train_battleground_rlaif.py

17.8 kB
Upload folder using huggingface_hub 7 months ago
train_battleground_rlaif_gamehistory.py

25.6 kB
Upload folder using huggingface_hub 7 months ago
train_gsm8k_qwen_grpo.py

12.7 kB
Upload folder using huggingface_hub 7 months ago