Spaces:

Ajay00747
/

Demo

Sleeping

App Files Files Community

Demo / training

3.17 MB

Ctrl+K

Ctrl+K

2 contributors

History: 5 commits

Ajayyy00

Add self-contained GRPO training notebook for HF Jupyter

1080341 2 months ago

CyberSOC_GRPO_Training.ipynb

32.9 kB
Add self-contained GRPO training notebook for HF Jupyter 2 months ago
__init__.py

0 Bytes
Initial commit of CyberSOC upgraded RLVR environment 2 months ago
agent_archive.py

3.02 kB
Add alternating self-play training scaffolding. 2 months ago
collect_sft.py

5.48 kB
Add root health check route to fix HF 404 2 months ago
collect_sft_data.py

4.28 kB
Initial commit of CyberSOC upgraded RLVR environment 2 months ago
config.py

2.6 kB
Add GRPO training pipeline + remove shield emoji 2 months ago
eval_harness.py

1.61 kB
Add alternating self-play training scaffolding. 2 months ago
freeze_alternate.py

10 kB
Add root health check route to fix HF 404 2 months ago
pfsp_scheduler.py

1.36 kB
Add alternating self-play training scaffolding. 2 months ago
reward_funcs.py

5.44 kB
Initial commit of CyberSOC upgraded RLVR environment 2 months ago
sft_data.jsonl

3.08 MB
Initial commit of CyberSOC upgraded RLVR environment 2 months ago
train_grpo.py

21.4 kB
Add alternating self-play training scaffolding. 2 months ago