Spaces:

thepikachu
/

architecture-env

Running

App Files Files Community

architecture-env / training

21.8 kB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

thepikachu's picture

Add scripts for supervised fine-tuning and GRPO training

adcad94 about 2 months ago

make_sft_dataset.py

6 kB
Add scripts for supervised fine-tuning and GRPO training about 2 months ago
train_grpo.py

13.2 kB
Add scripts for supervised fine-tuning and GRPO training about 2 months ago
train_sft.py

2.57 kB
Add scripts for supervised fine-tuning and GRPO training about 2 months ago