zz1358m
/

SofT-GRPO-master

Model card Files Files and versions

Metrics Training metrics Community

SofT-GRPO-master

52.2 GB

Ctrl+K

Ctrl+K

1 contributor

History: 14 commits

zz1358m's picture

Update SofT-GRPO-deepscaler-8k-llama3.sh

eca69d7 verified 6 months ago