dipta007
/

dagger-12B_GRPO

Text Generation

computational-graph

distractor-aware

reinforcement-learning

Model card Files Files and versions

dagger-12B_GRPO

Commit History

updated readme (#1)

ed28a17
verified

zabir-nabil commited on Jan 14

Update README.md

0746d80
verified

dipta007 commited on Jan 11

Create README.md

72c58cb
verified

dipta007 commited on Jan 11

Upload folder using huggingface_hub

707e99c
verified

dipta007 commited on Jan 4

initial commit

bc3d6a4
verified

dipta007 commited on Jan 4