dipta007
/

dagger-4B_GRPO

Text Generation

computational-graph

distractor-aware

reinforcement-learning

text-generation-inference

Model card Files Files and versions

dagger-4B_GRPO / tokenizer_config.json

dipta007's picture

Upload folder using huggingface_hub

746b6c2 verified 12 days ago

history contribute delete

1.16 MB

File too large to display, you can check the raw version instead.