andrewlngdn
/

dsl-debug-7b-rl-only-step30

Text Generation

reinforcement-learning

Model card Files Files and versions

dsl-debug-7b-rl-only-step30 / tokenizer.json

andrewlngdn's picture

Upload rl_only_step30 (publishable run)

a92caec verified about 1 month ago

history contribute delete

7.03 MB

File too large to display, you can check the raw version instead.