AngelRaychev
/

0.5B-policy-iteration_2

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

0.5B-policy-iteration_2 / policy_final_model /tokenizer.json

Commit History

Model save

26fa323
verified

AngelRaychev commited on May 10, 2025