mlfoundations-dev
/

dpo_from_multiple_samples_shortest_numina_aime

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

dpo_from_multiple_samples_shortest_numina_aime

Commit History

Upload configs.yaml with huggingface_hub

b597105
verified

sedrickkeh commited on Feb 6, 2025

End of training

1c793df
verified

sedrickkeh commited on Feb 6, 2025

Model save

860f585
verified

sedrickkeh commited on Feb 6, 2025

Training in progress, epoch 0

863ff76
verified

sedrickkeh commited on Feb 6, 2025

initial commit

508dd15
verified

sedrickkeh commited on Feb 6, 2025