lole25
/

phi-2-ipo-ultrafeedback-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

phi-2-ipo-ultrafeedback-lora

45.5 MB

1 contributor

History: 11 commits

lole25's picture

End of training

253e24c verified about 2 years ago