Samzy17
/

gemma-9b-sft

Model card Files Files and versions

gemma-9b-sft / README.md

Samzy17's picture

Create README.md

1b400b6 verified 4 days ago

|

history blame contribute delete

256 Bytes

	Trained on 1600 samples of LM-SYS conversational data having undergone the [REFLECT](https://arxiv.org/pdf/2601.18730) process.

	Official finetuned model using REFLECT generated for analyzing trend in KL Divergence against Winrate as training progresses.