rus_gpt2 / README.md

Model save

48b82f6 verified over 1 year ago

1.57 kB

metadata

license: mit
base_model: gpt2
tags:
  - generated_from_trainer
model-index:
  - name: rus_gpt2
    results: []

rus_gpt2

This model is a fine-tuned version of gpt2 on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

Training Loss	Epoch	Step	Validation Loss
4.8953	0.1698	1000	3.4876
3.367	0.3396	2000	3.1754
3.1352	0.5094	3000	2.9977
2.9605	0.6792	4000	2.8416
2.8138	0.8490	5000	2.7236