GiuLeo01
/

FortranCodeGen-3B-SynthData

Text Generation

reinforcement learning

text-generation-inference

Model card Files Files and versions

GiuLeo01 commited on May 19, 2025

Commit

ebf798f

·

verified ·

1 Parent(s): 8a8b995

Update README.md

Files changed (1) hide show

README.md +14 -1

README.md CHANGED Viewed

@@ -103,6 +103,19 @@ By guiding generation through specific topics, I built a synthetic dataset of 30
 #### Supervised Fine-Tuning
-![Training Loss](./path/to/sft_training_loss_plot.png)

 #### Supervised Fine-Tuning
+Il dataset di esempi annotati è stato diviso in train e validation (0.8 0.2), ed è stato usato per fare full fine-tuning al modello.
+Sono state effettuate 10 epoche di addestramento.
+Gli iperparametri rilevanti sono stati:
+- batch size = 4
+- gradient accumulation steps = 4
+- learning rate = 2e-5
+- lr scheduler type = cosine
+- weight decay = 0.01
+![Training Loss](./path/to/sft_train_loss_plot.png)
+![Evaluation Loss](./path/to/sft_eval_loss_plot.png)