ThomasCeraso
/

SmolLM2-FT-MyDataset

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

ThomasCeraso commited on Nov 3, 2025

Commit

a3e2c75

·

verified ·

1 Parent(s): ac67724

End of training

Files changed (3) hide show

README.md +4 -0
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -8,6 +8,8 @@ tags:
 - trl
 - sft
 - generated_from_trainer
 model-index:
 - name: SmolLM2-FT-MyDataset
   results: []
@@ -41,6 +43,8 @@ The following hyperparameters were used during training:
 - train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - training_steps: 300

 - trl
 - sft
 - generated_from_trainer
+- trl
+- sft
 model-index:
 - name: SmolLM2-FT-MyDataset
   results: []
 - train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 2
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - training_steps: 300

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0d245f3f614ad011aceacf08f21642cc9e8a7492077aa68d1ab32d48062b283
 size 538090408

 version https://git-lfs.github.com/spec/v1
+oid sha256:304f52aa02ffbd39ed3fb708c192519ec2f6b5ba0a2929f15fb341de5dd87b56
 size 538090408

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:366b359d7cd0bbcce8b4a43d40256954e83866f68e2ab267e91d964e63709454
 size 5841

 version https://git-lfs.github.com/spec/v1
+oid sha256:782894cf779fb098b13323e0259499b49562828a0e85ce9369daae2b6d8241db
 size 5841