learn2pro
/

nanogpt

Generated from Trainer

Model card Files Files and versions

learn2pro commited on Apr 6, 2025

Commit

f069e73

·

verified ·

1 Parent(s): 6c8df5f

learn2pro/nanogpt

Files changed (3) hide show

README.md +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -37,7 +37,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- training_steps: 10000
 ### Training results

 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- training_steps: 50000
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4f337a133115ac63f253c0ac86118ae66c8b3176c4e2767b3b36be7388534042
 size 897639200

 version https://git-lfs.github.com/spec/v1
+oid sha256:76e6599c78c751af4d4f6d43682de9fddfe86ac12f502b92669c4f6670ba71af
 size 897639200

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84faf10ea136426e50ffaa8cf0244c8ca55a2087635f35959d9223dac3913dad
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:2264357e0cb830f8e3f011b501e55b507856b6faa4f712f10d1c2e21dab0c55e
 size 5368