osanseviero
/

sft_cml4

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

osanseviero commited on Nov 18, 2023

Commit

7cc090b

·

1 Parent(s): d68d31e

End of training

Files changed (3) hide show

README.md +5 -5
generation_config.json +1 -1
pytorch_model.bin +1 -1

README.md CHANGED Viewed

@@ -17,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on the ag_news dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.6075
 ## Model description
@@ -48,14 +48,14 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.1508        | 0.53  | 200  | 3.5989          |
-| 2.6464        | 1.07  | 400  | 3.6581          |
-| 1.74          | 1.6   | 600  | 3.6075          |
 ### Framework versions
-- Transformers 4.34.0.dev0
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.4
 - Tokenizers 0.14.0

 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on the ag_news dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.5432
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.52          | 0.53  | 200  | 3.6018          |
+| 2.8991        | 1.07  | 400  | 3.5992          |
+| 1.8674        | 1.6   | 600  | 3.5432          |
 ### Framework versions
+- Transformers 4.34.1
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.4
 - Tokenizers 0.14.0

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.34.0.dev0"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.34.1"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:981e80027b33da4f4a0601fcba83709aa63ffc732030ccb9ec8f00a9d3a1b09f
 size 497807197

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4b2baefa577d53e0c231d4756deae06559d3df76eaadab00aac51d98b538765
 size 497807197