Model save

Files changed (6) hide show

README.md CHANGED Viewed

@@ -2,15 +2,12 @@
 license: mit
 base_model: gpt2
 tags:
-- alignment-handbook
-- trl
-- sft
-- generated_from_trainer
 - trl
 - sft
 - generated_from_trainer
 datasets:
-- shahadalkhalifa/Crypto_Whitepaper_Labeled
 model-index:
 - name: gpt2-cpt-white
   results: []
@@ -21,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 # gpt2-cpt-white
-This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on the shahadalkhalifa/Crypto_Whitepaper_Labeled dataset.
 ## Model description

 license: mit
 base_model: gpt2
 tags:
 - trl
 - sft
+- alignment-handbook
 - generated_from_trainer
 datasets:
+- generator
 model-index:
 - name: gpt2-cpt-white
   results: []
 # gpt2-cpt-white
+This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on the generator dataset.
 ## Model description

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "train_loss": 6.083620756864548,
-    "train_runtime": 28.044,
     "train_samples": 91,
-    "train_samples_per_second": 35.801,
     "train_steps_per_second": 0.571
 }

 {
     "epoch": 4.0,
     "train_loss": 6.083620756864548,
+    "train_runtime": 28.0153,
     "train_samples": 91,
+    "train_samples_per_second": 35.838,
     "train_steps_per_second": 0.571
 }

config.json CHANGED Viewed

@@ -34,6 +34,6 @@
   },
   "torch_dtype": "bfloat16",
   "transformers_version": "4.39.0.dev0",
-  "use_cache": true,
   "vocab_size": 50257
 }

   },
   "torch_dtype": "bfloat16",
   "transformers_version": "4.39.0.dev0",
+  "use_cache": false,
   "vocab_size": 50257
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "train_loss": 6.083620756864548,
-    "train_runtime": 28.044,
     "train_samples": 91,
-    "train_samples_per_second": 35.801,
     "train_steps_per_second": 0.571
 }

 {
     "epoch": 4.0,
     "train_loss": 6.083620756864548,
+    "train_runtime": 28.0153,
     "train_samples": 91,
+    "train_samples_per_second": 35.838,
     "train_steps_per_second": 0.571
 }

trainer_state.json CHANGED Viewed

@@ -41,8 +41,8 @@
       "step": 16,
       "total_flos": 535126081536000.0,
       "train_loss": 6.083620756864548,
-      "train_runtime": 28.044,
-      "train_samples_per_second": 35.801,
       "train_steps_per_second": 0.571
     }
   ],

       "step": 16,
       "total_flos": 535126081536000.0,
       "train_loss": 6.083620756864548,
+      "train_runtime": 28.0153,
+      "train_samples_per_second": 35.838,
       "train_steps_per_second": 0.571
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ba7aad08f79b4b82f8d2e7069e009b925897569aebe186ceb0472cbbb86765b
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:f72678b2a88de20abefeb92c2713630bc7eb0c9a518ff85944dd79fb87d3dabb
 size 4984