First model version

Browse files

Files changed (13) hide show

checkpoint-109/added_tokens.json +3 -0
checkpoint-109/config.json +46 -0
checkpoint-109/merges.txt +0 -0
checkpoint-109/model.safetensors +3 -0
checkpoint-109/optimizer.pt +3 -0
checkpoint-109/rng_state.pth +3 -0
checkpoint-109/scheduler.pt +3 -0
checkpoint-109/special_tokens_map.json +30 -0
checkpoint-109/tokenizer.json +0 -0
checkpoint-109/tokenizer_config.json +30 -0
checkpoint-109/trainer_state.json +270 -0
checkpoint-109/training_args.bin +3 -0
checkpoint-109/vocab.json +0 -0

checkpoint-109/added_tokens.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+  "[PAD]": 50257
+}

checkpoint-109/config.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "_name_or_path": "./rlaif/gpt2/summarization/tldr/exps/sft/2025-02-14 11:12:57.316850/checkpoint-1824",
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2ForSequenceClassification"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 50256,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 50256,
+  "id2label": {
+    "0": "LABEL_0"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "LABEL_0": 0
+  },
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 1280,
+  "n_head": 20,
+  "n_inner": null,
+  "n_layer": 36,
+  "n_positions": 1024,
+  "pad_token_id": 50257,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "max_length": 50
+    }
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.3",
+  "use_cache": false,
+  "vocab_size": 50258
+}

checkpoint-109/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-109/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cec61238609e61e5bdc7e0b8ba15a538dc347f0e568f0c2358b5efb24c76242d
+size 3096176240

checkpoint-109/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a5fb7bfd61b86c6fa2e773b805cd400f6b20515853360822538be94c14179324
+size 6192635305

checkpoint-109/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:08aee9b47408c88c0160058be14e5ec56f680f6382b1beba43c04fa5eb38904a
+size 14244

checkpoint-109/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96b5aae5390b1962f00771adfdcb7f413d4f45e990cdf8e60681aa0bc0feee09
+size 1064

checkpoint-109/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-109/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-109/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "50256": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50257": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|endoftext|>",
+  "extra_special_tokens": {},
+  "model_max_length": 1024,
+  "pad_token": "[PAD]",
+  "padding_side": "right",
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|endoftext|>"
+}

checkpoint-109/trainer_state.json ADDED Viewed

	@@ -0,0 +1,270 @@

+{
+  "best_metric": 0.7077131258457375,
+  "best_model_checkpoint": "./rlaif/gpt2/summarization/tldr/exps/rm/2025-02-20_17-35-37.568836/checkpoint-40",
+  "epoch": 0.9931662870159453,
+  "eval_steps": 10,
+  "global_step": 109,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04555808656036447,
+      "grad_norm": 0.4330473244190216,
+      "learning_rate": 9.541284403669725e-05,
+      "loss": 0.6941,
+      "step": 5
+    },
+    {
+      "epoch": 0.09111617312072894,
+      "grad_norm": 0.43270525336265564,
+      "learning_rate": 9.08256880733945e-05,
+      "loss": 0.6853,
+      "step": 10
+    },
+    {
+      "epoch": 0.09111617312072894,
+      "eval_accuracy": 0.6617050067658998,
+      "eval_loss": 0.6401128768920898,
+      "eval_runtime": 107.2999,
+      "eval_samples_per_second": 6.887,
+      "eval_steps_per_second": 0.69,
+      "step": 10
+    },
+    {
+      "epoch": 0.1366742596810934,
+      "grad_norm": 0.873494565486908,
+      "learning_rate": 8.623853211009176e-05,
+      "loss": 0.6626,
+      "step": 15
+    },
+    {
+      "epoch": 0.18223234624145787,
+      "grad_norm": 1.3137083053588867,
+      "learning_rate": 8.165137614678899e-05,
+      "loss": 0.6088,
+      "step": 20
+    },
+    {
+      "epoch": 0.18223234624145787,
+      "eval_accuracy": 0.6698240866035182,
+      "eval_loss": 0.5892247557640076,
+      "eval_runtime": 107.3781,
+      "eval_samples_per_second": 6.882,
+      "eval_steps_per_second": 0.689,
+      "step": 20
+    },
+    {
+      "epoch": 0.22779043280182232,
+      "grad_norm": 0.799824595451355,
+      "learning_rate": 7.706422018348625e-05,
+      "loss": 0.6396,
+      "step": 25
+    },
+    {
+      "epoch": 0.2733485193621868,
+      "grad_norm": 0.9413164854049683,
+      "learning_rate": 7.247706422018348e-05,
+      "loss": 0.6112,
+      "step": 30
+    },
+    {
+      "epoch": 0.2733485193621868,
+      "eval_accuracy": 0.7009472259810555,
+      "eval_loss": 0.5853174924850464,
+      "eval_runtime": 107.3138,
+      "eval_samples_per_second": 6.886,
+      "eval_steps_per_second": 0.69,
+      "step": 30
+    },
+    {
+      "epoch": 0.31890660592255127,
+      "grad_norm": 0.8462890386581421,
+      "learning_rate": 6.788990825688074e-05,
+      "loss": 0.6252,
+      "step": 35
+    },
+    {
+      "epoch": 0.36446469248291574,
+      "grad_norm": 0.8693629503250122,
+      "learning_rate": 6.330275229357799e-05,
+      "loss": 0.6181,
+      "step": 40
+    },
+    {
+      "epoch": 0.36446469248291574,
+      "eval_accuracy": 0.7077131258457375,
+      "eval_loss": 0.5807654857635498,
+      "eval_runtime": 107.3736,
+      "eval_samples_per_second": 6.883,
+      "eval_steps_per_second": 0.689,
+      "step": 40
+    },
+    {
+      "epoch": 0.41002277904328016,
+      "grad_norm": 1.0260130167007446,
+      "learning_rate": 5.8715596330275236e-05,
+      "loss": 0.6198,
+      "step": 45
+    },
+    {
+      "epoch": 0.45558086560364464,
+      "grad_norm": 0.9564087986946106,
+      "learning_rate": 5.4128440366972475e-05,
+      "loss": 0.6075,
+      "step": 50
+    },
+    {
+      "epoch": 0.45558086560364464,
+      "eval_accuracy": 0.6901217861975643,
+      "eval_loss": 0.5816063284873962,
+      "eval_runtime": 107.3358,
+      "eval_samples_per_second": 6.885,
+      "eval_steps_per_second": 0.689,
+      "step": 50
+    },
+    {
+      "epoch": 0.5011389521640092,
+      "grad_norm": 0.8393993377685547,
+      "learning_rate": 4.954128440366973e-05,
+      "loss": 0.6224,
+      "step": 55
+    },
+    {
+      "epoch": 0.5466970387243736,
+      "grad_norm": 0.8436751365661621,
+      "learning_rate": 4.4954128440366975e-05,
+      "loss": 0.6031,
+      "step": 60
+    },
+    {
+      "epoch": 0.5466970387243736,
+      "eval_accuracy": 0.6792963464140731,
+      "eval_loss": 0.5921587347984314,
+      "eval_runtime": 107.3803,
+      "eval_samples_per_second": 6.882,
+      "eval_steps_per_second": 0.689,
+      "step": 60
+    },
+    {
+      "epoch": 0.592255125284738,
+      "grad_norm": 1.0020941495895386,
+      "learning_rate": 4.036697247706422e-05,
+      "loss": 0.5905,
+      "step": 65
+    },
+    {
+      "epoch": 0.6378132118451025,
+      "grad_norm": 1.0870941877365112,
+      "learning_rate": 3.5779816513761474e-05,
+      "loss": 0.6065,
+      "step": 70
+    },
+    {
+      "epoch": 0.6378132118451025,
+      "eval_accuracy": 0.6941813261163735,
+      "eval_loss": 0.5733721256256104,
+      "eval_runtime": 107.4068,
+      "eval_samples_per_second": 6.88,
+      "eval_steps_per_second": 0.689,
+      "step": 70
+    },
+    {
+      "epoch": 0.683371298405467,
+      "grad_norm": 0.9016109108924866,
+      "learning_rate": 3.119266055045872e-05,
+      "loss": 0.5989,
+      "step": 75
+    },
+    {
+      "epoch": 0.7289293849658315,
+      "grad_norm": 0.984087347984314,
+      "learning_rate": 2.6605504587155967e-05,
+      "loss": 0.5793,
+      "step": 80
+    },
+    {
+      "epoch": 0.7289293849658315,
+      "eval_accuracy": 0.6874154262516915,
+      "eval_loss": 0.5740049481391907,
+      "eval_runtime": 107.3709,
+      "eval_samples_per_second": 6.883,
+      "eval_steps_per_second": 0.689,
+      "step": 80
+    },
+    {
+      "epoch": 0.7744874715261959,
+      "grad_norm": 1.2113629579544067,
+      "learning_rate": 2.2018348623853213e-05,
+      "loss": 0.6008,
+      "step": 85
+    },
+    {
+      "epoch": 0.8200455580865603,
+      "grad_norm": 1.0072749853134155,
+      "learning_rate": 1.743119266055046e-05,
+      "loss": 0.6114,
+      "step": 90
+    },
+    {
+      "epoch": 0.8200455580865603,
+      "eval_accuracy": 0.6725304465493911,
+      "eval_loss": 0.5750434398651123,
+      "eval_runtime": 107.3678,
+      "eval_samples_per_second": 6.883,
+      "eval_steps_per_second": 0.689,
+      "step": 90
+    },
+    {
+      "epoch": 0.8656036446469249,
+      "grad_norm": 0.865993320941925,
+      "learning_rate": 1.2844036697247708e-05,
+      "loss": 0.5915,
+      "step": 95
+    },
+    {
+      "epoch": 0.9111617312072893,
+      "grad_norm": 0.8444318175315857,
+      "learning_rate": 8.256880733944954e-06,
+      "loss": 0.6075,
+      "step": 100
+    },
+    {
+      "epoch": 0.9111617312072893,
+      "eval_accuracy": 0.6928281461434371,
+      "eval_loss": 0.57265305519104,
+      "eval_runtime": 107.4085,
+      "eval_samples_per_second": 6.88,
+      "eval_steps_per_second": 0.689,
+      "step": 100
+    },
+    {
+      "epoch": 0.9567198177676538,
+      "grad_norm": 0.8599985241889954,
+      "learning_rate": 3.6697247706422022e-06,
+      "loss": 0.5882,
+      "step": 105
+    }
+  ],
+  "logging_steps": 5,
+  "max_steps": 109,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 50,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-109/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab35ffacc44f83c47fadd882d00e580571cb9dc0685c52e2220bea5cec978628
+size 5560

checkpoint-109/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff