Training in progress, epoch 1, checkpoint

Browse files

Files changed (11) hide show

last-checkpoint/added_tokens.json +4 -0
last-checkpoint/merges.txt +0 -0
last-checkpoint/model.safetensors +3 -0
last-checkpoint/optimizer.pt +3 -0
last-checkpoint/rng_state.pth +3 -0
last-checkpoint/scheduler.pt +3 -0
last-checkpoint/special_tokens_map.json +58 -0
last-checkpoint/tokenizer_config.json +213 -0
last-checkpoint/trainer_state.json +564 -0
last-checkpoint/training_args.bin +3 -0
last-checkpoint/vocab.json +0 -0

last-checkpoint/added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "<mask>": 49152,
+  "<pad>": 49153
+}

last-checkpoint/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

last-checkpoint/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee43cc787e4bbdf3b74113157c9557cc3d4eb0246845be2bc07fb9cb991c0e49
+size 1450506728

last-checkpoint/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f08bd408cd0095fb58cfc3775ff2ec9590d9677439cedc7321f7510f80768e38
+size 2901193658

last-checkpoint/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5daace352b191b76e3c99c762305288cdf737ab918956dd1b4d849f72bed01cc
+size 14244

last-checkpoint/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:56f1d9ce5cbe4f6e6e248b69695a1b0c3f76ed7a81860142c34e6f660cddfc4f
+size 1064

last-checkpoint/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "<fim_prefix>",
+    "<fim_middle>",
+    "<fim_suffix>",
+    "<fim_pad>",
+    "<filename>",
+    "<gh_stars>",
+    "<issue_start>",
+    "<issue_comment>",
+    "<issue_closed>",
+    "<jupyter_start>",
+    "<jupyter_text>",
+    "<jupyter_code>",
+    "<jupyter_output>",
+    "<empty_output>",
+    "<commit_before>",
+    "<commit_msg>",
+    "<commit_after>",
+    "<reponame>"
+  ],
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

last-checkpoint/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,213 @@

+{
+  "add_bos_token": false,
+  "add_eos_token": true,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<fim_prefix>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<fim_middle>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<fim_suffix>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "<fim_pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "<filename>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "6": {
+      "content": "<gh_stars>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "7": {
+      "content": "<issue_start>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "8": {
+      "content": "<issue_comment>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "9": {
+      "content": "<issue_closed>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "10": {
+      "content": "<jupyter_start>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "11": {
+      "content": "<jupyter_text>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "12": {
+      "content": "<jupyter_code>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "13": {
+      "content": "<jupyter_output>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "14": {
+      "content": "<empty_output>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "15": {
+      "content": "<commit_before>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "16": {
+      "content": "<commit_msg>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "17": {
+      "content": "<commit_after>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "18": {
+      "content": "<reponame>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "49152": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "49153": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "<fim_prefix>",
+    "<fim_middle>",
+    "<fim_suffix>",
+    "<fim_pad>",
+    "<filename>",
+    "<gh_stars>",
+    "<issue_start>",
+    "<issue_comment>",
+    "<issue_closed>",
+    "<jupyter_start>",
+    "<jupyter_text>",
+    "<jupyter_code>",
+    "<jupyter_output>",
+    "<empty_output>",
+    "<commit_before>",
+    "<commit_msg>",
+    "<commit_after>",
+    "<reponame>"
+  ],
+  "auto_map": {
+    "AutoTokenizer": [
+      "codesage/codesage-base-v2--tokenization_codesage.CodeSageTokenizer",
+      null
+    ]
+  },
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|endoftext|>",
+  "errors": "replace",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "tokenizer_class": "CodeSageTokenizer",
+  "unk_token": "<|endoftext|>",
+  "vocab_size": 49152
+}

last-checkpoint/trainer_state.json ADDED Viewed

	@@ -0,0 +1,564 @@

+{
+  "best_global_step": 370,
+  "best_metric": 0.3884802460670471,
+  "best_model_checkpoint": "./VulnSentry/checkpoint-370",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 370,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.013544018058690745,
+      "grad_norm": 61.920562744140625,
+      "learning_rate": 4.210526315789474e-06,
+      "loss": 0.7503,
+      "step": 5
+    },
+    {
+      "epoch": 0.02708803611738149,
+      "grad_norm": 53.86005783081055,
+      "learning_rate": 9.473684210526315e-06,
+      "loss": 0.5629,
+      "step": 10
+    },
+    {
+      "epoch": 0.040632054176072234,
+      "grad_norm": 52.824466705322266,
+      "learning_rate": 1.4736842105263159e-05,
+      "loss": 0.5162,
+      "step": 15
+    },
+    {
+      "epoch": 0.05417607223476298,
+      "grad_norm": 49.85675048828125,
+      "learning_rate": 2e-05,
+      "loss": 0.2927,
+      "step": 20
+    },
+    {
+      "epoch": 0.06772009029345373,
+      "grad_norm": 40.95595169067383,
+      "learning_rate": 1.9999629996754254e-05,
+      "loss": 0.4022,
+      "step": 25
+    },
+    {
+      "epoch": 0.08126410835214447,
+      "grad_norm": 40.73978042602539,
+      "learning_rate": 1.9998520014397486e-05,
+      "loss": 0.495,
+      "step": 30
+    },
+    {
+      "epoch": 0.09480812641083522,
+      "grad_norm": 25.020273208618164,
+      "learning_rate": 1.9996670135069123e-05,
+      "loss": 0.4785,
+      "step": 35
+    },
+    {
+      "epoch": 0.10835214446952596,
+      "grad_norm": 26.943941116333008,
+      "learning_rate": 1.999408049566142e-05,
+      "loss": 0.432,
+      "step": 40
+    },
+    {
+      "epoch": 0.12189616252821671,
+      "grad_norm": 22.082460403442383,
+      "learning_rate": 1.9990751287809393e-05,
+      "loss": 0.3905,
+      "step": 45
+    },
+    {
+      "epoch": 0.13544018058690746,
+      "grad_norm": 26.54736328125,
+      "learning_rate": 1.9986682757876574e-05,
+      "loss": 0.4153,
+      "step": 50
+    },
+    {
+      "epoch": 0.1489841986455982,
+      "grad_norm": 17.708812713623047,
+      "learning_rate": 1.9981875206936818e-05,
+      "loss": 0.4651,
+      "step": 55
+    },
+    {
+      "epoch": 0.16252821670428894,
+      "grad_norm": 21.073911666870117,
+      "learning_rate": 1.9976328990752013e-05,
+      "loss": 0.4979,
+      "step": 60
+    },
+    {
+      "epoch": 0.17607223476297967,
+      "grad_norm": 17.107423782348633,
+      "learning_rate": 1.997004451974577e-05,
+      "loss": 0.3886,
+      "step": 65
+    },
+    {
+      "epoch": 0.18961625282167044,
+      "grad_norm": 18.816625595092773,
+      "learning_rate": 1.9963022258973007e-05,
+      "loss": 0.5016,
+      "step": 70
+    },
+    {
+      "epoch": 0.20316027088036118,
+      "grad_norm": 18.011642456054688,
+      "learning_rate": 1.9955262728085592e-05,
+      "loss": 0.4861,
+      "step": 75
+    },
+    {
+      "epoch": 0.21670428893905191,
+      "grad_norm": 21.518707275390625,
+      "learning_rate": 1.9946766501293838e-05,
+      "loss": 0.4783,
+      "step": 80
+    },
+    {
+      "epoch": 0.23024830699774265,
+      "grad_norm": 14.0570650100708,
+      "learning_rate": 1.9937534207324053e-05,
+      "loss": 0.4393,
+      "step": 85
+    },
+    {
+      "epoch": 0.24379232505643342,
+      "grad_norm": 11.293530464172363,
+      "learning_rate": 1.992756652937198e-05,
+      "loss": 0.4614,
+      "step": 90
+    },
+    {
+      "epoch": 0.25733634311512416,
+      "grad_norm": 10.388118743896484,
+      "learning_rate": 1.991686420505225e-05,
+      "loss": 0.515,
+      "step": 95
+    },
+    {
+      "epoch": 0.2708803611738149,
+      "grad_norm": 9.720160484313965,
+      "learning_rate": 1.990542802634382e-05,
+      "loss": 0.4896,
+      "step": 100
+    },
+    {
+      "epoch": 0.28442437923250563,
+      "grad_norm": 8.744847297668457,
+      "learning_rate": 1.9893258839531335e-05,
+      "loss": 0.4879,
+      "step": 105
+    },
+    {
+      "epoch": 0.2979683972911964,
+      "grad_norm": 11.211833953857422,
+      "learning_rate": 1.988035754514252e-05,
+      "loss": 0.4154,
+      "step": 110
+    },
+    {
+      "epoch": 0.3115124153498871,
+      "grad_norm": 9.039229393005371,
+      "learning_rate": 1.986672509788153e-05,
+      "loss": 0.3759,
+      "step": 115
+    },
+    {
+      "epoch": 0.32505643340857787,
+      "grad_norm": 11.156192779541016,
+      "learning_rate": 1.985236250655832e-05,
+      "loss": 0.4234,
+      "step": 120
+    },
+    {
+      "epoch": 0.33860045146726864,
+      "grad_norm": 9.05034065246582,
+      "learning_rate": 1.983727083401396e-05,
+      "loss": 0.4786,
+      "step": 125
+    },
+    {
+      "epoch": 0.35214446952595935,
+      "grad_norm": 15.79513931274414,
+      "learning_rate": 1.9821451197042028e-05,
+      "loss": 0.5549,
+      "step": 130
+    },
+    {
+      "epoch": 0.3656884875846501,
+      "grad_norm": 10.228875160217285,
+      "learning_rate": 1.980490476630592e-05,
+      "loss": 0.5006,
+      "step": 135
+    },
+    {
+      "epoch": 0.3792325056433409,
+      "grad_norm": 5.66217041015625,
+      "learning_rate": 1.9787632766252256e-05,
+      "loss": 0.4001,
+      "step": 140
+    },
+    {
+      "epoch": 0.3927765237020316,
+      "grad_norm": 6.6009521484375,
+      "learning_rate": 1.976963647502025e-05,
+      "loss": 0.6198,
+      "step": 145
+    },
+    {
+      "epoch": 0.40632054176072235,
+      "grad_norm": 6.579983234405518,
+      "learning_rate": 1.9750917224347136e-05,
+      "loss": 0.3937,
+      "step": 150
+    },
+    {
+      "epoch": 0.4198645598194131,
+      "grad_norm": 9.299453735351562,
+      "learning_rate": 1.9731476399469615e-05,
+      "loss": 0.4485,
+      "step": 155
+    },
+    {
+      "epoch": 0.43340857787810383,
+      "grad_norm": 8.393924713134766,
+      "learning_rate": 1.9711315439021347e-05,
+      "loss": 0.4297,
+      "step": 160
+    },
+    {
+      "epoch": 0.4469525959367946,
+      "grad_norm": 6.152463912963867,
+      "learning_rate": 1.9690435834926495e-05,
+      "loss": 0.3706,
+      "step": 165
+    },
+    {
+      "epoch": 0.4604966139954853,
+      "grad_norm": 9.310385704040527,
+      "learning_rate": 1.9668839132289315e-05,
+      "loss": 0.4448,
+      "step": 170
+    },
+    {
+      "epoch": 0.47404063205417607,
+      "grad_norm": 8.190108299255371,
+      "learning_rate": 1.964652692927982e-05,
+      "loss": 0.371,
+      "step": 175
+    },
+    {
+      "epoch": 0.48758465011286684,
+      "grad_norm": 6.591668605804443,
+      "learning_rate": 1.962350087701552e-05,
+      "loss": 0.3555,
+      "step": 180
+    },
+    {
+      "epoch": 0.5011286681715575,
+      "grad_norm": 8.31998062133789,
+      "learning_rate": 1.959976267943923e-05,
+      "loss": 0.4765,
+      "step": 185
+    },
+    {
+      "epoch": 0.5146726862302483,
+      "grad_norm": 15.614466667175293,
+      "learning_rate": 1.9575314093192978e-05,
+      "loss": 0.3886,
+      "step": 190
+    },
+    {
+      "epoch": 0.5282167042889391,
+      "grad_norm": 10.621317863464355,
+      "learning_rate": 1.9550156927488017e-05,
+      "loss": 0.4668,
+      "step": 195
+    },
+    {
+      "epoch": 0.5417607223476298,
+      "grad_norm": 9.298853874206543,
+      "learning_rate": 1.9524293043970937e-05,
+      "loss": 0.4527,
+      "step": 200
+    },
+    {
+      "epoch": 0.5553047404063205,
+      "grad_norm": 5.578908920288086,
+      "learning_rate": 1.9497724356585913e-05,
+      "loss": 0.3918,
+      "step": 205
+    },
+    {
+      "epoch": 0.5688487584650113,
+      "grad_norm": 6.8293256759643555,
+      "learning_rate": 1.947045283143306e-05,
+      "loss": 0.4018,
+      "step": 210
+    },
+    {
+      "epoch": 0.582392776523702,
+      "grad_norm": 7.2509894371032715,
+      "learning_rate": 1.9442480486622933e-05,
+      "loss": 0.3758,
+      "step": 215
+    },
+    {
+      "epoch": 0.5959367945823928,
+      "grad_norm": 7.862231254577637,
+      "learning_rate": 1.941380939212722e-05,
+      "loss": 0.4305,
+      "step": 220
+    },
+    {
+      "epoch": 0.6094808126410836,
+      "grad_norm": 6.373060703277588,
+      "learning_rate": 1.9384441669625514e-05,
+      "loss": 0.3768,
+      "step": 225
+    },
+    {
+      "epoch": 0.6230248306997742,
+      "grad_norm": 10.84733772277832,
+      "learning_rate": 1.9354379492348348e-05,
+      "loss": 0.5301,
+      "step": 230
+    },
+    {
+      "epoch": 0.636568848758465,
+      "grad_norm": 8.134037971496582,
+      "learning_rate": 1.9323625084916358e-05,
+      "loss": 0.4017,
+      "step": 235
+    },
+    {
+      "epoch": 0.6501128668171557,
+      "grad_norm": 7.003602504730225,
+      "learning_rate": 1.9292180723175656e-05,
+      "loss": 0.4416,
+      "step": 240
+    },
+    {
+      "epoch": 0.6636568848758465,
+      "grad_norm": 9.637020111083984,
+      "learning_rate": 1.926004873402942e-05,
+      "loss": 0.4691,
+      "step": 245
+    },
+    {
+      "epoch": 0.6772009029345373,
+      "grad_norm": 9.159772872924805,
+      "learning_rate": 1.9227231495265707e-05,
+      "loss": 0.4566,
+      "step": 250
+    },
+    {
+      "epoch": 0.690744920993228,
+      "grad_norm": 8.606935501098633,
+      "learning_rate": 1.919373143538149e-05,
+      "loss": 0.389,
+      "step": 255
+    },
+    {
+      "epoch": 0.7042889390519187,
+      "grad_norm": 6.0342607498168945,
+      "learning_rate": 1.9159551033402952e-05,
+      "loss": 0.3691,
+      "step": 260
+    },
+    {
+      "epoch": 0.7178329571106095,
+      "grad_norm": 12.473052978515625,
+      "learning_rate": 1.912469281870202e-05,
+      "loss": 0.4589,
+      "step": 265
+    },
+    {
+      "epoch": 0.7313769751693002,
+      "grad_norm": 11.965147018432617,
+      "learning_rate": 1.9089159370809213e-05,
+      "loss": 0.4183,
+      "step": 270
+    },
+    {
+      "epoch": 0.744920993227991,
+      "grad_norm": 7.451316833496094,
+      "learning_rate": 1.9052953319222737e-05,
+      "loss": 0.3731,
+      "step": 275
+    },
+    {
+      "epoch": 0.7584650112866818,
+      "grad_norm": 7.067313194274902,
+      "learning_rate": 1.901607734321392e-05,
+      "loss": 0.4241,
+      "step": 280
+    },
+    {
+      "epoch": 0.7720090293453724,
+      "grad_norm": 8.900699615478516,
+      "learning_rate": 1.897853417162892e-05,
+      "loss": 0.4662,
+      "step": 285
+    },
+    {
+      "epoch": 0.7855530474040632,
+      "grad_norm": 8.984304428100586,
+      "learning_rate": 1.894032658268681e-05,
+      "loss": 0.4368,
+      "step": 290
+    },
+    {
+      "epoch": 0.7990970654627539,
+      "grad_norm": 17.687589645385742,
+      "learning_rate": 1.890145740377397e-05,
+      "loss": 0.4358,
+      "step": 295
+    },
+    {
+      "epoch": 0.8126410835214447,
+      "grad_norm": 10.592819213867188,
+      "learning_rate": 1.886192951123487e-05,
+      "loss": 0.4406,
+      "step": 300
+    },
+    {
+      "epoch": 0.8261851015801355,
+      "grad_norm": 7.463470458984375,
+      "learning_rate": 1.882174583015922e-05,
+      "loss": 0.5127,
+      "step": 305
+    },
+    {
+      "epoch": 0.8397291196388262,
+      "grad_norm": 9.488760948181152,
+      "learning_rate": 1.8780909334165505e-05,
+      "loss": 0.4632,
+      "step": 310
+    },
+    {
+      "epoch": 0.8532731376975169,
+      "grad_norm": 7.275017738342285,
+      "learning_rate": 1.8739423045180936e-05,
+      "loss": 0.3711,
+      "step": 315
+    },
+    {
+      "epoch": 0.8668171557562077,
+      "grad_norm": 10.391792297363281,
+      "learning_rate": 1.8697290033217834e-05,
+      "loss": 0.3747,
+      "step": 320
+    },
+    {
+      "epoch": 0.8803611738148984,
+      "grad_norm": 10.058419227600098,
+      "learning_rate": 1.8654513416146428e-05,
+      "loss": 0.4147,
+      "step": 325
+    },
+    {
+      "epoch": 0.8939051918735892,
+      "grad_norm": 15.269502639770508,
+      "learning_rate": 1.861109635946415e-05,
+      "loss": 0.425,
+      "step": 330
+    },
+    {
+      "epoch": 0.90744920993228,
+      "grad_norm": 5.774105548858643,
+      "learning_rate": 1.8567042076061382e-05,
+      "loss": 0.4217,
+      "step": 335
+    },
+    {
+      "epoch": 0.9209932279909706,
+      "grad_norm": 12.779688835144043,
+      "learning_rate": 1.8522353825983696e-05,
+      "loss": 0.3445,
+      "step": 340
+    },
+    {
+      "epoch": 0.9345372460496614,
+      "grad_norm": 18.34588050842285,
+      "learning_rate": 1.8477034916190605e-05,
+      "loss": 0.4231,
+      "step": 345
+    },
+    {
+      "epoch": 0.9480812641083521,
+      "grad_norm": 6.060946941375732,
+      "learning_rate": 1.8431088700310846e-05,
+      "loss": 0.3402,
+      "step": 350
+    },
+    {
+      "epoch": 0.9616252821670429,
+      "grad_norm": 8.50345230102539,
+      "learning_rate": 1.8384518578394228e-05,
+      "loss": 0.4596,
+      "step": 355
+    },
+    {
+      "epoch": 0.9751693002257337,
+      "grad_norm": 4.315084934234619,
+      "learning_rate": 1.833732799666e-05,
+      "loss": 0.346,
+      "step": 360
+    },
+    {
+      "epoch": 0.9887133182844243,
+      "grad_norm": 12.581374168395996,
+      "learning_rate": 1.8289520447241846e-05,
+      "loss": 0.4715,
+      "step": 365
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 2.780374765396118,
+      "learning_rate": 1.8241099467929455e-05,
+      "loss": 0.3656,
+      "step": 370
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9081264108352144,
+      "eval_f1": 0.0,
+      "eval_loss": 0.3884802460670471,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 241.8618,
+      "eval_samples_per_second": 18.316,
+      "eval_steps_per_second": 4.581,
+      "step": 370
+    }
+  ],
+  "logging_steps": 5,
+  "max_steps": 1845,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

last-checkpoint/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:37a84c70d6770979b673065161611b4cc8e6918473e736a58dc10be5dba7f4a6
+size 5304

last-checkpoint/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff