minimario commited on Mar 16, 2023

Commit

1ef15eb

1 Parent(s): 84408cd

add rankers

Browse files

Files changed (26) hide show

config.json +29 -0
partial-coderanker-t5/config.json +29 -0
partial-coderanker-t5/pytorch_model.bin +3 -0
pytorch_model.bin +3 -0
ranker_5/checkpoint-200/config.json +29 -0
ranker_5/checkpoint-200/merges.txt +0 -0
ranker_5/checkpoint-200/optimizer.pt +3 -0
ranker_5/checkpoint-200/pytorch_model.bin +3 -0
ranker_5/checkpoint-200/rng_state.pth +3 -0
ranker_5/checkpoint-200/scheduler.pt +3 -0
ranker_5/checkpoint-200/special_tokens_map.json +9 -0
ranker_5/checkpoint-200/tokenizer_config.json +65 -0
ranker_5/checkpoint-200/trainer_state.json +269 -0
ranker_5/checkpoint-200/training_args.bin +3 -0
ranker_5/checkpoint-200/vocab.json +0 -0
ranker_6/checkpoint-200/config.json +29 -0
ranker_6/checkpoint-200/merges.txt +0 -0
ranker_6/checkpoint-200/optimizer.pt +3 -0
ranker_6/checkpoint-200/pytorch_model.bin +3 -0
ranker_6/checkpoint-200/rng_state.pth +3 -0
ranker_6/checkpoint-200/scheduler.pt +3 -0
ranker_6/checkpoint-200/special_tokens_map.json +9 -0
ranker_6/checkpoint-200/tokenizer_config.json +65 -0
ranker_6/checkpoint-200/trainer_state.json +269 -0
ranker_6/checkpoint-200/training_args.bin +3 -0
ranker_6/checkpoint-200/vocab.json +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "models_partial_t5/checkpoint-8000",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.25.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

partial-coderanker-t5/config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "models_partial_t5/checkpoint-8000",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.25.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

partial-coderanker-t5/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:510c3eb3cc160b18106c0f6a20224a8b5d85cc214f1cb5a4fd7a081f66b3ec84
+size 498657517

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:510c3eb3cc160b18106c0f6a20224a8b5d85cc214f1cb5a4fd7a081f66b3ec84
+size 498657517

ranker_5/checkpoint-200/config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "microsoft/codebert-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

ranker_5/checkpoint-200/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

ranker_5/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5ca57ee890a3958d1e5940842b68070d78e768db14802189867a5b849a7f049
+size 997295045

ranker_5/checkpoint-200/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17553744bfff03e4ec2773f5017be5fe6e96e765ee6a40d86f34c6ee5e5dbec7
+size 498662069

ranker_5/checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a91eea1dffdd54f976e0f1205ab82a6b45037f0062e18e5cdba1d77041522ef
+size 15597

ranker_5/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2ee5e037f2ff613ef67e0ad201c15c247a7446512fc7e4f4386db3464f7e9af
+size 627

ranker_5/checkpoint-200/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

ranker_5/checkpoint-200/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "microsoft/codebert-base",
+  "pad_token": {
+    "__type": "AddedToken",
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "special_tokens_map_file": "/om2/user/gua/.cache/huggingface/hub/models--microsoft--codebert-base/snapshots/3b0952feddeffad0063f274080e3c23d75e7eb39/special_tokens_map.json",
+  "tokenizer_class": "RobertaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "use_fast": true
+}

ranker_5/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,269 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.19184652278177458,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 9.995201535508638e-05,
+      "loss": 0.6593,
+      "step": 5
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 9.990403071017275e-05,
+      "loss": 0.5495,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 9.985604606525912e-05,
+      "loss": 0.507,
+      "step": 15
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.980806142034548e-05,
+      "loss": 0.4512,
+      "step": 20
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.976007677543187e-05,
+      "loss": 0.417,
+      "step": 25
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 9.971209213051824e-05,
+      "loss": 0.4129,
+      "step": 30
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 9.96641074856046e-05,
+      "loss": 0.4053,
+      "step": 35
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.961612284069098e-05,
+      "loss": 0.3658,
+      "step": 40
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.956813819577736e-05,
+      "loss": 0.3779,
+      "step": 45
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.952015355086372e-05,
+      "loss": 0.3791,
+      "step": 50
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.94721689059501e-05,
+      "loss": 0.3492,
+      "step": 55
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.942418426103647e-05,
+      "loss": 0.341,
+      "step": 60
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.937619961612284e-05,
+      "loss": 0.3388,
+      "step": 65
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.932821497120922e-05,
+      "loss": 0.3597,
+      "step": 70
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.928023032629559e-05,
+      "loss": 0.3356,
+      "step": 75
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.923224568138196e-05,
+      "loss": 0.3317,
+      "step": 80
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.918426103646834e-05,
+      "loss": 0.3424,
+      "step": 85
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.913627639155471e-05,
+      "loss": 0.333,
+      "step": 90
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.908829174664108e-05,
+      "loss": 0.3145,
+      "step": 95
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.904030710172744e-05,
+      "loss": 0.3213,
+      "step": 100
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.899232245681382e-05,
+      "loss": 0.3139,
+      "step": 105
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 9.89443378119002e-05,
+      "loss": 0.3155,
+      "step": 110
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 9.889635316698656e-05,
+      "loss": 0.3219,
+      "step": 115
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 9.884836852207294e-05,
+      "loss": 0.3049,
+      "step": 120
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 9.880038387715931e-05,
+      "loss": 0.3171,
+      "step": 125
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 9.875239923224568e-05,
+      "loss": 0.2836,
+      "step": 130
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.870441458733206e-05,
+      "loss": 0.3102,
+      "step": 135
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.865642994241843e-05,
+      "loss": 0.2853,
+      "step": 140
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 9.86084452975048e-05,
+      "loss": 0.3273,
+      "step": 145
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 9.856046065259118e-05,
+      "loss": 0.3093,
+      "step": 150
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.851247600767755e-05,
+      "loss": 0.3112,
+      "step": 155
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.846449136276392e-05,
+      "loss": 0.308,
+      "step": 160
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.841650671785028e-05,
+      "loss": 0.3217,
+      "step": 165
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.836852207293667e-05,
+      "loss": 0.2773,
+      "step": 170
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.832053742802304e-05,
+      "loss": 0.2932,
+      "step": 175
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.82725527831094e-05,
+      "loss": 0.3055,
+      "step": 180
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.822456813819578e-05,
+      "loss": 0.282,
+      "step": 185
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.817658349328216e-05,
+      "loss": 0.2682,
+      "step": 190
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.812859884836852e-05,
+      "loss": 0.2913,
+      "step": 195
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.80806142034549e-05,
+      "loss": 0.2813,
+      "step": 200
+    },
+    {
+      "epoch": 0.19,
+      "eval_accuracy": 0.6656578015326164,
+      "eval_accuracy_sklearn": 0.6656578015326164,
+      "eval_f1": 0.6489045171760888,
+      "eval_loss": 0.7392101883888245,
+      "eval_precision": 0.809106239460371,
+      "eval_recall": 0.5416572589749379,
+      "eval_runtime": 84.7791,
+      "eval_samples_per_second": 183.17,
+      "eval_steps_per_second": 11.453,
+      "step": 200
+    }
+  ],
+  "max_steps": 10420,
+  "num_train_epochs": 10,
+  "total_flos": 2.6942572068864e+16,
+  "trial_name": null,
+  "trial_params": null
+}

ranker_5/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8afcd45054b4f042d2c517636d041f304a64f0acd72b54cb7054399d66b952a3
+size 3451

ranker_5/checkpoint-200/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

ranker_6/checkpoint-200/config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "microsoft/codebert-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

ranker_6/checkpoint-200/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

ranker_6/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ddefc015de30964a411b6b2b79e4d96111e9cea1c3781bbbdf8dc9142c2a0eaa
+size 997295045

ranker_6/checkpoint-200/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9bf0930cffd75a4c72acd82d1ec517c0c91a058e8f95f675e1168ac461ce2920
+size 498662069

ranker_6/checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a91eea1dffdd54f976e0f1205ab82a6b45037f0062e18e5cdba1d77041522ef
+size 15597

ranker_6/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f232c6145f58cfb2b4586a000a440995d052431f92826c9d2659b20bea73b50
+size 627

ranker_6/checkpoint-200/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

ranker_6/checkpoint-200/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "add_prefix_space": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "errors": "replace",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "microsoft/codebert-base",
+  "pad_token": {
+    "__type": "AddedToken",
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "special_tokens_map_file": "/om2/user/gua/.cache/huggingface/hub/models--microsoft--codebert-base/snapshots/3b0952feddeffad0063f274080e3c23d75e7eb39/special_tokens_map.json",
+  "tokenizer_class": "RobertaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "use_fast": true
+}

ranker_6/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,269 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.23873470605789315,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 9.994026284348866e-05,
+      "loss": 0.7347,
+      "step": 5
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 9.98805256869773e-05,
+      "loss": 0.6862,
+      "step": 10
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.982078853046596e-05,
+      "loss": 0.6505,
+      "step": 15
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.97610513739546e-05,
+      "loss": 0.6177,
+      "step": 20
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 9.970131421744326e-05,
+      "loss": 0.5992,
+      "step": 25
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.96415770609319e-05,
+      "loss": 0.5671,
+      "step": 30
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.958183990442056e-05,
+      "loss": 0.5407,
+      "step": 35
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.952210274790921e-05,
+      "loss": 0.5186,
+      "step": 40
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.946236559139786e-05,
+      "loss": 0.5068,
+      "step": 45
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.940262843488651e-05,
+      "loss": 0.5162,
+      "step": 50
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.934289127837514e-05,
+      "loss": 0.527,
+      "step": 55
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.928315412186381e-05,
+      "loss": 0.4849,
+      "step": 60
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.922341696535246e-05,
+      "loss": 0.477,
+      "step": 65
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.916367980884111e-05,
+      "loss": 0.4702,
+      "step": 70
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.910394265232975e-05,
+      "loss": 0.4504,
+      "step": 75
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.90442054958184e-05,
+      "loss": 0.4422,
+      "step": 80
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.898446833930706e-05,
+      "loss": 0.4383,
+      "step": 85
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 9.892473118279571e-05,
+      "loss": 0.4356,
+      "step": 90
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 9.886499402628435e-05,
+      "loss": 0.4446,
+      "step": 95
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 9.8805256869773e-05,
+      "loss": 0.4251,
+      "step": 100
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.874551971326166e-05,
+      "loss": 0.4201,
+      "step": 105
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.868578255675031e-05,
+      "loss": 0.4389,
+      "step": 110
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 9.862604540023895e-05,
+      "loss": 0.4319,
+      "step": 115
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 9.85663082437276e-05,
+      "loss": 0.455,
+      "step": 120
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.850657108721625e-05,
+      "loss": 0.4297,
+      "step": 125
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.844683393070491e-05,
+      "loss": 0.4383,
+      "step": 130
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.838709677419355e-05,
+      "loss": 0.4658,
+      "step": 135
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.83273596176822e-05,
+      "loss": 0.4499,
+      "step": 140
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.826762246117085e-05,
+      "loss": 0.41,
+      "step": 145
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.820788530465951e-05,
+      "loss": 0.3866,
+      "step": 150
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.814814814814815e-05,
+      "loss": 0.3897,
+      "step": 155
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.80884109916368e-05,
+      "loss": 0.4053,
+      "step": 160
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.802867383512545e-05,
+      "loss": 0.4022,
+      "step": 165
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.79689366786141e-05,
+      "loss": 0.4074,
+      "step": 170
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.790919952210275e-05,
+      "loss": 0.4,
+      "step": 175
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.78494623655914e-05,
+      "loss": 0.4282,
+      "step": 180
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.778972520908005e-05,
+      "loss": 0.4028,
+      "step": 185
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.77299880525687e-05,
+      "loss": 0.3937,
+      "step": 190
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.767025089605735e-05,
+      "loss": 0.3665,
+      "step": 195
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.7610513739546e-05,
+      "loss": 0.3743,
+      "step": 200
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.7354377926759424,
+      "eval_accuracy_sklearn": 0.7354377926759424,
+      "eval_f1": 0.7483577402505849,
+      "eval_loss": 0.5406955480575562,
+      "eval_precision": 0.8060886373049841,
+      "eval_recall": 0.6983434005143233,
+      "eval_runtime": 162.5908,
+      "eval_samples_per_second": 182.563,
+      "eval_steps_per_second": 11.415,
+      "step": 200
+    }
+  ],
+  "max_steps": 8370,
+  "num_train_epochs": 10,
+  "total_flos": 2.6942572068864e+16,
+  "trial_name": null,
+  "trial_params": null
+}

ranker_6/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:afe9172185ff2f8d76489141d37a4aee15a69f345332203636a0331020f1caf0
+size 3451

ranker_6/checkpoint-200/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff