nbtpj
/

debug_gpt2

Safetensors

gpt2

Model card Files Files and versions

xet

Community

nbtpj commited on Feb 26

Commit

4c6deb2

verified ·

1 Parent(s): e748ac7

Upload ray_tune_logs/params.json with huggingface_hub

Browse files

Files changed (1) hide show

ray_tune_logs/params.json +14 -21

ray_tune_logs/params.json CHANGED Viewed

@@ -25,8 +25,8 @@
     "group_relative_norm": false,
     "inference_config": {
       "do_sample": true,
-      "max_new_tokens": 250,
-      "min_new_tokens": 5,
       "temperature": 0.0
     },
     "keep_eval_size": false,
@@ -63,27 +63,27 @@
     "rl_algo": "off_policy",
     "rl_w": 1.0,
     "rollout_config": {
-      "accuracy_w": 0.4222048983149828,
-      "accuracy_w2": 224.2012371372442,
       "len_pen": 1.0,
       "len_pen2": 1.0,
-      "max_ctx_len": 1000,
       "sampling_params_1": {
         "logprobs": 5,
-        "max_tokens": 56,
-        "min_tokens": 8,
         "n": 1,
         "temperature": 1.0
       },
       "sampling_params_2": {
         "logprobs": 5,
-        "max_tokens": 512,
-        "min_tokens": 20,
         "n": 4,
         "temperature": 1.0
       },
       "similarity_fn": "rouge",
-      "threshold": 0.08459126528049378
     },
     "rollout_game": "baseline3v2",
     "sample_config": {
@@ -99,23 +99,16 @@
     "text_template": "{text}\nTL;DR: {summary}",
     "tokenizer_name": null,
     "train_from_raw": true,
-    "train_split_name": "merge36_cnndmsamsumxsum",
     "trunc_eval": 256,
     "trunc_evals": [
-      "cnndm___12",
-      "samsum___12",
-      "xsum___12",
-      "gigaword___200",
-      "duc___50"
     ],
     "trust_remote_code": true,
     "tune_metrics": [
       "cnndm/rouge1___1.0",
-      "cnndm/bertscore_f1___0.25",
-      "samsum/rouge1___1.0",
-      "samsum/bertscore_f1___0.25",
-      "xsum/rouge1___1.0",
-      "xsum/bertscore_f1___0.25"
     ],
     "use_deepspeed": false,
     "use_slow_tokenizer": false,

     "group_relative_norm": false,
     "inference_config": {
       "do_sample": true,
+      "max_new_tokens": 135,
+      "min_new_tokens": 32,
       "temperature": 0.0
     },
     "keep_eval_size": false,
     "rl_algo": "off_policy",
     "rl_w": 1.0,
     "rollout_config": {
+      "accuracy_w": 1.96282248134428,
+      "accuracy_w2": 19.549524484259873,
       "len_pen": 1.0,
       "len_pen2": 1.0,
+      "max_ctx_len": 860,
       "sampling_params_1": {
         "logprobs": 5,
+        "max_tokens": 135,
+        "min_tokens": 32,
         "n": 1,
         "temperature": 1.0
       },
       "sampling_params_2": {
         "logprobs": 5,
+        "max_tokens": 860,
+        "min_tokens": 5,
         "n": 4,
         "temperature": 1.0
       },
       "similarity_fn": "rouge",
+      "threshold": 0.01605191133358762
     },
     "rollout_game": "baseline3v2",
     "sample_config": {
     "text_template": "{text}\nTL;DR: {summary}",
     "tokenizer_name": null,
     "train_from_raw": true,
+    "train_split_name": "sim_with_one_golden__cnndm_train",
     "trunc_eval": 256,
     "trunc_evals": [
+      "cnndm___10"
     ],
     "trust_remote_code": true,
     "tune_metrics": [
       "cnndm/rouge1___1.0",
+      "cnndm/rouge2___2.0",
+      "cnndm/bertscore_f1___0.25"
     ],
     "use_deepspeed": false,
     "use_slow_tokenizer": false,