Upload folder using huggingface_hub

Browse files

Files changed (10) hide show

README.md +21 -0
adapter_config.json +21 -0
adapter_model.bin +3 -0
special_tokens_map.json +24 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +32 -0
train_args.json +123 -0
training_args.bin +3 -0
training_logs.json +1595 -0

README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.5.0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "models/llama-13b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "SEQ_CLS"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f201ef5aeeda8d2cfa09ee4ecd1b01c68cafaa6a0d9b4e68eb751326962b06d0
+size 209811921

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "clean_up_tokenization_spaces": false,
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 2048,
+  "pad_token": null,
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "use_default_system_prompt": true
+}

train_args.json ADDED Viewed

	@@ -0,0 +1,123 @@

+{
+    "initial_model_dir": "models/llama-13b",
+    "distribution_id": "code_hard",
+    "date_trained": "10/10/2023 09:37:05",
+    "output_dir": "models/classify_lora/llama-13b-code_hard",
+    "overwrite_output_dir": false,
+    "do_train": false,
+    "do_eval": true,
+    "do_predict": false,
+    "evaluation_strategy": "steps",
+    "prediction_loss_only": false,
+    "per_device_train_batch_size": 16,
+    "per_device_eval_batch_size": 16,
+    "per_gpu_train_batch_size": null,
+    "per_gpu_eval_batch_size": null,
+    "gradient_accumulation_steps": 1,
+    "eval_accumulation_steps": null,
+    "eval_delay": 0,
+    "learning_rate": 0.0002,
+    "weight_decay": 0.0,
+    "adam_beta1": 0.9,
+    "adam_beta2": 0.999,
+    "adam_epsilon": 1e-08,
+    "max_grad_norm": 0.3,
+    "num_train_epochs": 3,
+    "max_steps": 150,
+    "lr_scheduler_type": "constant",
+    "warmup_ratio": 0.03,
+    "warmup_steps": 0,
+    "log_level": "passive",
+    "log_level_replica": "warning",
+    "log_on_each_node": true,
+    "logging_dir": "models/classify_lora/llama-13b-code_hard/runs/Oct10_05-40-18_compute-permanent-node-978",
+    "logging_strategy": "steps",
+    "logging_first_step": false,
+    "logging_steps": 1,
+    "logging_nan_inf_filter": true,
+    "save_strategy": "steps",
+    "save_steps": 25,
+    "save_total_limit": 0,
+    "save_safetensors": false,
+    "save_on_each_node": false,
+    "no_cuda": false,
+    "use_cpu": false,
+    "use_mps_device": false,
+    "seed": 42,
+    "data_seed": null,
+    "jit_mode_eval": false,
+    "use_ipex": false,
+    "bf16": false,
+    "fp16": false,
+    "fp16_opt_level": "O1",
+    "half_precision_backend": "auto",
+    "bf16_full_eval": false,
+    "fp16_full_eval": false,
+    "tf32": null,
+    "local_rank": 1,
+    "ddp_backend": null,
+    "tpu_num_cores": null,
+    "tpu_metrics_debug": false,
+    "debug": [],
+    "dataloader_drop_last": false,
+    "eval_steps": 25,
+    "dataloader_num_workers": 0,
+    "past_index": -1,
+    "run_name": "train|models-classify_lora-llama-13b-code_hard",
+    "disable_tqdm": false,
+    "remove_unused_columns": false,
+    "label_names": null,
+    "load_best_model_at_end": false,
+    "metric_for_best_model": "eval_code_hard_score",
+    "greater_is_better": true,
+    "ignore_data_skip": false,
+    "sharded_ddp": [],
+    "fsdp": [],
+    "fsdp_min_num_params": 0,
+    "fsdp_config": {
+        "min_num_params": 0,
+        "xla": false,
+        "xla_fsdp_grad_ckpt": false
+    },
+    "fsdp_transformer_layer_cls_to_wrap": null,
+    "deepspeed": "configs/ds_zero_1.json",
+    "label_smoothing_factor": 0.0,
+    "optim": "paged_adamw_32bit",
+    "optim_args": null,
+    "adafactor": false,
+    "group_by_length": false,
+    "length_column_name": "length",
+    "report_to": [
+        "wandb"
+    ],
+    "ddp_find_unused_parameters": false,
+    "ddp_bucket_cap_mb": null,
+    "ddp_broadcast_buffers": null,
+    "dataloader_pin_memory": true,
+    "skip_memory_metrics": true,
+    "use_legacy_prediction_loop": false,
+    "push_to_hub": false,
+    "resume_from_checkpoint": null,
+    "hub_model_id": null,
+    "hub_strategy": "every_save",
+    "hub_token": null,
+    "hub_private_repo": false,
+    "hub_always_push": false,
+    "gradient_checkpointing": false,
+    "include_inputs_for_metrics": false,
+    "fp16_backend": "auto",
+    "push_to_hub_model_id": null,
+    "push_to_hub_organization": null,
+    "push_to_hub_token": null,
+    "_n_gpu": 1,
+    "mp_parameters": "",
+    "auto_find_batch_size": false,
+    "full_determinism": false,
+    "torchdynamo": null,
+    "ray_scope": "last",
+    "ddp_timeout": 1800,
+    "torch_compile": false,
+    "torch_compile_backend": null,
+    "torch_compile_mode": null,
+    "dispatch_batches": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d64d8d4f9e2c1920215256853d6337fd6f69c3e74db1730786d16164e94e8a96
+size 5115

training_logs.json ADDED Viewed

	@@ -0,0 +1,1595 @@

+[
+    {
+        "loss": 0.7559,
+        "learning_rate": 0.0002,
+        "epoch": 0.02,
+        "step": 1
+    },
+    {
+        "loss": 0.809,
+        "learning_rate": 0.0002,
+        "epoch": 0.04,
+        "step": 2
+    },
+    {
+        "loss": 0.6615,
+        "learning_rate": 0.0002,
+        "epoch": 0.05,
+        "step": 3
+    },
+    {
+        "loss": 0.6488,
+        "learning_rate": 0.0002,
+        "epoch": 0.07,
+        "step": 4
+    },
+    {
+        "loss": 0.6381,
+        "learning_rate": 0.0002,
+        "epoch": 0.09,
+        "step": 5
+    },
+    {
+        "loss": 0.5315,
+        "learning_rate": 0.0002,
+        "epoch": 0.11,
+        "step": 6
+    },
+    {
+        "loss": 0.5713,
+        "learning_rate": 0.0002,
+        "epoch": 0.12,
+        "step": 7
+    },
+    {
+        "loss": 0.5663,
+        "learning_rate": 0.0002,
+        "epoch": 0.14,
+        "step": 8
+    },
+    {
+        "loss": 0.6267,
+        "learning_rate": 0.0002,
+        "epoch": 0.16,
+        "step": 9
+    },
+    {
+        "loss": 0.5685,
+        "learning_rate": 0.0002,
+        "epoch": 0.18,
+        "step": 10
+    },
+    {
+        "loss": 0.501,
+        "learning_rate": 0.0002,
+        "epoch": 0.19,
+        "step": 11
+    },
+    {
+        "loss": 0.5033,
+        "learning_rate": 0.0002,
+        "epoch": 0.21,
+        "step": 12
+    },
+    {
+        "loss": 0.5903,
+        "learning_rate": 0.0002,
+        "epoch": 0.23,
+        "step": 13
+    },
+    {
+        "loss": 0.4598,
+        "learning_rate": 0.0002,
+        "epoch": 0.25,
+        "step": 14
+    },
+    {
+        "loss": 0.4332,
+        "learning_rate": 0.0002,
+        "epoch": 0.26,
+        "step": 15
+    },
+    {
+        "loss": 0.4749,
+        "learning_rate": 0.0002,
+        "epoch": 0.28,
+        "step": 16
+    },
+    {
+        "loss": 0.3193,
+        "learning_rate": 0.0002,
+        "epoch": 0.3,
+        "step": 17
+    },
+    {
+        "loss": 0.4061,
+        "learning_rate": 0.0002,
+        "epoch": 0.32,
+        "step": 18
+    },
+    {
+        "loss": 0.3541,
+        "learning_rate": 0.0002,
+        "epoch": 0.33,
+        "step": 19
+    },
+    {
+        "loss": 0.3414,
+        "learning_rate": 0.0002,
+        "epoch": 0.35,
+        "step": 20
+    },
+    {
+        "loss": 0.3453,
+        "learning_rate": 0.0002,
+        "epoch": 0.37,
+        "step": 21
+    },
+    {
+        "loss": 0.5322,
+        "learning_rate": 0.0002,
+        "epoch": 0.39,
+        "step": 22
+    },
+    {
+        "loss": 0.3092,
+        "learning_rate": 0.0002,
+        "epoch": 0.4,
+        "step": 23
+    },
+    {
+        "loss": 0.2027,
+        "learning_rate": 0.0002,
+        "epoch": 0.42,
+        "step": 24
+    },
+    {
+        "loss": 0.403,
+        "learning_rate": 0.0002,
+        "epoch": 0.44,
+        "step": 25
+    },
+    {
+        "eval_code_hard_loss": 0.24356038868427277,
+        "eval_code_hard_score": -0.08314146846532822,
+        "eval_code_hard_brier_score": 0.08314146846532822,
+        "eval_code_hard_average_probability": 0.8104196786880493,
+        "eval_code_hard_accuracy": 0.88,
+        "eval_code_hard_probabilities": [
+            0.7802631855010986,
+            0.5728839039802551,
+            0.601148784160614,
+            0.9993261098861694,
+            0.9960917830467224,
+            0.9883104562759399,
+            0.9998921155929565,
+            0.9998250603675842,
+            0.9999023675918579,
+            0.7125715017318726,
+            0.9519601464271545,
+            0.8720795512199402,
+            1.0,
+            0.9999998807907104,
+            0.9999998807907104,
+            0.9911274313926697,
+            0.6485933065414429,
+            0.831139326095581,
+            0.9780414700508118,
+            0.9999822378158569,
+            0.9999316930770874,
+            0.9999449253082275,
+            0.9999632835388184,
+            0.9999346733093262,
+            0.9998100399971008,
+            0.9998506307601929,
+            0.999704897403717,
+            0.9949617385864258,
+            0.9998635053634644,
+            0.9998619556427002,
+            0.6420595645904541,
+            0.7948806881904602,
+            0.6511540412902832,
+            0.9534466862678528,
+            0.9455068707466125,
+            0.944064736366272,
+            0.9278716444969177,
+            0.8786247968673706,
+            0.9867132902145386,
+            0.9512923359870911,
+            0.975769579410553,
+            0.9804350137710571,
+            0.9998563528060913,
+            0.9999313354492188,
+            0.9999279975891113,
+            0.8713787198066711,
+            0.5257866382598877,
+            0.5062138438224792,
+            0.7719318270683289,
+            0.42283594608306885,
+            0.43223893642425537,
+            0.5629215836524963,
+            0.9509612321853638,
+            0.6529775857925415,
+            0.998943030834198,
+            0.9988754391670227,
+            0.9993382096290588,
+            0.4989044666290283,
+            0.5084826946258545,
+            0.5146058797836304,
+            0.9999768733978271,
+            0.9999709129333496,
+            0.9999724626541138,
+            0.6513444781303406,
+            0.5117835402488708,
+            0.8250595331192017,
+            0.9398683309555054,
+            0.9772916436195374,
+            0.9429591298103333,
+            0.9575245380401611,
+            0.8619183301925659,
+            0.5832539796829224,
+            0.9970285296440125,
+            0.999936580657959,
+            0.9999572038650513,
+            0.9991602897644043,
+            0.8450718522071838,
+            0.7737744450569153,
+            0.4931277930736542,
+            0.483172208070755,
+            0.5014657974243164,
+            0.5353665947914124,
+            0.434240460395813,
+            0.516578197479248,
+            0.9958915710449219,
+            0.9994507431983948,
+            0.5593408942222595,
+            0.4825429320335388,
+            0.4861961901187897,
+            0.49605879187583923,
+            0.9998632669448853,
+            0.9998589754104614,
+            0.9998570680618286,
+            0.39110851287841797,
+            0.38484665751457214,
+            0.3077014684677124,
+            0.5388085246086121,
+            0.6023823618888855,
+            0.5493093729019165,
+            0.6540540456771851
+        ],
+        "eval_code_hard_runtime": 110.6525,
+        "eval_code_hard_samples_per_second": 0.904,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 0.44,
+        "step": 25
+    },
+    {
+        "loss": 0.2619,
+        "learning_rate": 0.0002,
+        "epoch": 0.46,
+        "step": 26
+    },
+    {
+        "loss": 0.2734,
+        "learning_rate": 0.0002,
+        "epoch": 0.47,
+        "step": 27
+    },
+    {
+        "loss": 0.4004,
+        "learning_rate": 0.0002,
+        "epoch": 0.49,
+        "step": 28
+    },
+    {
+        "loss": 0.1422,
+        "learning_rate": 0.0002,
+        "epoch": 0.51,
+        "step": 29
+    },
+    {
+        "loss": 0.2156,
+        "learning_rate": 0.0002,
+        "epoch": 0.53,
+        "step": 30
+    },
+    {
+        "loss": 0.2327,
+        "learning_rate": 0.0002,
+        "epoch": 0.54,
+        "step": 31
+    },
+    {
+        "loss": 0.1781,
+        "learning_rate": 0.0002,
+        "epoch": 0.56,
+        "step": 32
+    },
+    {
+        "loss": 0.2628,
+        "learning_rate": 0.0002,
+        "epoch": 0.58,
+        "step": 33
+    },
+    {
+        "loss": 0.3038,
+        "learning_rate": 0.0002,
+        "epoch": 0.6,
+        "step": 34
+    },
+    {
+        "loss": 0.2291,
+        "learning_rate": 0.0002,
+        "epoch": 0.61,
+        "step": 35
+    },
+    {
+        "loss": 0.1074,
+        "learning_rate": 0.0002,
+        "epoch": 0.63,
+        "step": 36
+    },
+    {
+        "loss": 0.2432,
+        "learning_rate": 0.0002,
+        "epoch": 0.65,
+        "step": 37
+    },
+    {
+        "loss": 0.1269,
+        "learning_rate": 0.0002,
+        "epoch": 0.67,
+        "step": 38
+    },
+    {
+        "loss": 0.2828,
+        "learning_rate": 0.0002,
+        "epoch": 0.68,
+        "step": 39
+    },
+    {
+        "loss": 0.2679,
+        "learning_rate": 0.0002,
+        "epoch": 0.7,
+        "step": 40
+    },
+    {
+        "loss": 0.1949,
+        "learning_rate": 0.0002,
+        "epoch": 0.72,
+        "step": 41
+    },
+    {
+        "loss": 0.2657,
+        "learning_rate": 0.0002,
+        "epoch": 0.74,
+        "step": 42
+    },
+    {
+        "loss": 0.1775,
+        "learning_rate": 0.0002,
+        "epoch": 0.75,
+        "step": 43
+    },
+    {
+        "loss": 0.2224,
+        "learning_rate": 0.0002,
+        "epoch": 0.77,
+        "step": 44
+    },
+    {
+        "loss": 0.2793,
+        "learning_rate": 0.0002,
+        "epoch": 0.79,
+        "step": 45
+    },
+    {
+        "loss": 0.0357,
+        "learning_rate": 0.0002,
+        "epoch": 0.81,
+        "step": 46
+    },
+    {
+        "loss": 0.1634,
+        "learning_rate": 0.0002,
+        "epoch": 0.82,
+        "step": 47
+    },
+    {
+        "loss": 0.2606,
+        "learning_rate": 0.0002,
+        "epoch": 0.84,
+        "step": 48
+    },
+    {
+        "loss": 0.2214,
+        "learning_rate": 0.0002,
+        "epoch": 0.86,
+        "step": 49
+    },
+    {
+        "loss": 0.0889,
+        "learning_rate": 0.0002,
+        "epoch": 0.88,
+        "step": 50
+    },
+    {
+        "eval_code_hard_loss": 0.16699519753456116,
+        "eval_code_hard_score": -0.05673101916909218,
+        "eval_code_hard_brier_score": 0.05673101916909218,
+        "eval_code_hard_average_probability": 0.8761882781982422,
+        "eval_code_hard_accuracy": 0.93,
+        "eval_code_hard_probabilities": [
+            0.9874073266983032,
+            0.7980256080627441,
+            0.9544906616210938,
+            0.9999760389328003,
+            0.9833183288574219,
+            0.9734002947807312,
+            1.0,
+            1.0,
+            1.0,
+            0.8710820078849792,
+            0.9463728070259094,
+            0.9430120587348938,
+            1.0,
+            1.0,
+            1.0,
+            0.9999483823776245,
+            0.9996401071548462,
+            0.9999982118606567,
+            0.6661297082901001,
+            0.9998952150344849,
+            0.9999295473098755,
+            0.9999996423721313,
+            1.0,
+            0.9999994039535522,
+            0.9999994039535522,
+            0.9999171495437622,
+            0.9984815716743469,
+            0.9999889135360718,
+            0.9999997615814209,
+            0.9999967813491821,
+            0.997412383556366,
+            0.9992191791534424,
+            0.9149346947669983,
+            0.9999977350234985,
+            0.9999892711639404,
+            0.9999914169311523,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            0.9768458604812622,
+            0.9713558554649353,
+            0.9916350841522217,
+            0.9999990463256836,
+            1.0,
+            1.0,
+            0.7556970119476318,
+            0.5051810145378113,
+            0.443418949842453,
+            0.9936054944992065,
+            0.3165128529071808,
+            0.3557163178920746,
+            0.5657868385314941,
+            0.9981420040130615,
+            0.5603527426719666,
+            0.9821581840515137,
+            0.9779713749885559,
+            0.9982566237449646,
+            0.5955212712287903,
+            0.5466123819351196,
+            0.5278903245925903,
+            0.999467670917511,
+            0.9992781281471252,
+            0.9993084669113159,
+            0.9714255332946777,
+            0.5806359648704529,
+            0.9231281876564026,
+            0.9999953508377075,
+            1.0,
+            0.9999998807907104,
+            0.996260941028595,
+            0.9989031553268433,
+            0.9639995098114014,
+            0.9999957084655762,
+            1.0,
+            0.9999998807907104,
+            0.9980409741401672,
+            0.8687159419059753,
+            0.821354866027832,
+            0.4796599745750427,
+            0.4628332555294037,
+            0.5007415413856506,
+            0.3400116562843323,
+            0.6277292966842651,
+            0.5096919536590576,
+            0.9999779462814331,
+            0.9994074106216431,
+            0.596235454082489,
+            0.5236307382583618,
+            0.44950583577156067,
+            0.5437645316123962,
+            0.9999998807907104,
+            0.9999997615814209,
+            0.9999998807907104,
+            0.9999169111251831,
+            0.9999459981918335,
+            0.9999337196350098,
+            0.9902818202972412,
+            0.9997207522392273,
+            0.5093064308166504,
+            0.870800793170929
+        ],
+        "eval_code_hard_runtime": 110.6115,
+        "eval_code_hard_samples_per_second": 0.904,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 0.88,
+        "step": 50
+    },
+    {
+        "loss": 0.3248,
+        "learning_rate": 0.0002,
+        "epoch": 0.89,
+        "step": 51
+    },
+    {
+        "loss": 0.1904,
+        "learning_rate": 0.0002,
+        "epoch": 0.91,
+        "step": 52
+    },
+    {
+        "loss": 0.185,
+        "learning_rate": 0.0002,
+        "epoch": 0.93,
+        "step": 53
+    },
+    {
+        "loss": 0.0932,
+        "learning_rate": 0.0002,
+        "epoch": 0.95,
+        "step": 54
+    },
+    {
+        "loss": 0.1643,
+        "learning_rate": 0.0002,
+        "epoch": 0.96,
+        "step": 55
+    },
+    {
+        "loss": 0.2504,
+        "learning_rate": 0.0002,
+        "epoch": 0.98,
+        "step": 56
+    },
+    {
+        "loss": 0.17,
+        "learning_rate": 0.0002,
+        "epoch": 1.0,
+        "step": 57
+    },
+    {
+        "loss": 0.1939,
+        "learning_rate": 0.0002,
+        "epoch": 1.02,
+        "step": 58
+    },
+    {
+        "loss": 0.1383,
+        "learning_rate": 0.0002,
+        "epoch": 1.04,
+        "step": 59
+    },
+    {
+        "loss": 0.149,
+        "learning_rate": 0.0002,
+        "epoch": 1.05,
+        "step": 60
+    },
+    {
+        "loss": 0.0699,
+        "learning_rate": 0.0002,
+        "epoch": 1.07,
+        "step": 61
+    },
+    {
+        "loss": 0.1258,
+        "learning_rate": 0.0002,
+        "epoch": 1.09,
+        "step": 62
+    },
+    {
+        "loss": 0.0563,
+        "learning_rate": 0.0002,
+        "epoch": 1.11,
+        "step": 63
+    },
+    {
+        "loss": 0.1171,
+        "learning_rate": 0.0002,
+        "epoch": 1.12,
+        "step": 64
+    },
+    {
+        "loss": 0.1197,
+        "learning_rate": 0.0002,
+        "epoch": 1.14,
+        "step": 65
+    },
+    {
+        "loss": 0.0812,
+        "learning_rate": 0.0002,
+        "epoch": 1.16,
+        "step": 66
+    },
+    {
+        "loss": 0.1488,
+        "learning_rate": 0.0002,
+        "epoch": 1.18,
+        "step": 67
+    },
+    {
+        "loss": 0.1459,
+        "learning_rate": 0.0002,
+        "epoch": 1.19,
+        "step": 68
+    },
+    {
+        "loss": 0.0691,
+        "learning_rate": 0.0002,
+        "epoch": 1.21,
+        "step": 69
+    },
+    {
+        "loss": 0.0529,
+        "learning_rate": 0.0002,
+        "epoch": 1.23,
+        "step": 70
+    },
+    {
+        "loss": 0.0443,
+        "learning_rate": 0.0002,
+        "epoch": 1.25,
+        "step": 71
+    },
+    {
+        "loss": 0.214,
+        "learning_rate": 0.0002,
+        "epoch": 1.26,
+        "step": 72
+    },
+    {
+        "loss": 0.0409,
+        "learning_rate": 0.0002,
+        "epoch": 1.28,
+        "step": 73
+    },
+    {
+        "loss": 0.0357,
+        "learning_rate": 0.0002,
+        "epoch": 1.3,
+        "step": 74
+    },
+    {
+        "loss": 0.0676,
+        "learning_rate": 0.0002,
+        "epoch": 1.32,
+        "step": 75
+    },
+    {
+        "eval_code_hard_loss": 0.15125365555286407,
+        "eval_code_hard_score": -0.047643136233091354,
+        "eval_code_hard_brier_score": 0.047643136233091354,
+        "eval_code_hard_average_probability": 0.9072666764259338,
+        "eval_code_hard_accuracy": 0.94,
+        "eval_code_hard_probabilities": [
+            0.9881106615066528,
+            0.67057204246521,
+            0.9074558615684509,
+            1.0,
+            1.0,
+            1.0,
+            0.9999914169311523,
+            0.9999996423721313,
+            0.9999991655349731,
+            0.8589997291564941,
+            0.9643713235855103,
+            0.9970460534095764,
+            1.0,
+            1.0,
+            1.0,
+            0.9999948740005493,
+            0.9998992681503296,
+            0.9999996423721313,
+            1.0,
+            1.0,
+            1.0,
+            0.9999997615814209,
+            1.0,
+            0.9999988079071045,
+            0.9999991655349731,
+            0.9999972581863403,
+            0.9980295300483704,
+            0.9999752044677734,
+            0.9991430044174194,
+            0.999230146408081,
+            0.9863813519477844,
+            0.9973239898681641,
+            0.8935987949371338,
+            1.0,
+            0.9999996423721313,
+            0.9999998807907104,
+            0.9999157190322876,
+            0.9997393488883972,
+            0.999843955039978,
+            0.8906758427619934,
+            0.7957176566123962,
+            0.8944621682167053,
+            0.9999850988388062,
+            0.9999994039535522,
+            0.9999984502792358,
+            0.8667024970054626,
+            0.5891015529632568,
+            0.5897384881973267,
+            0.9999762773513794,
+            0.920762836933136,
+            0.8804107904434204,
+            0.037825245410203934,
+            0.9987059831619263,
+            0.9998573064804077,
+            1.0,
+            1.0,
+            1.0,
+            0.5703369379043579,
+            0.6154165863990784,
+            0.47148749232292175,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9997634291648865,
+            0.9999960660934448,
+            0.9999247789382935,
+            0.9999982118606567,
+            0.9999983310699463,
+            0.7629109025001526,
+            0.9476748108863831,
+            0.7605304718017578,
+            0.999997615814209,
+            0.9999995231628418,
+            0.9999983310699463,
+            0.9999594688415527,
+            0.9989461302757263,
+            0.99898761510849,
+            0.5305535793304443,
+            0.7419759631156921,
+            0.9985262155532837,
+            0.9876091480255127,
+            0.9818170070648193,
+            0.8375343084335327,
+            0.9999997615814209,
+            0.9999995231628418,
+            0.07670325040817261,
+            0.6875349283218384,
+            0.35709840059280396,
+            0.3490428626537323,
+            0.99744713306427,
+            0.9997475743293762,
+            0.9991705417633057,
+            0.9985999464988708,
+            0.9992005228996277,
+            0.9987180233001709,
+            0.9907884001731873,
+            0.9931132197380066,
+            0.35269367694854736,
+            0.9993346333503723
+        ],
+        "eval_code_hard_runtime": 110.7336,
+        "eval_code_hard_samples_per_second": 0.903,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 1.32,
+        "step": 75
+    },
+    {
+        "loss": 0.0635,
+        "learning_rate": 0.0002,
+        "epoch": 1.33,
+        "step": 76
+    },
+    {
+        "loss": 0.0923,
+        "learning_rate": 0.0002,
+        "epoch": 1.35,
+        "step": 77
+    },
+    {
+        "loss": 0.1026,
+        "learning_rate": 0.0002,
+        "epoch": 1.37,
+        "step": 78
+    },
+    {
+        "loss": 0.0674,
+        "learning_rate": 0.0002,
+        "epoch": 1.39,
+        "step": 79
+    },
+    {
+        "loss": 0.0493,
+        "learning_rate": 0.0002,
+        "epoch": 1.4,
+        "step": 80
+    },
+    {
+        "loss": 0.1209,
+        "learning_rate": 0.0002,
+        "epoch": 1.42,
+        "step": 81
+    },
+    {
+        "loss": 0.5175,
+        "learning_rate": 0.0002,
+        "epoch": 1.44,
+        "step": 82
+    },
+    {
+        "loss": 0.1547,
+        "learning_rate": 0.0002,
+        "epoch": 1.46,
+        "step": 83
+    },
+    {
+        "loss": 0.1185,
+        "learning_rate": 0.0002,
+        "epoch": 1.47,
+        "step": 84
+    },
+    {
+        "loss": 0.0621,
+        "learning_rate": 0.0002,
+        "epoch": 1.49,
+        "step": 85
+    },
+    {
+        "loss": 0.07,
+        "learning_rate": 0.0002,
+        "epoch": 1.51,
+        "step": 86
+    },
+    {
+        "loss": 0.092,
+        "learning_rate": 0.0002,
+        "epoch": 1.53,
+        "step": 87
+    },
+    {
+        "loss": 0.0422,
+        "learning_rate": 0.0002,
+        "epoch": 1.54,
+        "step": 88
+    },
+    {
+        "loss": 0.1117,
+        "learning_rate": 0.0002,
+        "epoch": 1.56,
+        "step": 89
+    },
+    {
+        "loss": 0.0654,
+        "learning_rate": 0.0002,
+        "epoch": 1.58,
+        "step": 90
+    },
+    {
+        "loss": 0.1185,
+        "learning_rate": 0.0002,
+        "epoch": 1.6,
+        "step": 91
+    },
+    {
+        "loss": 0.1308,
+        "learning_rate": 0.0002,
+        "epoch": 1.61,
+        "step": 92
+    },
+    {
+        "loss": 0.1293,
+        "learning_rate": 0.0002,
+        "epoch": 1.63,
+        "step": 93
+    },
+    {
+        "loss": 0.1071,
+        "learning_rate": 0.0002,
+        "epoch": 1.65,
+        "step": 94
+    },
+    {
+        "loss": 0.0593,
+        "learning_rate": 0.0002,
+        "epoch": 1.67,
+        "step": 95
+    },
+    {
+        "loss": 0.0494,
+        "learning_rate": 0.0002,
+        "epoch": 1.68,
+        "step": 96
+    },
+    {
+        "loss": 0.0641,
+        "learning_rate": 0.0002,
+        "epoch": 1.7,
+        "step": 97
+    },
+    {
+        "loss": 0.0815,
+        "learning_rate": 0.0002,
+        "epoch": 1.72,
+        "step": 98
+    },
+    {
+        "loss": 0.0747,
+        "learning_rate": 0.0002,
+        "epoch": 1.74,
+        "step": 99
+    },
+    {
+        "loss": 0.0776,
+        "learning_rate": 0.0002,
+        "epoch": 1.75,
+        "step": 100
+    },
+    {
+        "eval_code_hard_loss": 0.09847890585660934,
+        "eval_code_hard_score": -0.035213593393564224,
+        "eval_code_hard_brier_score": 0.035213593393564224,
+        "eval_code_hard_average_probability": 0.9248704314231873,
+        "eval_code_hard_accuracy": 0.94,
+        "eval_code_hard_probabilities": [
+            0.9995959401130676,
+            0.823664665222168,
+            0.9978653788566589,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.7222961187362671,
+            0.9800193309783936,
+            0.9987350106239319,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.999994158744812,
+            1.0,
+            0.303742915391922,
+            0.9999943971633911,
+            0.9999933242797852,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999995231628418,
+            0.9999909400939941,
+            0.9999997615814209,
+            1.0,
+            1.0,
+            0.999997615814209,
+            1.0,
+            0.9949355721473694,
+            1.0,
+            0.9999887943267822,
+            0.999993085861206,
+            1.0,
+            1.0,
+            1.0,
+            0.9999736547470093,
+            0.9997861981391907,
+            0.9999978542327881,
+            1.0,
+            1.0,
+            1.0,
+            0.9989193677902222,
+            0.6210824847221375,
+            0.8116233944892883,
+            0.9997373223304749,
+            0.8275205492973328,
+            0.7434841394424438,
+            0.27361589670181274,
+            0.9993396401405334,
+            0.9998682737350464,
+            0.999985933303833,
+            0.9999828338623047,
+            0.9999997615814209,
+            0.39626461267471313,
+            0.5240136384963989,
+            0.6546356081962585,
+            0.9999992847442627,
+            0.9999991655349731,
+            0.9999990463256836,
+            0.9999998807907104,
+            0.9612408876419067,
+            0.9947011470794678,
+            0.9999994039535522,
+            1.0,
+            1.0,
+            0.9999735355377197,
+            0.9999927282333374,
+            0.9999716281890869,
+            1.0,
+            1.0,
+            1.0,
+            0.9999995231628418,
+            0.9988247752189636,
+            0.9937974810600281,
+            0.49393144249916077,
+            0.4931151568889618,
+            0.7545955777168274,
+            0.918387770652771,
+            0.9984613656997681,
+            0.9579277634620667,
+            1.0,
+            0.9999995231628418,
+            0.7278538942337036,
+            0.5116866827011108,
+            0.9212220311164856,
+            0.7694430947303772,
+            1.0,
+            1.0,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            1.0,
+            0.9999598264694214,
+            0.9999998807907104,
+            0.3216085433959961,
+            0.999714195728302
+        ],
+        "eval_code_hard_runtime": 110.6096,
+        "eval_code_hard_samples_per_second": 0.904,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 1.75,
+        "step": 100
+    },
+    {
+        "loss": 0.0619,
+        "learning_rate": 0.0002,
+        "epoch": 1.77,
+        "step": 101
+    },
+    {
+        "loss": 0.0526,
+        "learning_rate": 0.0002,
+        "epoch": 1.79,
+        "step": 102
+    },
+    {
+        "loss": 0.1902,
+        "learning_rate": 0.0002,
+        "epoch": 1.81,
+        "step": 103
+    },
+    {
+        "loss": 0.2676,
+        "learning_rate": 0.0002,
+        "epoch": 1.82,
+        "step": 104
+    },
+    {
+        "loss": 0.1422,
+        "learning_rate": 0.0002,
+        "epoch": 1.84,
+        "step": 105
+    },
+    {
+        "loss": 0.0869,
+        "learning_rate": 0.0002,
+        "epoch": 1.86,
+        "step": 106
+    },
+    {
+        "loss": 0.1517,
+        "learning_rate": 0.0002,
+        "epoch": 1.88,
+        "step": 107
+    },
+    {
+        "loss": 0.0282,
+        "learning_rate": 0.0002,
+        "epoch": 1.89,
+        "step": 108
+    },
+    {
+        "loss": 0.0516,
+        "learning_rate": 0.0002,
+        "epoch": 1.91,
+        "step": 109
+    },
+    {
+        "loss": 0.0479,
+        "learning_rate": 0.0002,
+        "epoch": 1.93,
+        "step": 110
+    },
+    {
+        "loss": 0.108,
+        "learning_rate": 0.0002,
+        "epoch": 1.95,
+        "step": 111
+    },
+    {
+        "loss": 0.0833,
+        "learning_rate": 0.0002,
+        "epoch": 1.96,
+        "step": 112
+    },
+    {
+        "loss": 0.1826,
+        "learning_rate": 0.0002,
+        "epoch": 1.98,
+        "step": 113
+    },
+    {
+        "loss": 0.071,
+        "learning_rate": 0.0002,
+        "epoch": 2.0,
+        "step": 114
+    },
+    {
+        "loss": 0.0619,
+        "learning_rate": 0.0002,
+        "epoch": 2.02,
+        "step": 115
+    },
+    {
+        "loss": 0.0764,
+        "learning_rate": 0.0002,
+        "epoch": 2.04,
+        "step": 116
+    },
+    {
+        "loss": 0.0009,
+        "learning_rate": 0.0002,
+        "epoch": 2.05,
+        "step": 117
+    },
+    {
+        "loss": 0.0175,
+        "learning_rate": 0.0002,
+        "epoch": 2.07,
+        "step": 118
+    },
+    {
+        "loss": 0.0216,
+        "learning_rate": 0.0002,
+        "epoch": 2.09,
+        "step": 119
+    },
+    {
+        "loss": 0.0278,
+        "learning_rate": 0.0002,
+        "epoch": 2.11,
+        "step": 120
+    },
+    {
+        "loss": 0.0665,
+        "learning_rate": 0.0002,
+        "epoch": 2.12,
+        "step": 121
+    },
+    {
+        "loss": 0.0205,
+        "learning_rate": 0.0002,
+        "epoch": 2.14,
+        "step": 122
+    },
+    {
+        "loss": 0.0052,
+        "learning_rate": 0.0002,
+        "epoch": 2.16,
+        "step": 123
+    },
+    {
+        "loss": 0.0635,
+        "learning_rate": 0.0002,
+        "epoch": 2.18,
+        "step": 124
+    },
+    {
+        "loss": 0.0132,
+        "learning_rate": 0.0002,
+        "epoch": 2.19,
+        "step": 125
+    },
+    {
+        "eval_code_hard_loss": 0.05377120152115822,
+        "eval_code_hard_score": -0.015216915868222713,
+        "eval_code_hard_brier_score": 0.015216915868222713,
+        "eval_code_hard_average_probability": 0.9605898261070251,
+        "eval_code_hard_accuracy": 0.99,
+        "eval_code_hard_probabilities": [
+            0.9999129772186279,
+            0.9065911173820496,
+            0.9998986721038818,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.8372133374214172,
+            0.9947729706764221,
+            0.999957799911499,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            0.9999995231628418,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999923706054688,
+            0.9862022995948792,
+            1.0,
+            1.0,
+            0.9995848536491394,
+            0.9999656677246094,
+            0.9963919520378113,
+            1.0,
+            0.9999942779541016,
+            0.999997615814209,
+            0.9999997615814209,
+            0.9999994039535522,
+            0.9999994039535522,
+            0.9998449087142944,
+            0.996722400188446,
+            0.9999366998672485,
+            0.9999986886978149,
+            0.9999994039535522,
+            0.9999995231628418,
+            0.9986975193023682,
+            0.6720824837684631,
+            0.8636956810951233,
+            0.9999996423721313,
+            0.9801883697509766,
+            0.9772735238075256,
+            0.22563716769218445,
+            0.9999665021896362,
+            0.9957283139228821,
+            1.0,
+            1.0,
+            1.0,
+            0.928858757019043,
+            0.7347054481506348,
+            0.8363421559333801,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9992239475250244,
+            0.9996882677078247,
+            0.9999969005584717,
+            1.0,
+            1.0,
+            0.9928505420684814,
+            0.9979680180549622,
+            0.9968575239181519,
+            1.0,
+            1.0,
+            1.0,
+            0.9999997615814209,
+            0.9999778270721436,
+            0.9998857975006104,
+            0.5365374684333801,
+            0.6125951409339905,
+            0.9207331538200378,
+            0.9939044117927551,
+            0.9994903802871704,
+            0.9971593618392944,
+            1.0,
+            1.0,
+            0.8098579049110413,
+            0.5238723158836365,
+            0.9532552361488342,
+            0.8978452682495117,
+            1.0,
+            1.0,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            1.0,
+            0.9999985694885254,
+            1.0,
+            0.8971565961837769,
+            0.9999786615371704
+        ],
+        "eval_code_hard_runtime": 110.7219,
+        "eval_code_hard_samples_per_second": 0.903,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 2.19,
+        "step": 125
+    },
+    {
+        "loss": 0.0251,
+        "learning_rate": 0.0002,
+        "epoch": 2.21,
+        "step": 126
+    },
+    {
+        "loss": 0.0102,
+        "learning_rate": 0.0002,
+        "epoch": 2.23,
+        "step": 127
+    },
+    {
+        "loss": 0.0179,
+        "learning_rate": 0.0002,
+        "epoch": 2.25,
+        "step": 128
+    },
+    {
+        "loss": 0.1329,
+        "learning_rate": 0.0002,
+        "epoch": 2.26,
+        "step": 129
+    },
+    {
+        "loss": 0.0082,
+        "learning_rate": 0.0002,
+        "epoch": 2.28,
+        "step": 130
+    },
+    {
+        "loss": 0.0325,
+        "learning_rate": 0.0002,
+        "epoch": 2.3,
+        "step": 131
+    },
+    {
+        "loss": 0.0094,
+        "learning_rate": 0.0002,
+        "epoch": 2.32,
+        "step": 132
+    },
+    {
+        "loss": 0.004,
+        "learning_rate": 0.0002,
+        "epoch": 2.33,
+        "step": 133
+    },
+    {
+        "loss": 0.0099,
+        "learning_rate": 0.0002,
+        "epoch": 2.35,
+        "step": 134
+    },
+    {
+        "loss": 0.0454,
+        "learning_rate": 0.0002,
+        "epoch": 2.37,
+        "step": 135
+    },
+    {
+        "loss": 0.0342,
+        "learning_rate": 0.0002,
+        "epoch": 2.39,
+        "step": 136
+    },
+    {
+        "loss": 0.0161,
+        "learning_rate": 0.0002,
+        "epoch": 2.4,
+        "step": 137
+    },
+    {
+        "loss": 0.0686,
+        "learning_rate": 0.0002,
+        "epoch": 2.42,
+        "step": 138
+    },
+    {
+        "loss": 0.0404,
+        "learning_rate": 0.0002,
+        "epoch": 2.44,
+        "step": 139
+    },
+    {
+        "loss": 0.0311,
+        "learning_rate": 0.0002,
+        "epoch": 2.46,
+        "step": 140
+    },
+    {
+        "loss": 0.0426,
+        "learning_rate": 0.0002,
+        "epoch": 2.47,
+        "step": 141
+    },
+    {
+        "loss": 0.013,
+        "learning_rate": 0.0002,
+        "epoch": 2.49,
+        "step": 142
+    },
+    {
+        "loss": 0.0209,
+        "learning_rate": 0.0002,
+        "epoch": 2.51,
+        "step": 143
+    },
+    {
+        "loss": 0.0441,
+        "learning_rate": 0.0002,
+        "epoch": 2.53,
+        "step": 144
+    },
+    {
+        "loss": 0.0414,
+        "learning_rate": 0.0002,
+        "epoch": 2.54,
+        "step": 145
+    },
+    {
+        "loss": 0.0022,
+        "learning_rate": 0.0002,
+        "epoch": 2.56,
+        "step": 146
+    },
+    {
+        "loss": 0.0098,
+        "learning_rate": 0.0002,
+        "epoch": 2.58,
+        "step": 147
+    },
+    {
+        "loss": 0.0076,
+        "learning_rate": 0.0002,
+        "epoch": 2.6,
+        "step": 148
+    },
+    {
+        "loss": 0.0242,
+        "learning_rate": 0.0002,
+        "epoch": 2.61,
+        "step": 149
+    },
+    {
+        "loss": 0.002,
+        "learning_rate": 0.0002,
+        "epoch": 2.63,
+        "step": 150
+    },
+    {
+        "eval_code_hard_loss": 0.06451280415058136,
+        "eval_code_hard_score": -0.019366176798939705,
+        "eval_code_hard_brier_score": 0.019366176798939705,
+        "eval_code_hard_average_probability": 0.957671582698822,
+        "eval_code_hard_accuracy": 0.97,
+        "eval_code_hard_probabilities": [
+            0.9999499320983887,
+            0.8330075144767761,
+            0.9997716546058655,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.4579625427722931,
+            0.9998301267623901,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999909400939941,
+            1.0,
+            1.0,
+            0.9999996423721313,
+            1.0,
+            0.9973661303520203,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            0.9999984502792358,
+            0.9999953508377075,
+            0.9999986886978149,
+            1.0,
+            0.9999997615814209,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999028444290161,
+            0.7898390293121338,
+            0.8942784070968628,
+            1.0,
+            0.9987273812294006,
+            0.9987801909446716,
+            0.14106149971485138,
+            1.0,
+            0.9999027252197266,
+            1.0,
+            1.0,
+            1.0,
+            0.6841090321540833,
+            0.7871870398521423,
+            0.896818220615387,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.999897837638855,
+            0.9999984502792358,
+            0.9999983310699463,
+            1.0,
+            1.0,
+            0.9256799817085266,
+            0.9996222257614136,
+            0.9997231364250183,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999997615814209,
+            0.9999966621398926,
+            0.5312544107437134,
+            0.583741307258606,
+            0.9588684439659119,
+            0.9209092259407043,
+            0.999733030796051,
+            0.9926868677139282,
+            1.0,
+            1.0,
+            0.9422075748443604,
+            0.4956146478652954,
+            0.9603027105331421,
+            0.9903588891029358,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.988089382648468,
+            0.9999991655349731
+        ],
+        "eval_code_hard_runtime": 110.671,
+        "eval_code_hard_samples_per_second": 0.904,
+        "eval_code_hard_steps_per_second": 0.036,
+        "epoch": 2.63,
+        "step": 150
+    },
+    {
+        "train_runtime": 14190.0736,
+        "train_samples_per_second": 0.338,
+        "train_steps_per_second": 0.011,
+        "total_flos": 0.0,
+        "train_loss": 0.17637818212776135,
+        "epoch": 2.63,
+        "step": 150
+    }
+]]