YagiASAFAS commited on Oct 11, 2025

Commit

08718b1

verified ·

1 Parent(s): d5c4a53

Add tokenizer files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

base/config.json +125 -0
base/model.safetensors +3 -0
base/run-0/checkpoint-12114/config.json +125 -0
base/run-0/checkpoint-12114/model.safetensors +3 -0
base/run-0/checkpoint-12114/optimizer.pt +3 -0
base/run-0/checkpoint-12114/rng_state.pth +3 -0
base/run-0/checkpoint-12114/scaler.pt +3 -0
base/run-0/checkpoint-12114/scheduler.pt +3 -0
base/run-0/checkpoint-12114/trainer_state.json +1200 -0
base/run-0/checkpoint-12114/training_args.bin +3 -0
base/run-0/checkpoint-13460/config.json +125 -0
base/run-0/checkpoint-13460/model.safetensors +3 -0
base/run-0/checkpoint-13460/optimizer.pt +3 -0
base/run-0/checkpoint-13460/rng_state.pth +3 -0
base/run-0/checkpoint-13460/scaler.pt +3 -0
base/run-0/checkpoint-13460/scheduler.pt +3 -0
base/run-0/checkpoint-13460/trainer_state.json +1325 -0
base/run-0/checkpoint-13460/training_args.bin +3 -0
base/training_args.bin +3 -0
model.safetensors +1 -1
run-0/checkpoint-1011/config.json +125 -0
run-0/checkpoint-1011/model.safetensors +3 -0
run-0/checkpoint-1011/optimizer.pt +3 -0
run-0/checkpoint-1011/rng_state.pth +3 -0
run-0/checkpoint-1011/scaler.pt +3 -0
run-0/checkpoint-1011/scheduler.pt +3 -0
run-0/checkpoint-1011/trainer_state.json +219 -0
run-0/checkpoint-1011/training_args.bin +3 -0
run-0/checkpoint-1348/config.json +125 -0
run-0/checkpoint-1348/model.safetensors +3 -0
run-0/checkpoint-1348/optimizer.pt +3 -0
run-0/checkpoint-1348/rng_state.pth +3 -0
run-0/checkpoint-1348/scaler.pt +3 -0
run-0/checkpoint-1348/scheduler.pt +3 -0
run-0/checkpoint-1348/trainer_state.json +274 -0
run-0/checkpoint-1348/training_args.bin +3 -0
run-0/checkpoint-1685/config.json +125 -0
run-0/checkpoint-1685/model.safetensors +3 -0
run-0/checkpoint-1685/optimizer.pt +3 -0
run-0/checkpoint-1685/rng_state.pth +3 -0
run-0/checkpoint-1685/scaler.pt +3 -0
run-0/checkpoint-1685/scheduler.pt +3 -0
run-0/checkpoint-1685/trainer_state.json +329 -0
run-0/checkpoint-1685/training_args.bin +3 -0
run-1/checkpoint-1011/config.json +125 -0
run-1/checkpoint-1011/model.safetensors +3 -0
run-1/checkpoint-1011/optimizer.pt +3 -0
run-1/checkpoint-1011/rng_state.pth +3 -0
run-1/checkpoint-1011/scaler.pt +3 -0
run-1/checkpoint-1011/scheduler.pt +3 -0

base/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

base/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b76674ecc6fc0919cc8f40d45de3432489dfaf9d2fdb70e34c7ccf5f8b9cec02
+size 438100144

base/run-0/checkpoint-12114/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

base/run-0/checkpoint-12114/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ceb47c4a65913aad1c202a37a8f335f3f7341a98bc2771651d11ebada123a3a1
+size 438100144

base/run-0/checkpoint-12114/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0576d4ec15f6667395da0c44d28110f02fe479d0e40f63fe43bf131d57c3eee
+size 876324619

base/run-0/checkpoint-12114/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4304a38ad9b182a0a2a10944ac07c17d4feedf14cd480884bddd0b4e2598024c
+size 14645

base/run-0/checkpoint-12114/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f0a237feebe23fc2a2b21f74770edeb23806837ea34a8ebfe926f79f4333264
+size 1383

base/run-0/checkpoint-12114/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5cacb3542e3734fc040315ed400d039f8eda18c7df7a89867ea47973feb2f39c
+size 1465

base/run-0/checkpoint-12114/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1200 @@

+{
+  "best_global_step": 12114,
+  "best_metric": 0.9276388104924375,
+  "best_model_checkpoint": "./results/base/run-0/checkpoint-12114",
+  "epoch": 9.0,
+  "eval_steps": 500,
+  "global_step": 12114,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07429420505200594,
+      "grad_norm": 3.0634188652038574,
+      "learning_rate": 9.900000000000002e-06,
+      "loss": 24.5432,
+      "step": 100
+    },
+    {
+      "epoch": 0.1485884101040119,
+      "grad_norm": 1.4259201288223267,
+      "learning_rate": 1.9900000000000003e-05,
+      "loss": 0.4008,
+      "step": 200
+    },
+    {
+      "epoch": 0.22288261515601784,
+      "grad_norm": 1.9871093034744263,
+      "learning_rate": 2.9900000000000002e-05,
+      "loss": 0.3389,
+      "step": 300
+    },
+    {
+      "epoch": 0.2971768202080238,
+      "grad_norm": 1.3319053649902344,
+      "learning_rate": 3.99e-05,
+      "loss": 0.3105,
+      "step": 400
+    },
+    {
+      "epoch": 0.37147102526002973,
+      "grad_norm": 1.7693461179733276,
+      "learning_rate": 4.99e-05,
+      "loss": 0.2934,
+      "step": 500
+    },
+    {
+      "epoch": 0.4457652303120357,
+      "grad_norm": 1.8536063432693481,
+      "learning_rate": 4.9618055555555556e-05,
+      "loss": 0.2794,
+      "step": 600
+    },
+    {
+      "epoch": 0.5200594353640416,
+      "grad_norm": 0.8980482220649719,
+      "learning_rate": 4.9232253086419754e-05,
+      "loss": 0.2584,
+      "step": 700
+    },
+    {
+      "epoch": 0.5943536404160475,
+      "grad_norm": 2.4894111156463623,
+      "learning_rate": 4.884645061728395e-05,
+      "loss": 0.257,
+      "step": 800
+    },
+    {
+      "epoch": 0.6686478454680534,
+      "grad_norm": 2.6494672298431396,
+      "learning_rate": 4.846064814814815e-05,
+      "loss": 0.2434,
+      "step": 900
+    },
+    {
+      "epoch": 0.7429420505200595,
+      "grad_norm": 1.483652114868164,
+      "learning_rate": 4.807484567901235e-05,
+      "loss": 0.2612,
+      "step": 1000
+    },
+    {
+      "epoch": 0.8172362555720654,
+      "grad_norm": 1.8052722215652466,
+      "learning_rate": 4.7689043209876544e-05,
+      "loss": 0.2339,
+      "step": 1100
+    },
+    {
+      "epoch": 0.8915304606240714,
+      "grad_norm": 1.347399115562439,
+      "learning_rate": 4.730324074074074e-05,
+      "loss": 0.2337,
+      "step": 1200
+    },
+    {
+      "epoch": 0.9658246656760773,
+      "grad_norm": 2.325223922729492,
+      "learning_rate": 4.691743827160494e-05,
+      "loss": 0.2313,
+      "step": 1300
+    },
+    {
+      "epoch": 1.0,
+      "eval_administration_accuracy": 0.8859583952451708,
+      "eval_administration_f1": 0.8647430840179304,
+      "eval_corruption_accuracy": 0.9409361069836553,
+      "eval_corruption_f1": 0.9344770310075945,
+      "eval_democracy_accuracy": 0.923848439821694,
+      "eval_democracy_f1": 0.9042551904669028,
+      "eval_development_accuracy": 0.8554977711738484,
+      "eval_development_f1": 0.841554343091632,
+      "eval_economy_accuracy": 0.912518573551263,
+      "eval_economy_f1": 0.9048608101573996,
+      "eval_education_accuracy": 0.9567236255572066,
+      "eval_education_f1": 0.9544184265074659,
+      "eval_environment_accuracy": 0.9702823179791976,
+      "eval_environment_f1": 0.9701205662520187,
+      "eval_leadership_accuracy": 0.799405646359584,
+      "eval_leadership_f1": 0.7721670287980339,
+      "eval_loss": 0.21857140958309174,
+      "eval_overall_accuracy": 0.9179513372956909,
+      "eval_overall_f1": 0.9086014006669906,
+      "eval_race_accuracy": 0.9448365527488856,
+      "eval_race_f1": 0.9432357218391869,
+      "eval_religion_accuracy": 0.937778603268945,
+      "eval_religion_f1": 0.9363911612570991,
+      "eval_runtime": 6.046,
+      "eval_safety_accuracy": 0.887630014858841,
+      "eval_safety_f1": 0.8769934446086213,
+      "eval_samples_per_second": 890.499,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.739,
+      "step": 1346
+    },
+    {
+      "epoch": 1.0401188707280833,
+      "grad_norm": 1.5913788080215454,
+      "learning_rate": 4.653163580246914e-05,
+      "loss": 0.2066,
+      "step": 1400
+    },
+    {
+      "epoch": 1.1144130757800892,
+      "grad_norm": 1.1565213203430176,
+      "learning_rate": 4.614583333333334e-05,
+      "loss": 0.1776,
+      "step": 1500
+    },
+    {
+      "epoch": 1.188707280832095,
+      "grad_norm": 1.8071492910385132,
+      "learning_rate": 4.576003086419753e-05,
+      "loss": 0.1812,
+      "step": 1600
+    },
+    {
+      "epoch": 1.263001485884101,
+      "grad_norm": 0.9088364839553833,
+      "learning_rate": 4.537422839506173e-05,
+      "loss": 0.1714,
+      "step": 1700
+    },
+    {
+      "epoch": 1.3372956909361071,
+      "grad_norm": 2.001739263534546,
+      "learning_rate": 4.498842592592593e-05,
+      "loss": 0.1821,
+      "step": 1800
+    },
+    {
+      "epoch": 1.4115898959881128,
+      "grad_norm": 1.3958568572998047,
+      "learning_rate": 4.4602623456790125e-05,
+      "loss": 0.1766,
+      "step": 1900
+    },
+    {
+      "epoch": 1.485884101040119,
+      "grad_norm": 1.5210611820220947,
+      "learning_rate": 4.421682098765432e-05,
+      "loss": 0.1641,
+      "step": 2000
+    },
+    {
+      "epoch": 1.5601783060921248,
+      "grad_norm": 1.0359656810760498,
+      "learning_rate": 4.383101851851852e-05,
+      "loss": 0.1847,
+      "step": 2100
+    },
+    {
+      "epoch": 1.6344725111441307,
+      "grad_norm": 1.6115169525146484,
+      "learning_rate": 4.344521604938272e-05,
+      "loss": 0.1727,
+      "step": 2200
+    },
+    {
+      "epoch": 1.7087667161961368,
+      "grad_norm": 1.7786448001861572,
+      "learning_rate": 4.3059413580246916e-05,
+      "loss": 0.1713,
+      "step": 2300
+    },
+    {
+      "epoch": 1.7830609212481425,
+      "grad_norm": 1.320279598236084,
+      "learning_rate": 4.267361111111111e-05,
+      "loss": 0.1716,
+      "step": 2400
+    },
+    {
+      "epoch": 1.8573551263001487,
+      "grad_norm": 1.895094871520996,
+      "learning_rate": 4.228780864197531e-05,
+      "loss": 0.1703,
+      "step": 2500
+    },
+    {
+      "epoch": 1.9316493313521546,
+      "grad_norm": 3.2609572410583496,
+      "learning_rate": 4.190200617283951e-05,
+      "loss": 0.1712,
+      "step": 2600
+    },
+    {
+      "epoch": 2.0,
+      "eval_administration_accuracy": 0.8870728083209509,
+      "eval_administration_f1": 0.8829499518818239,
+      "eval_corruption_accuracy": 0.9452080237741456,
+      "eval_corruption_f1": 0.939301394284435,
+      "eval_democracy_accuracy": 0.9385215453194651,
+      "eval_democracy_f1": 0.9323158476933774,
+      "eval_development_accuracy": 0.8723997028231798,
+      "eval_development_f1": 0.8634790103771273,
+      "eval_economy_accuracy": 0.9141901931649331,
+      "eval_economy_f1": 0.9117841265429144,
+      "eval_education_accuracy": 0.9598811292719168,
+      "eval_education_f1": 0.9586754141781413,
+      "eval_environment_accuracy": 0.9723254086181278,
+      "eval_environment_f1": 0.9700404332564391,
+      "eval_leadership_accuracy": 0.8359955423476969,
+      "eval_leadership_f1": 0.8314878671023622,
+      "eval_loss": 0.19932226836681366,
+      "eval_overall_accuracy": 0.9257522288261515,
+      "eval_overall_f1": 0.9224257865223552,
+      "eval_race_accuracy": 0.9450222882615156,
+      "eval_race_f1": 0.9446551524293766,
+      "eval_religion_accuracy": 0.9418647845468053,
+      "eval_religion_f1": 0.9399027996250938,
+      "eval_runtime": 6.0661,
+      "eval_safety_accuracy": 0.8965453194650818,
+      "eval_safety_f1": 0.894517440897171,
+      "eval_samples_per_second": 887.559,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.555,
+      "step": 2692
+    },
+    {
+      "epoch": 2.0059435364041605,
+      "grad_norm": 1.0471062660217285,
+      "learning_rate": 4.1516203703703706e-05,
+      "loss": 0.1676,
+      "step": 2700
+    },
+    {
+      "epoch": 2.0802377414561666,
+      "grad_norm": 1.2078527212142944,
+      "learning_rate": 4.1130401234567904e-05,
+      "loss": 0.1192,
+      "step": 2800
+    },
+    {
+      "epoch": 2.1545319465081723,
+      "grad_norm": 0.9038800001144409,
+      "learning_rate": 4.07445987654321e-05,
+      "loss": 0.119,
+      "step": 2900
+    },
+    {
+      "epoch": 2.2288261515601784,
+      "grad_norm": 2.5787911415100098,
+      "learning_rate": 4.03587962962963e-05,
+      "loss": 0.1195,
+      "step": 3000
+    },
+    {
+      "epoch": 2.303120356612184,
+      "grad_norm": 1.0092898607254028,
+      "learning_rate": 3.9972993827160496e-05,
+      "loss": 0.1197,
+      "step": 3100
+    },
+    {
+      "epoch": 2.37741456166419,
+      "grad_norm": 1.6934309005737305,
+      "learning_rate": 3.9587191358024694e-05,
+      "loss": 0.117,
+      "step": 3200
+    },
+    {
+      "epoch": 2.4517087667161963,
+      "grad_norm": 4.028139591217041,
+      "learning_rate": 3.920138888888889e-05,
+      "loss": 0.121,
+      "step": 3300
+    },
+    {
+      "epoch": 2.526002971768202,
+      "grad_norm": 1.1819978952407837,
+      "learning_rate": 3.881558641975309e-05,
+      "loss": 0.1163,
+      "step": 3400
+    },
+    {
+      "epoch": 2.600297176820208,
+      "grad_norm": 3.9428632259368896,
+      "learning_rate": 3.842978395061729e-05,
+      "loss": 0.1172,
+      "step": 3500
+    },
+    {
+      "epoch": 2.6745913818722142,
+      "grad_norm": 2.3489303588867188,
+      "learning_rate": 3.8043981481481484e-05,
+      "loss": 0.1149,
+      "step": 3600
+    },
+    {
+      "epoch": 2.74888558692422,
+      "grad_norm": 1.8367408514022827,
+      "learning_rate": 3.765817901234568e-05,
+      "loss": 0.1227,
+      "step": 3700
+    },
+    {
+      "epoch": 2.8231797919762256,
+      "grad_norm": 1.0681540966033936,
+      "learning_rate": 3.727237654320988e-05,
+      "loss": 0.1175,
+      "step": 3800
+    },
+    {
+      "epoch": 2.8974739970282317,
+      "grad_norm": 1.2929691076278687,
+      "learning_rate": 3.688657407407408e-05,
+      "loss": 0.131,
+      "step": 3900
+    },
+    {
+      "epoch": 2.971768202080238,
+      "grad_norm": 1.355788230895996,
+      "learning_rate": 3.6500771604938275e-05,
+      "loss": 0.1105,
+      "step": 4000
+    },
+    {
+      "epoch": 3.0,
+      "eval_administration_accuracy": 0.8723997028231798,
+      "eval_administration_f1": 0.8756871269056309,
+      "eval_corruption_accuracy": 0.9494799405646359,
+      "eval_corruption_f1": 0.9479134867161034,
+      "eval_democracy_accuracy": 0.9344353640416048,
+      "eval_democracy_f1": 0.9322999557168562,
+      "eval_development_accuracy": 0.8673848439821694,
+      "eval_development_f1": 0.8644377347103656,
+      "eval_economy_accuracy": 0.913261515601783,
+      "eval_economy_f1": 0.9130435047866681,
+      "eval_education_accuracy": 0.9546805349182764,
+      "eval_education_f1": 0.9543166975188848,
+      "eval_environment_accuracy": 0.9723254086181278,
+      "eval_environment_f1": 0.972495517419135,
+      "eval_leadership_accuracy": 0.8346953937592868,
+      "eval_leadership_f1": 0.8337596310104887,
+      "eval_loss": 0.20719276368618011,
+      "eval_overall_accuracy": 0.9245139920752847,
+      "eval_overall_f1": 0.9236679939166218,
+      "eval_race_accuracy": 0.9470653789004457,
+      "eval_race_f1": 0.9466285253518817,
+      "eval_religion_accuracy": 0.9470653789004457,
+      "eval_religion_f1": 0.9448810907660032,
+      "eval_runtime": 6.0863,
+      "eval_safety_accuracy": 0.9013744427934621,
+      "eval_safety_f1": 0.8985526560974422,
+      "eval_samples_per_second": 884.606,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.37,
+      "step": 4038
+    },
+    {
+      "epoch": 3.0460624071322435,
+      "grad_norm": 1.7487143278121948,
+      "learning_rate": 3.611496913580247e-05,
+      "loss": 0.0922,
+      "step": 4100
+    },
+    {
+      "epoch": 3.1203566121842496,
+      "grad_norm": 3.5598196983337402,
+      "learning_rate": 3.572916666666667e-05,
+      "loss": 0.0834,
+      "step": 4200
+    },
+    {
+      "epoch": 3.1946508172362558,
+      "grad_norm": 1.6862306594848633,
+      "learning_rate": 3.534336419753087e-05,
+      "loss": 0.0829,
+      "step": 4300
+    },
+    {
+      "epoch": 3.2689450222882614,
+      "grad_norm": 1.7356230020523071,
+      "learning_rate": 3.495756172839506e-05,
+      "loss": 0.0793,
+      "step": 4400
+    },
+    {
+      "epoch": 3.3432392273402676,
+      "grad_norm": 1.658058524131775,
+      "learning_rate": 3.457175925925926e-05,
+      "loss": 0.0798,
+      "step": 4500
+    },
+    {
+      "epoch": 3.4175334323922733,
+      "grad_norm": 1.5869959592819214,
+      "learning_rate": 3.418595679012346e-05,
+      "loss": 0.0753,
+      "step": 4600
+    },
+    {
+      "epoch": 3.4918276374442794,
+      "grad_norm": 3.271198272705078,
+      "learning_rate": 3.380015432098765e-05,
+      "loss": 0.0853,
+      "step": 4700
+    },
+    {
+      "epoch": 3.566121842496285,
+      "grad_norm": 0.7939934730529785,
+      "learning_rate": 3.3414351851851856e-05,
+      "loss": 0.0798,
+      "step": 4800
+    },
+    {
+      "epoch": 3.640416047548291,
+      "grad_norm": 0.9978725910186768,
+      "learning_rate": 3.302854938271605e-05,
+      "loss": 0.0812,
+      "step": 4900
+    },
+    {
+      "epoch": 3.7147102526002973,
+      "grad_norm": 2.130408763885498,
+      "learning_rate": 3.2642746913580244e-05,
+      "loss": 0.0829,
+      "step": 5000
+    },
+    {
+      "epoch": 3.789004457652303,
+      "grad_norm": 0.9364782571792603,
+      "learning_rate": 3.225694444444445e-05,
+      "loss": 0.0826,
+      "step": 5100
+    },
+    {
+      "epoch": 3.863298662704309,
+      "grad_norm": 1.2428539991378784,
+      "learning_rate": 3.1871141975308646e-05,
+      "loss": 0.0842,
+      "step": 5200
+    },
+    {
+      "epoch": 3.9375928677563152,
+      "grad_norm": 2.34770131111145,
+      "learning_rate": 3.148533950617284e-05,
+      "loss": 0.086,
+      "step": 5300
+    },
+    {
+      "epoch": 4.0,
+      "eval_administration_accuracy": 0.8798291233283804,
+      "eval_administration_f1": 0.8794945259254936,
+      "eval_corruption_accuracy": 0.950780089153046,
+      "eval_corruption_f1": 0.9479334429046444,
+      "eval_democracy_accuracy": 0.937407132243685,
+      "eval_democracy_f1": 0.9365589706445473,
+      "eval_development_accuracy": 0.8764858841010401,
+      "eval_development_f1": 0.8698032455853882,
+      "eval_economy_accuracy": 0.9154903417533432,
+      "eval_economy_f1": 0.9143622167643529,
+      "eval_education_accuracy": 0.9583952451708767,
+      "eval_education_f1": 0.9569735073455015,
+      "eval_environment_accuracy": 0.9738112927191679,
+      "eval_environment_f1": 0.9731627143599846,
+      "eval_leadership_accuracy": 0.8411961367013373,
+      "eval_leadership_f1": 0.8406395571014088,
+      "eval_loss": 0.21541310846805573,
+      "eval_overall_accuracy": 0.9272381129271916,
+      "eval_overall_f1": 0.9257917541145674,
+      "eval_race_accuracy": 0.9476225854383358,
+      "eval_race_f1": 0.9465941365622704,
+      "eval_religion_accuracy": 0.9452080237741456,
+      "eval_religion_f1": 0.9437790471355962,
+      "eval_runtime": 6.0613,
+      "eval_safety_accuracy": 0.9006315007429421,
+      "eval_safety_f1": 0.9001996850456204,
+      "eval_samples_per_second": 888.26,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.599,
+      "step": 5384
+    },
+    {
+      "epoch": 4.011887072808321,
+      "grad_norm": 1.4067624807357788,
+      "learning_rate": 3.109953703703704e-05,
+      "loss": 0.0752,
+      "step": 5400
+    },
+    {
+      "epoch": 4.086181277860327,
+      "grad_norm": 3.1831161975860596,
+      "learning_rate": 3.071373456790124e-05,
+      "loss": 0.0569,
+      "step": 5500
+    },
+    {
+      "epoch": 4.160475482912333,
+      "grad_norm": 0.7918180823326111,
+      "learning_rate": 3.0327932098765433e-05,
+      "loss": 0.055,
+      "step": 5600
+    },
+    {
+      "epoch": 4.234769687964339,
+      "grad_norm": 1.334572672843933,
+      "learning_rate": 2.9942129629629627e-05,
+      "loss": 0.0557,
+      "step": 5700
+    },
+    {
+      "epoch": 4.3090638930163445,
+      "grad_norm": 0.9439612030982971,
+      "learning_rate": 2.955632716049383e-05,
+      "loss": 0.0547,
+      "step": 5800
+    },
+    {
+      "epoch": 4.383358098068351,
+      "grad_norm": 1.7661114931106567,
+      "learning_rate": 2.9170524691358026e-05,
+      "loss": 0.0589,
+      "step": 5900
+    },
+    {
+      "epoch": 4.457652303120357,
+      "grad_norm": 1.5608975887298584,
+      "learning_rate": 2.878472222222222e-05,
+      "loss": 0.0604,
+      "step": 6000
+    },
+    {
+      "epoch": 4.531946508172362,
+      "grad_norm": 2.329026460647583,
+      "learning_rate": 2.839891975308642e-05,
+      "loss": 0.0556,
+      "step": 6100
+    },
+    {
+      "epoch": 4.606240713224368,
+      "grad_norm": 1.270369529724121,
+      "learning_rate": 2.801311728395062e-05,
+      "loss": 0.0559,
+      "step": 6200
+    },
+    {
+      "epoch": 4.680534918276375,
+      "grad_norm": 1.327057123184204,
+      "learning_rate": 2.7627314814814813e-05,
+      "loss": 0.0563,
+      "step": 6300
+    },
+    {
+      "epoch": 4.75482912332838,
+      "grad_norm": 1.4530967473983765,
+      "learning_rate": 2.7241512345679014e-05,
+      "loss": 0.0559,
+      "step": 6400
+    },
+    {
+      "epoch": 4.829123328380386,
+      "grad_norm": 1.368444800376892,
+      "learning_rate": 2.685570987654321e-05,
+      "loss": 0.0588,
+      "step": 6500
+    },
+    {
+      "epoch": 4.903417533432393,
+      "grad_norm": 0.904096782207489,
+      "learning_rate": 2.6469907407407406e-05,
+      "loss": 0.0558,
+      "step": 6600
+    },
+    {
+      "epoch": 4.977711738484398,
+      "grad_norm": 1.7562211751937866,
+      "learning_rate": 2.608410493827161e-05,
+      "loss": 0.0599,
+      "step": 6700
+    },
+    {
+      "epoch": 5.0,
+      "eval_administration_accuracy": 0.8802005943536404,
+      "eval_administration_f1": 0.8791286682112321,
+      "eval_corruption_accuracy": 0.9476225854383358,
+      "eval_corruption_f1": 0.9465024742317194,
+      "eval_democracy_accuracy": 0.9277488855869243,
+      "eval_democracy_f1": 0.9283028411081555,
+      "eval_development_accuracy": 0.8718424962852898,
+      "eval_development_f1": 0.8670635241370714,
+      "eval_economy_accuracy": 0.9186478454680534,
+      "eval_economy_f1": 0.9177402812083378,
+      "eval_education_accuracy": 0.9567236255572066,
+      "eval_education_f1": 0.9563906887924067,
+      "eval_environment_accuracy": 0.9717682020802377,
+      "eval_environment_f1": 0.9714559245580735,
+      "eval_leadership_accuracy": 0.8363670133729569,
+      "eval_leadership_f1": 0.8372830889258505,
+      "eval_loss": 0.23590339720249176,
+      "eval_overall_accuracy": 0.9249318969787024,
+      "eval_overall_f1": 0.9243598065937545,
+      "eval_race_accuracy": 0.9492942050520059,
+      "eval_race_f1": 0.9489608272042858,
+      "eval_religion_accuracy": 0.9414933135215453,
+      "eval_religion_f1": 0.9417116874083546,
+      "eval_runtime": 6.0832,
+      "eval_safety_accuracy": 0.8974739970282318,
+      "eval_safety_f1": 0.897777673339568,
+      "eval_samples_per_second": 885.064,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.399,
+      "step": 6730
+    },
+    {
+      "epoch": 5.052005943536404,
+      "grad_norm": 1.0707114934921265,
+      "learning_rate": 2.5698302469135804e-05,
+      "loss": 0.0467,
+      "step": 6800
+    },
+    {
+      "epoch": 5.12630014858841,
+      "grad_norm": 1.0622857809066772,
+      "learning_rate": 2.53125e-05,
+      "loss": 0.0394,
+      "step": 6900
+    },
+    {
+      "epoch": 5.200594353640416,
+      "grad_norm": 1.1686086654663086,
+      "learning_rate": 2.49266975308642e-05,
+      "loss": 0.0416,
+      "step": 7000
+    },
+    {
+      "epoch": 5.274888558692422,
+      "grad_norm": 1.2564952373504639,
+      "learning_rate": 2.4540895061728397e-05,
+      "loss": 0.0427,
+      "step": 7100
+    },
+    {
+      "epoch": 5.349182763744428,
+      "grad_norm": 0.693988025188446,
+      "learning_rate": 2.415509259259259e-05,
+      "loss": 0.0433,
+      "step": 7200
+    },
+    {
+      "epoch": 5.423476968796434,
+      "grad_norm": 1.402803897857666,
+      "learning_rate": 2.3769290123456792e-05,
+      "loss": 0.0403,
+      "step": 7300
+    },
+    {
+      "epoch": 5.49777117384844,
+      "grad_norm": 0.35870230197906494,
+      "learning_rate": 2.3383487654320987e-05,
+      "loss": 0.0399,
+      "step": 7400
+    },
+    {
+      "epoch": 5.5720653789004455,
+      "grad_norm": 0.8109584450721741,
+      "learning_rate": 2.2997685185185188e-05,
+      "loss": 0.0404,
+      "step": 7500
+    },
+    {
+      "epoch": 5.646359583952452,
+      "grad_norm": 0.6922593116760254,
+      "learning_rate": 2.2611882716049385e-05,
+      "loss": 0.0415,
+      "step": 7600
+    },
+    {
+      "epoch": 5.720653789004458,
+      "grad_norm": 0.9838235378265381,
+      "learning_rate": 2.222608024691358e-05,
+      "loss": 0.0339,
+      "step": 7700
+    },
+    {
+      "epoch": 5.794947994056463,
+      "grad_norm": 0.4872437119483948,
+      "learning_rate": 2.184027777777778e-05,
+      "loss": 0.0417,
+      "step": 7800
+    },
+    {
+      "epoch": 5.86924219910847,
+      "grad_norm": 1.348196029663086,
+      "learning_rate": 2.1454475308641978e-05,
+      "loss": 0.0447,
+      "step": 7900
+    },
+    {
+      "epoch": 5.943536404160476,
+      "grad_norm": 1.4830248355865479,
+      "learning_rate": 2.1068672839506172e-05,
+      "loss": 0.0398,
+      "step": 8000
+    },
+    {
+      "epoch": 6.0,
+      "eval_administration_accuracy": 0.8893016344725111,
+      "eval_administration_f1": 0.8821384586084873,
+      "eval_corruption_accuracy": 0.9459509658246656,
+      "eval_corruption_f1": 0.9447882680066073,
+      "eval_democracy_accuracy": 0.9331352154531947,
+      "eval_democracy_f1": 0.9333919857361558,
+      "eval_development_accuracy": 0.8701708766716196,
+      "eval_development_f1": 0.8701330980665078,
+      "eval_economy_accuracy": 0.9171619613670133,
+      "eval_economy_f1": 0.9173996309698476,
+      "eval_education_accuracy": 0.9587667161961367,
+      "eval_education_f1": 0.958317820654174,
+      "eval_environment_accuracy": 0.9736255572065379,
+      "eval_environment_f1": 0.9732156963181571,
+      "eval_leadership_accuracy": 0.8417533432392273,
+      "eval_leadership_f1": 0.8369018544959057,
+      "eval_loss": 0.2435985654592514,
+      "eval_overall_accuracy": 0.9273774145616641,
+      "eval_overall_f1": 0.9260046966635366,
+      "eval_race_accuracy": 0.9474368499257058,
+      "eval_race_f1": 0.945994966362508,
+      "eval_religion_accuracy": 0.9474368499257058,
+      "eval_religion_f1": 0.9464647349324496,
+      "eval_runtime": 6.067,
+      "eval_safety_accuracy": 0.9037890044576523,
+      "eval_safety_f1": 0.9033098458116402,
+      "eval_samples_per_second": 887.42,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.546,
+      "step": 8076
+    },
+    {
+      "epoch": 6.017830609212481,
+      "grad_norm": 1.2368193864822388,
+      "learning_rate": 2.0682870370370373e-05,
+      "loss": 0.0415,
+      "step": 8100
+    },
+    {
+      "epoch": 6.092124814264487,
+      "grad_norm": 0.41253241896629333,
+      "learning_rate": 2.0297067901234568e-05,
+      "loss": 0.0264,
+      "step": 8200
+    },
+    {
+      "epoch": 6.166419019316494,
+      "grad_norm": 1.4119162559509277,
+      "learning_rate": 1.9911265432098765e-05,
+      "loss": 0.029,
+      "step": 8300
+    },
+    {
+      "epoch": 6.240713224368499,
+      "grad_norm": 0.38587984442710876,
+      "learning_rate": 1.9525462962962966e-05,
+      "loss": 0.0293,
+      "step": 8400
+    },
+    {
+      "epoch": 6.315007429420505,
+      "grad_norm": 1.214526653289795,
+      "learning_rate": 1.913966049382716e-05,
+      "loss": 0.0286,
+      "step": 8500
+    },
+    {
+      "epoch": 6.3893016344725115,
+      "grad_norm": 2.2572736740112305,
+      "learning_rate": 1.8753858024691358e-05,
+      "loss": 0.0309,
+      "step": 8600
+    },
+    {
+      "epoch": 6.463595839524517,
+      "grad_norm": 0.7722110152244568,
+      "learning_rate": 1.836805555555556e-05,
+      "loss": 0.0316,
+      "step": 8700
+    },
+    {
+      "epoch": 6.537890044576523,
+      "grad_norm": 1.0314061641693115,
+      "learning_rate": 1.7982253086419753e-05,
+      "loss": 0.0292,
+      "step": 8800
+    },
+    {
+      "epoch": 6.612184249628529,
+      "grad_norm": 0.6228373050689697,
+      "learning_rate": 1.759645061728395e-05,
+      "loss": 0.0287,
+      "step": 8900
+    },
+    {
+      "epoch": 6.686478454680535,
+      "grad_norm": 0.3270525336265564,
+      "learning_rate": 1.721064814814815e-05,
+      "loss": 0.0307,
+      "step": 9000
+    },
+    {
+      "epoch": 6.760772659732541,
+      "grad_norm": 1.1799579858779907,
+      "learning_rate": 1.6824845679012346e-05,
+      "loss": 0.0277,
+      "step": 9100
+    },
+    {
+      "epoch": 6.8350668647845465,
+      "grad_norm": 3.962522029876709,
+      "learning_rate": 1.6439043209876544e-05,
+      "loss": 0.029,
+      "step": 9200
+    },
+    {
+      "epoch": 6.909361069836553,
+      "grad_norm": 0.8366211652755737,
+      "learning_rate": 1.605324074074074e-05,
+      "loss": 0.03,
+      "step": 9300
+    },
+    {
+      "epoch": 6.983655274888559,
+      "grad_norm": 1.2808723449707031,
+      "learning_rate": 1.566743827160494e-05,
+      "loss": 0.0284,
+      "step": 9400
+    },
+    {
+      "epoch": 7.0,
+      "eval_administration_accuracy": 0.8759286775631501,
+      "eval_administration_f1": 0.8768026075421302,
+      "eval_corruption_accuracy": 0.9476225854383358,
+      "eval_corruption_f1": 0.9471725413953416,
+      "eval_democracy_accuracy": 0.9351783060921248,
+      "eval_democracy_f1": 0.9350529993842286,
+      "eval_development_accuracy": 0.8688707280832095,
+      "eval_development_f1": 0.8719178288623293,
+      "eval_economy_accuracy": 0.9188335809806835,
+      "eval_economy_f1": 0.9195020015774136,
+      "eval_education_accuracy": 0.9546805349182764,
+      "eval_education_f1": 0.9557389094775754,
+      "eval_environment_accuracy": 0.9732540861812778,
+      "eval_environment_f1": 0.9731958552682995,
+      "eval_leadership_accuracy": 0.8395245170876672,
+      "eval_leadership_f1": 0.840487098777998,
+      "eval_loss": 0.25289186835289,
+      "eval_overall_accuracy": 0.9253652798415057,
+      "eval_overall_f1": 0.9258748564697528,
+      "eval_race_accuracy": 0.9491084695393759,
+      "eval_race_f1": 0.9488621247872209,
+      "eval_religion_accuracy": 0.9459509658246656,
+      "eval_religion_f1": 0.945886068594284,
+      "eval_runtime": 6.0881,
+      "eval_safety_accuracy": 0.8954309063893017,
+      "eval_safety_f1": 0.8958802419702108,
+      "eval_samples_per_second": 884.354,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.354,
+      "step": 9422
+    },
+    {
+      "epoch": 7.057949479940564,
+      "grad_norm": 1.4738227128982544,
+      "learning_rate": 1.5281635802469136e-05,
+      "loss": 0.0245,
+      "step": 9500
+    },
+    {
+      "epoch": 7.132243684992571,
+      "grad_norm": 1.0899150371551514,
+      "learning_rate": 1.4895833333333334e-05,
+      "loss": 0.022,
+      "step": 9600
+    },
+    {
+      "epoch": 7.206537890044577,
+      "grad_norm": 0.9878177642822266,
+      "learning_rate": 1.4510030864197532e-05,
+      "loss": 0.0218,
+      "step": 9700
+    },
+    {
+      "epoch": 7.280832095096582,
+      "grad_norm": 0.37595194578170776,
+      "learning_rate": 1.4124228395061728e-05,
+      "loss": 0.0232,
+      "step": 9800
+    },
+    {
+      "epoch": 7.355126300148588,
+      "grad_norm": 0.7727621793746948,
+      "learning_rate": 1.3738425925925927e-05,
+      "loss": 0.0216,
+      "step": 9900
+    },
+    {
+      "epoch": 7.429420505200595,
+      "grad_norm": 0.3330998718738556,
+      "learning_rate": 1.3352623456790126e-05,
+      "loss": 0.0222,
+      "step": 10000
+    },
+    {
+      "epoch": 7.5037147102526,
+      "grad_norm": 0.5806456804275513,
+      "learning_rate": 1.296682098765432e-05,
+      "loss": 0.0219,
+      "step": 10100
+    },
+    {
+      "epoch": 7.578008915304606,
+      "grad_norm": 0.7578392028808594,
+      "learning_rate": 1.258101851851852e-05,
+      "loss": 0.0218,
+      "step": 10200
+    },
+    {
+      "epoch": 7.6523031203566125,
+      "grad_norm": 0.3120606541633606,
+      "learning_rate": 1.2195216049382717e-05,
+      "loss": 0.02,
+      "step": 10300
+    },
+    {
+      "epoch": 7.726597325408618,
+      "grad_norm": 0.637631893157959,
+      "learning_rate": 1.1809413580246915e-05,
+      "loss": 0.0196,
+      "step": 10400
+    },
+    {
+      "epoch": 7.800891530460624,
+      "grad_norm": 0.6013413071632385,
+      "learning_rate": 1.142361111111111e-05,
+      "loss": 0.0234,
+      "step": 10500
+    },
+    {
+      "epoch": 7.8751857355126305,
+      "grad_norm": 2.5481185913085938,
+      "learning_rate": 1.1037808641975308e-05,
+      "loss": 0.0218,
+      "step": 10600
+    },
+    {
+      "epoch": 7.949479940564636,
+      "grad_norm": 0.5179031491279602,
+      "learning_rate": 1.0652006172839508e-05,
+      "loss": 0.0208,
+      "step": 10700
+    },
+    {
+      "epoch": 8.0,
+      "eval_administration_accuracy": 0.8813150074294205,
+      "eval_administration_f1": 0.8795800439008289,
+      "eval_corruption_accuracy": 0.9455794947994056,
+      "eval_corruption_f1": 0.9433562694219033,
+      "eval_democracy_accuracy": 0.9366641901931649,
+      "eval_democracy_f1": 0.9365011786875334,
+      "eval_development_accuracy": 0.8694279346210996,
+      "eval_development_f1": 0.8688370502444763,
+      "eval_economy_accuracy": 0.9184621099554234,
+      "eval_economy_f1": 0.918124164419619,
+      "eval_education_accuracy": 0.9580237741456167,
+      "eval_education_f1": 0.9574723795948901,
+      "eval_environment_accuracy": 0.9738112927191679,
+      "eval_environment_f1": 0.9736854631574718,
+      "eval_leadership_accuracy": 0.8393387815750372,
+      "eval_leadership_f1": 0.839741016757979,
+      "eval_loss": 0.2596803605556488,
+      "eval_overall_accuracy": 0.9265725606736006,
+      "eval_overall_f1": 0.9260616678064877,
+      "eval_race_accuracy": 0.9465081723625557,
+      "eval_race_f1": 0.9461343616633416,
+      "eval_religion_accuracy": 0.9446508172362555,
+      "eval_religion_f1": 0.9445423673916528,
+      "eval_runtime": 6.0851,
+      "eval_safety_accuracy": 0.9050891530460624,
+      "eval_safety_f1": 0.904765718438156,
+      "eval_samples_per_second": 884.782,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.381,
+      "step": 10768
+    },
+    {
+      "epoch": 8.023774145616642,
+      "grad_norm": 0.6615686416625977,
+      "learning_rate": 1.0266203703703704e-05,
+      "loss": 0.0205,
+      "step": 10800
+    },
+    {
+      "epoch": 8.098068350668647,
+      "grad_norm": 2.661421060562134,
+      "learning_rate": 9.880401234567901e-06,
+      "loss": 0.0185,
+      "step": 10900
+    },
+    {
+      "epoch": 8.172362555720653,
+      "grad_norm": 0.6415339112281799,
+      "learning_rate": 9.494598765432099e-06,
+      "loss": 0.0164,
+      "step": 11000
+    },
+    {
+      "epoch": 8.246656760772659,
+      "grad_norm": 0.761589765548706,
+      "learning_rate": 9.108796296296296e-06,
+      "loss": 0.017,
+      "step": 11100
+    },
+    {
+      "epoch": 8.320950965824666,
+      "grad_norm": 0.6105137467384338,
+      "learning_rate": 8.722993827160494e-06,
+      "loss": 0.0174,
+      "step": 11200
+    },
+    {
+      "epoch": 8.395245170876672,
+      "grad_norm": 0.6517733931541443,
+      "learning_rate": 8.337191358024692e-06,
+      "loss": 0.0175,
+      "step": 11300
+    },
+    {
+      "epoch": 8.469539375928678,
+      "grad_norm": 0.6607377529144287,
+      "learning_rate": 7.95138888888889e-06,
+      "loss": 0.0172,
+      "step": 11400
+    },
+    {
+      "epoch": 8.543833580980683,
+      "grad_norm": 0.72126305103302,
+      "learning_rate": 7.565586419753088e-06,
+      "loss": 0.0155,
+      "step": 11500
+    },
+    {
+      "epoch": 8.618127786032689,
+      "grad_norm": 0.4402889609336853,
+      "learning_rate": 7.1797839506172844e-06,
+      "loss": 0.0173,
+      "step": 11600
+    },
+    {
+      "epoch": 8.692421991084695,
+      "grad_norm": 0.08074043691158295,
+      "learning_rate": 6.793981481481482e-06,
+      "loss": 0.014,
+      "step": 11700
+    },
+    {
+      "epoch": 8.766716196136702,
+      "grad_norm": 0.1940842866897583,
+      "learning_rate": 6.408179012345679e-06,
+      "loss": 0.0145,
+      "step": 11800
+    },
+    {
+      "epoch": 8.841010401188708,
+      "grad_norm": 0.4365254044532776,
+      "learning_rate": 6.022376543209876e-06,
+      "loss": 0.0152,
+      "step": 11900
+    },
+    {
+      "epoch": 8.915304606240714,
+      "grad_norm": 0.4619617462158203,
+      "learning_rate": 5.636574074074075e-06,
+      "loss": 0.0166,
+      "step": 12000
+    },
+    {
+      "epoch": 8.98959881129272,
+      "grad_norm": 0.22596906125545502,
+      "learning_rate": 5.250771604938272e-06,
+      "loss": 0.0156,
+      "step": 12100
+    },
+    {
+      "epoch": 9.0,
+      "eval_administration_accuracy": 0.888001485884101,
+      "eval_administration_f1": 0.8840369764257654,
+      "eval_corruption_accuracy": 0.9474368499257058,
+      "eval_corruption_f1": 0.9462275023250412,
+      "eval_democracy_accuracy": 0.937035661218425,
+      "eval_democracy_f1": 0.9349797337427957,
+      "eval_development_accuracy": 0.8777860326894502,
+      "eval_development_f1": 0.8758984879855292,
+      "eval_economy_accuracy": 0.9188335809806835,
+      "eval_economy_f1": 0.9183485908645431,
+      "eval_education_accuracy": 0.9613670133729569,
+      "eval_education_f1": 0.9605424054563209,
+      "eval_environment_accuracy": 0.9745542347696879,
+      "eval_environment_f1": 0.97406579666089,
+      "eval_leadership_accuracy": 0.8447251114413076,
+      "eval_leadership_f1": 0.8447097008519563,
+      "eval_loss": 0.26206690073013306,
+      "eval_overall_accuracy": 0.9286001733531449,
+      "eval_overall_f1": 0.9276388104924375,
+      "eval_race_accuracy": 0.9476225854383358,
+      "eval_race_f1": 0.947246539022533,
+      "eval_religion_accuracy": 0.9446508172362555,
+      "eval_religion_f1": 0.9438393498317825,
+      "eval_runtime": 6.0648,
+      "eval_safety_accuracy": 0.9011887072808321,
+      "eval_safety_f1": 0.9017706427420923,
+      "eval_samples_per_second": 887.753,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.567,
+      "step": 12114
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 13460,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5.095302134877389e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": {
+    "gradient_accumulation_steps": 1,
+    "learning_rate": 5e-05,
+    "num_train_epochs": 10
+  }
+}

base/run-0/checkpoint-12114/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a9f417d3b26827f3c2091fa30ae27025fb9a89bba46b9e16e8ce16798492c41b
+size 5841

base/run-0/checkpoint-13460/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

base/run-0/checkpoint-13460/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b76674ecc6fc0919cc8f40d45de3432489dfaf9d2fdb70e34c7ccf5f8b9cec02
+size 438100144

base/run-0/checkpoint-13460/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62c3b8fca9ea8a8edac76ca86d365899fa3e6b808ba90dcad9714eebdefe6424
+size 876324619

base/run-0/checkpoint-13460/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1eff495602e83b92f12f4acdaacae3ab373669aa51da2d8ae878591e05ceec87
+size 14645

base/run-0/checkpoint-13460/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1cec2270e3eb9f1e8481eea08cc2a8e1fda802715fad23443fac1a661d52d19
+size 1383

base/run-0/checkpoint-13460/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2b6ac0e53b00ed502f85792601c8ec35ed8fbb1644371aba2be316f64b7534a
+size 1465

base/run-0/checkpoint-13460/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1325 @@

+{
+  "best_global_step": 12114,
+  "best_metric": 0.9276388104924375,
+  "best_model_checkpoint": "./results/base/run-0/checkpoint-12114",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 13460,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07429420505200594,
+      "grad_norm": 3.0634188652038574,
+      "learning_rate": 9.900000000000002e-06,
+      "loss": 24.5432,
+      "step": 100
+    },
+    {
+      "epoch": 0.1485884101040119,
+      "grad_norm": 1.4259201288223267,
+      "learning_rate": 1.9900000000000003e-05,
+      "loss": 0.4008,
+      "step": 200
+    },
+    {
+      "epoch": 0.22288261515601784,
+      "grad_norm": 1.9871093034744263,
+      "learning_rate": 2.9900000000000002e-05,
+      "loss": 0.3389,
+      "step": 300
+    },
+    {
+      "epoch": 0.2971768202080238,
+      "grad_norm": 1.3319053649902344,
+      "learning_rate": 3.99e-05,
+      "loss": 0.3105,
+      "step": 400
+    },
+    {
+      "epoch": 0.37147102526002973,
+      "grad_norm": 1.7693461179733276,
+      "learning_rate": 4.99e-05,
+      "loss": 0.2934,
+      "step": 500
+    },
+    {
+      "epoch": 0.4457652303120357,
+      "grad_norm": 1.8536063432693481,
+      "learning_rate": 4.9618055555555556e-05,
+      "loss": 0.2794,
+      "step": 600
+    },
+    {
+      "epoch": 0.5200594353640416,
+      "grad_norm": 0.8980482220649719,
+      "learning_rate": 4.9232253086419754e-05,
+      "loss": 0.2584,
+      "step": 700
+    },
+    {
+      "epoch": 0.5943536404160475,
+      "grad_norm": 2.4894111156463623,
+      "learning_rate": 4.884645061728395e-05,
+      "loss": 0.257,
+      "step": 800
+    },
+    {
+      "epoch": 0.6686478454680534,
+      "grad_norm": 2.6494672298431396,
+      "learning_rate": 4.846064814814815e-05,
+      "loss": 0.2434,
+      "step": 900
+    },
+    {
+      "epoch": 0.7429420505200595,
+      "grad_norm": 1.483652114868164,
+      "learning_rate": 4.807484567901235e-05,
+      "loss": 0.2612,
+      "step": 1000
+    },
+    {
+      "epoch": 0.8172362555720654,
+      "grad_norm": 1.8052722215652466,
+      "learning_rate": 4.7689043209876544e-05,
+      "loss": 0.2339,
+      "step": 1100
+    },
+    {
+      "epoch": 0.8915304606240714,
+      "grad_norm": 1.347399115562439,
+      "learning_rate": 4.730324074074074e-05,
+      "loss": 0.2337,
+      "step": 1200
+    },
+    {
+      "epoch": 0.9658246656760773,
+      "grad_norm": 2.325223922729492,
+      "learning_rate": 4.691743827160494e-05,
+      "loss": 0.2313,
+      "step": 1300
+    },
+    {
+      "epoch": 1.0,
+      "eval_administration_accuracy": 0.8859583952451708,
+      "eval_administration_f1": 0.8647430840179304,
+      "eval_corruption_accuracy": 0.9409361069836553,
+      "eval_corruption_f1": 0.9344770310075945,
+      "eval_democracy_accuracy": 0.923848439821694,
+      "eval_democracy_f1": 0.9042551904669028,
+      "eval_development_accuracy": 0.8554977711738484,
+      "eval_development_f1": 0.841554343091632,
+      "eval_economy_accuracy": 0.912518573551263,
+      "eval_economy_f1": 0.9048608101573996,
+      "eval_education_accuracy": 0.9567236255572066,
+      "eval_education_f1": 0.9544184265074659,
+      "eval_environment_accuracy": 0.9702823179791976,
+      "eval_environment_f1": 0.9701205662520187,
+      "eval_leadership_accuracy": 0.799405646359584,
+      "eval_leadership_f1": 0.7721670287980339,
+      "eval_loss": 0.21857140958309174,
+      "eval_overall_accuracy": 0.9179513372956909,
+      "eval_overall_f1": 0.9086014006669906,
+      "eval_race_accuracy": 0.9448365527488856,
+      "eval_race_f1": 0.9432357218391869,
+      "eval_religion_accuracy": 0.937778603268945,
+      "eval_religion_f1": 0.9363911612570991,
+      "eval_runtime": 6.046,
+      "eval_safety_accuracy": 0.887630014858841,
+      "eval_safety_f1": 0.8769934446086213,
+      "eval_samples_per_second": 890.499,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.739,
+      "step": 1346
+    },
+    {
+      "epoch": 1.0401188707280833,
+      "grad_norm": 1.5913788080215454,
+      "learning_rate": 4.653163580246914e-05,
+      "loss": 0.2066,
+      "step": 1400
+    },
+    {
+      "epoch": 1.1144130757800892,
+      "grad_norm": 1.1565213203430176,
+      "learning_rate": 4.614583333333334e-05,
+      "loss": 0.1776,
+      "step": 1500
+    },
+    {
+      "epoch": 1.188707280832095,
+      "grad_norm": 1.8071492910385132,
+      "learning_rate": 4.576003086419753e-05,
+      "loss": 0.1812,
+      "step": 1600
+    },
+    {
+      "epoch": 1.263001485884101,
+      "grad_norm": 0.9088364839553833,
+      "learning_rate": 4.537422839506173e-05,
+      "loss": 0.1714,
+      "step": 1700
+    },
+    {
+      "epoch": 1.3372956909361071,
+      "grad_norm": 2.001739263534546,
+      "learning_rate": 4.498842592592593e-05,
+      "loss": 0.1821,
+      "step": 1800
+    },
+    {
+      "epoch": 1.4115898959881128,
+      "grad_norm": 1.3958568572998047,
+      "learning_rate": 4.4602623456790125e-05,
+      "loss": 0.1766,
+      "step": 1900
+    },
+    {
+      "epoch": 1.485884101040119,
+      "grad_norm": 1.5210611820220947,
+      "learning_rate": 4.421682098765432e-05,
+      "loss": 0.1641,
+      "step": 2000
+    },
+    {
+      "epoch": 1.5601783060921248,
+      "grad_norm": 1.0359656810760498,
+      "learning_rate": 4.383101851851852e-05,
+      "loss": 0.1847,
+      "step": 2100
+    },
+    {
+      "epoch": 1.6344725111441307,
+      "grad_norm": 1.6115169525146484,
+      "learning_rate": 4.344521604938272e-05,
+      "loss": 0.1727,
+      "step": 2200
+    },
+    {
+      "epoch": 1.7087667161961368,
+      "grad_norm": 1.7786448001861572,
+      "learning_rate": 4.3059413580246916e-05,
+      "loss": 0.1713,
+      "step": 2300
+    },
+    {
+      "epoch": 1.7830609212481425,
+      "grad_norm": 1.320279598236084,
+      "learning_rate": 4.267361111111111e-05,
+      "loss": 0.1716,
+      "step": 2400
+    },
+    {
+      "epoch": 1.8573551263001487,
+      "grad_norm": 1.895094871520996,
+      "learning_rate": 4.228780864197531e-05,
+      "loss": 0.1703,
+      "step": 2500
+    },
+    {
+      "epoch": 1.9316493313521546,
+      "grad_norm": 3.2609572410583496,
+      "learning_rate": 4.190200617283951e-05,
+      "loss": 0.1712,
+      "step": 2600
+    },
+    {
+      "epoch": 2.0,
+      "eval_administration_accuracy": 0.8870728083209509,
+      "eval_administration_f1": 0.8829499518818239,
+      "eval_corruption_accuracy": 0.9452080237741456,
+      "eval_corruption_f1": 0.939301394284435,
+      "eval_democracy_accuracy": 0.9385215453194651,
+      "eval_democracy_f1": 0.9323158476933774,
+      "eval_development_accuracy": 0.8723997028231798,
+      "eval_development_f1": 0.8634790103771273,
+      "eval_economy_accuracy": 0.9141901931649331,
+      "eval_economy_f1": 0.9117841265429144,
+      "eval_education_accuracy": 0.9598811292719168,
+      "eval_education_f1": 0.9586754141781413,
+      "eval_environment_accuracy": 0.9723254086181278,
+      "eval_environment_f1": 0.9700404332564391,
+      "eval_leadership_accuracy": 0.8359955423476969,
+      "eval_leadership_f1": 0.8314878671023622,
+      "eval_loss": 0.19932226836681366,
+      "eval_overall_accuracy": 0.9257522288261515,
+      "eval_overall_f1": 0.9224257865223552,
+      "eval_race_accuracy": 0.9450222882615156,
+      "eval_race_f1": 0.9446551524293766,
+      "eval_religion_accuracy": 0.9418647845468053,
+      "eval_religion_f1": 0.9399027996250938,
+      "eval_runtime": 6.0661,
+      "eval_safety_accuracy": 0.8965453194650818,
+      "eval_safety_f1": 0.894517440897171,
+      "eval_samples_per_second": 887.559,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.555,
+      "step": 2692
+    },
+    {
+      "epoch": 2.0059435364041605,
+      "grad_norm": 1.0471062660217285,
+      "learning_rate": 4.1516203703703706e-05,
+      "loss": 0.1676,
+      "step": 2700
+    },
+    {
+      "epoch": 2.0802377414561666,
+      "grad_norm": 1.2078527212142944,
+      "learning_rate": 4.1130401234567904e-05,
+      "loss": 0.1192,
+      "step": 2800
+    },
+    {
+      "epoch": 2.1545319465081723,
+      "grad_norm": 0.9038800001144409,
+      "learning_rate": 4.07445987654321e-05,
+      "loss": 0.119,
+      "step": 2900
+    },
+    {
+      "epoch": 2.2288261515601784,
+      "grad_norm": 2.5787911415100098,
+      "learning_rate": 4.03587962962963e-05,
+      "loss": 0.1195,
+      "step": 3000
+    },
+    {
+      "epoch": 2.303120356612184,
+      "grad_norm": 1.0092898607254028,
+      "learning_rate": 3.9972993827160496e-05,
+      "loss": 0.1197,
+      "step": 3100
+    },
+    {
+      "epoch": 2.37741456166419,
+      "grad_norm": 1.6934309005737305,
+      "learning_rate": 3.9587191358024694e-05,
+      "loss": 0.117,
+      "step": 3200
+    },
+    {
+      "epoch": 2.4517087667161963,
+      "grad_norm": 4.028139591217041,
+      "learning_rate": 3.920138888888889e-05,
+      "loss": 0.121,
+      "step": 3300
+    },
+    {
+      "epoch": 2.526002971768202,
+      "grad_norm": 1.1819978952407837,
+      "learning_rate": 3.881558641975309e-05,
+      "loss": 0.1163,
+      "step": 3400
+    },
+    {
+      "epoch": 2.600297176820208,
+      "grad_norm": 3.9428632259368896,
+      "learning_rate": 3.842978395061729e-05,
+      "loss": 0.1172,
+      "step": 3500
+    },
+    {
+      "epoch": 2.6745913818722142,
+      "grad_norm": 2.3489303588867188,
+      "learning_rate": 3.8043981481481484e-05,
+      "loss": 0.1149,
+      "step": 3600
+    },
+    {
+      "epoch": 2.74888558692422,
+      "grad_norm": 1.8367408514022827,
+      "learning_rate": 3.765817901234568e-05,
+      "loss": 0.1227,
+      "step": 3700
+    },
+    {
+      "epoch": 2.8231797919762256,
+      "grad_norm": 1.0681540966033936,
+      "learning_rate": 3.727237654320988e-05,
+      "loss": 0.1175,
+      "step": 3800
+    },
+    {
+      "epoch": 2.8974739970282317,
+      "grad_norm": 1.2929691076278687,
+      "learning_rate": 3.688657407407408e-05,
+      "loss": 0.131,
+      "step": 3900
+    },
+    {
+      "epoch": 2.971768202080238,
+      "grad_norm": 1.355788230895996,
+      "learning_rate": 3.6500771604938275e-05,
+      "loss": 0.1105,
+      "step": 4000
+    },
+    {
+      "epoch": 3.0,
+      "eval_administration_accuracy": 0.8723997028231798,
+      "eval_administration_f1": 0.8756871269056309,
+      "eval_corruption_accuracy": 0.9494799405646359,
+      "eval_corruption_f1": 0.9479134867161034,
+      "eval_democracy_accuracy": 0.9344353640416048,
+      "eval_democracy_f1": 0.9322999557168562,
+      "eval_development_accuracy": 0.8673848439821694,
+      "eval_development_f1": 0.8644377347103656,
+      "eval_economy_accuracy": 0.913261515601783,
+      "eval_economy_f1": 0.9130435047866681,
+      "eval_education_accuracy": 0.9546805349182764,
+      "eval_education_f1": 0.9543166975188848,
+      "eval_environment_accuracy": 0.9723254086181278,
+      "eval_environment_f1": 0.972495517419135,
+      "eval_leadership_accuracy": 0.8346953937592868,
+      "eval_leadership_f1": 0.8337596310104887,
+      "eval_loss": 0.20719276368618011,
+      "eval_overall_accuracy": 0.9245139920752847,
+      "eval_overall_f1": 0.9236679939166218,
+      "eval_race_accuracy": 0.9470653789004457,
+      "eval_race_f1": 0.9466285253518817,
+      "eval_religion_accuracy": 0.9470653789004457,
+      "eval_religion_f1": 0.9448810907660032,
+      "eval_runtime": 6.0863,
+      "eval_safety_accuracy": 0.9013744427934621,
+      "eval_safety_f1": 0.8985526560974422,
+      "eval_samples_per_second": 884.606,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.37,
+      "step": 4038
+    },
+    {
+      "epoch": 3.0460624071322435,
+      "grad_norm": 1.7487143278121948,
+      "learning_rate": 3.611496913580247e-05,
+      "loss": 0.0922,
+      "step": 4100
+    },
+    {
+      "epoch": 3.1203566121842496,
+      "grad_norm": 3.5598196983337402,
+      "learning_rate": 3.572916666666667e-05,
+      "loss": 0.0834,
+      "step": 4200
+    },
+    {
+      "epoch": 3.1946508172362558,
+      "grad_norm": 1.6862306594848633,
+      "learning_rate": 3.534336419753087e-05,
+      "loss": 0.0829,
+      "step": 4300
+    },
+    {
+      "epoch": 3.2689450222882614,
+      "grad_norm": 1.7356230020523071,
+      "learning_rate": 3.495756172839506e-05,
+      "loss": 0.0793,
+      "step": 4400
+    },
+    {
+      "epoch": 3.3432392273402676,
+      "grad_norm": 1.658058524131775,
+      "learning_rate": 3.457175925925926e-05,
+      "loss": 0.0798,
+      "step": 4500
+    },
+    {
+      "epoch": 3.4175334323922733,
+      "grad_norm": 1.5869959592819214,
+      "learning_rate": 3.418595679012346e-05,
+      "loss": 0.0753,
+      "step": 4600
+    },
+    {
+      "epoch": 3.4918276374442794,
+      "grad_norm": 3.271198272705078,
+      "learning_rate": 3.380015432098765e-05,
+      "loss": 0.0853,
+      "step": 4700
+    },
+    {
+      "epoch": 3.566121842496285,
+      "grad_norm": 0.7939934730529785,
+      "learning_rate": 3.3414351851851856e-05,
+      "loss": 0.0798,
+      "step": 4800
+    },
+    {
+      "epoch": 3.640416047548291,
+      "grad_norm": 0.9978725910186768,
+      "learning_rate": 3.302854938271605e-05,
+      "loss": 0.0812,
+      "step": 4900
+    },
+    {
+      "epoch": 3.7147102526002973,
+      "grad_norm": 2.130408763885498,
+      "learning_rate": 3.2642746913580244e-05,
+      "loss": 0.0829,
+      "step": 5000
+    },
+    {
+      "epoch": 3.789004457652303,
+      "grad_norm": 0.9364782571792603,
+      "learning_rate": 3.225694444444445e-05,
+      "loss": 0.0826,
+      "step": 5100
+    },
+    {
+      "epoch": 3.863298662704309,
+      "grad_norm": 1.2428539991378784,
+      "learning_rate": 3.1871141975308646e-05,
+      "loss": 0.0842,
+      "step": 5200
+    },
+    {
+      "epoch": 3.9375928677563152,
+      "grad_norm": 2.34770131111145,
+      "learning_rate": 3.148533950617284e-05,
+      "loss": 0.086,
+      "step": 5300
+    },
+    {
+      "epoch": 4.0,
+      "eval_administration_accuracy": 0.8798291233283804,
+      "eval_administration_f1": 0.8794945259254936,
+      "eval_corruption_accuracy": 0.950780089153046,
+      "eval_corruption_f1": 0.9479334429046444,
+      "eval_democracy_accuracy": 0.937407132243685,
+      "eval_democracy_f1": 0.9365589706445473,
+      "eval_development_accuracy": 0.8764858841010401,
+      "eval_development_f1": 0.8698032455853882,
+      "eval_economy_accuracy": 0.9154903417533432,
+      "eval_economy_f1": 0.9143622167643529,
+      "eval_education_accuracy": 0.9583952451708767,
+      "eval_education_f1": 0.9569735073455015,
+      "eval_environment_accuracy": 0.9738112927191679,
+      "eval_environment_f1": 0.9731627143599846,
+      "eval_leadership_accuracy": 0.8411961367013373,
+      "eval_leadership_f1": 0.8406395571014088,
+      "eval_loss": 0.21541310846805573,
+      "eval_overall_accuracy": 0.9272381129271916,
+      "eval_overall_f1": 0.9257917541145674,
+      "eval_race_accuracy": 0.9476225854383358,
+      "eval_race_f1": 0.9465941365622704,
+      "eval_religion_accuracy": 0.9452080237741456,
+      "eval_religion_f1": 0.9437790471355962,
+      "eval_runtime": 6.0613,
+      "eval_safety_accuracy": 0.9006315007429421,
+      "eval_safety_f1": 0.9001996850456204,
+      "eval_samples_per_second": 888.26,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.599,
+      "step": 5384
+    },
+    {
+      "epoch": 4.011887072808321,
+      "grad_norm": 1.4067624807357788,
+      "learning_rate": 3.109953703703704e-05,
+      "loss": 0.0752,
+      "step": 5400
+    },
+    {
+      "epoch": 4.086181277860327,
+      "grad_norm": 3.1831161975860596,
+      "learning_rate": 3.071373456790124e-05,
+      "loss": 0.0569,
+      "step": 5500
+    },
+    {
+      "epoch": 4.160475482912333,
+      "grad_norm": 0.7918180823326111,
+      "learning_rate": 3.0327932098765433e-05,
+      "loss": 0.055,
+      "step": 5600
+    },
+    {
+      "epoch": 4.234769687964339,
+      "grad_norm": 1.334572672843933,
+      "learning_rate": 2.9942129629629627e-05,
+      "loss": 0.0557,
+      "step": 5700
+    },
+    {
+      "epoch": 4.3090638930163445,
+      "grad_norm": 0.9439612030982971,
+      "learning_rate": 2.955632716049383e-05,
+      "loss": 0.0547,
+      "step": 5800
+    },
+    {
+      "epoch": 4.383358098068351,
+      "grad_norm": 1.7661114931106567,
+      "learning_rate": 2.9170524691358026e-05,
+      "loss": 0.0589,
+      "step": 5900
+    },
+    {
+      "epoch": 4.457652303120357,
+      "grad_norm": 1.5608975887298584,
+      "learning_rate": 2.878472222222222e-05,
+      "loss": 0.0604,
+      "step": 6000
+    },
+    {
+      "epoch": 4.531946508172362,
+      "grad_norm": 2.329026460647583,
+      "learning_rate": 2.839891975308642e-05,
+      "loss": 0.0556,
+      "step": 6100
+    },
+    {
+      "epoch": 4.606240713224368,
+      "grad_norm": 1.270369529724121,
+      "learning_rate": 2.801311728395062e-05,
+      "loss": 0.0559,
+      "step": 6200
+    },
+    {
+      "epoch": 4.680534918276375,
+      "grad_norm": 1.327057123184204,
+      "learning_rate": 2.7627314814814813e-05,
+      "loss": 0.0563,
+      "step": 6300
+    },
+    {
+      "epoch": 4.75482912332838,
+      "grad_norm": 1.4530967473983765,
+      "learning_rate": 2.7241512345679014e-05,
+      "loss": 0.0559,
+      "step": 6400
+    },
+    {
+      "epoch": 4.829123328380386,
+      "grad_norm": 1.368444800376892,
+      "learning_rate": 2.685570987654321e-05,
+      "loss": 0.0588,
+      "step": 6500
+    },
+    {
+      "epoch": 4.903417533432393,
+      "grad_norm": 0.904096782207489,
+      "learning_rate": 2.6469907407407406e-05,
+      "loss": 0.0558,
+      "step": 6600
+    },
+    {
+      "epoch": 4.977711738484398,
+      "grad_norm": 1.7562211751937866,
+      "learning_rate": 2.608410493827161e-05,
+      "loss": 0.0599,
+      "step": 6700
+    },
+    {
+      "epoch": 5.0,
+      "eval_administration_accuracy": 0.8802005943536404,
+      "eval_administration_f1": 0.8791286682112321,
+      "eval_corruption_accuracy": 0.9476225854383358,
+      "eval_corruption_f1": 0.9465024742317194,
+      "eval_democracy_accuracy": 0.9277488855869243,
+      "eval_democracy_f1": 0.9283028411081555,
+      "eval_development_accuracy": 0.8718424962852898,
+      "eval_development_f1": 0.8670635241370714,
+      "eval_economy_accuracy": 0.9186478454680534,
+      "eval_economy_f1": 0.9177402812083378,
+      "eval_education_accuracy": 0.9567236255572066,
+      "eval_education_f1": 0.9563906887924067,
+      "eval_environment_accuracy": 0.9717682020802377,
+      "eval_environment_f1": 0.9714559245580735,
+      "eval_leadership_accuracy": 0.8363670133729569,
+      "eval_leadership_f1": 0.8372830889258505,
+      "eval_loss": 0.23590339720249176,
+      "eval_overall_accuracy": 0.9249318969787024,
+      "eval_overall_f1": 0.9243598065937545,
+      "eval_race_accuracy": 0.9492942050520059,
+      "eval_race_f1": 0.9489608272042858,
+      "eval_religion_accuracy": 0.9414933135215453,
+      "eval_religion_f1": 0.9417116874083546,
+      "eval_runtime": 6.0832,
+      "eval_safety_accuracy": 0.8974739970282318,
+      "eval_safety_f1": 0.897777673339568,
+      "eval_samples_per_second": 885.064,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.399,
+      "step": 6730
+    },
+    {
+      "epoch": 5.052005943536404,
+      "grad_norm": 1.0707114934921265,
+      "learning_rate": 2.5698302469135804e-05,
+      "loss": 0.0467,
+      "step": 6800
+    },
+    {
+      "epoch": 5.12630014858841,
+      "grad_norm": 1.0622857809066772,
+      "learning_rate": 2.53125e-05,
+      "loss": 0.0394,
+      "step": 6900
+    },
+    {
+      "epoch": 5.200594353640416,
+      "grad_norm": 1.1686086654663086,
+      "learning_rate": 2.49266975308642e-05,
+      "loss": 0.0416,
+      "step": 7000
+    },
+    {
+      "epoch": 5.274888558692422,
+      "grad_norm": 1.2564952373504639,
+      "learning_rate": 2.4540895061728397e-05,
+      "loss": 0.0427,
+      "step": 7100
+    },
+    {
+      "epoch": 5.349182763744428,
+      "grad_norm": 0.693988025188446,
+      "learning_rate": 2.415509259259259e-05,
+      "loss": 0.0433,
+      "step": 7200
+    },
+    {
+      "epoch": 5.423476968796434,
+      "grad_norm": 1.402803897857666,
+      "learning_rate": 2.3769290123456792e-05,
+      "loss": 0.0403,
+      "step": 7300
+    },
+    {
+      "epoch": 5.49777117384844,
+      "grad_norm": 0.35870230197906494,
+      "learning_rate": 2.3383487654320987e-05,
+      "loss": 0.0399,
+      "step": 7400
+    },
+    {
+      "epoch": 5.5720653789004455,
+      "grad_norm": 0.8109584450721741,
+      "learning_rate": 2.2997685185185188e-05,
+      "loss": 0.0404,
+      "step": 7500
+    },
+    {
+      "epoch": 5.646359583952452,
+      "grad_norm": 0.6922593116760254,
+      "learning_rate": 2.2611882716049385e-05,
+      "loss": 0.0415,
+      "step": 7600
+    },
+    {
+      "epoch": 5.720653789004458,
+      "grad_norm": 0.9838235378265381,
+      "learning_rate": 2.222608024691358e-05,
+      "loss": 0.0339,
+      "step": 7700
+    },
+    {
+      "epoch": 5.794947994056463,
+      "grad_norm": 0.4872437119483948,
+      "learning_rate": 2.184027777777778e-05,
+      "loss": 0.0417,
+      "step": 7800
+    },
+    {
+      "epoch": 5.86924219910847,
+      "grad_norm": 1.348196029663086,
+      "learning_rate": 2.1454475308641978e-05,
+      "loss": 0.0447,
+      "step": 7900
+    },
+    {
+      "epoch": 5.943536404160476,
+      "grad_norm": 1.4830248355865479,
+      "learning_rate": 2.1068672839506172e-05,
+      "loss": 0.0398,
+      "step": 8000
+    },
+    {
+      "epoch": 6.0,
+      "eval_administration_accuracy": 0.8893016344725111,
+      "eval_administration_f1": 0.8821384586084873,
+      "eval_corruption_accuracy": 0.9459509658246656,
+      "eval_corruption_f1": 0.9447882680066073,
+      "eval_democracy_accuracy": 0.9331352154531947,
+      "eval_democracy_f1": 0.9333919857361558,
+      "eval_development_accuracy": 0.8701708766716196,
+      "eval_development_f1": 0.8701330980665078,
+      "eval_economy_accuracy": 0.9171619613670133,
+      "eval_economy_f1": 0.9173996309698476,
+      "eval_education_accuracy": 0.9587667161961367,
+      "eval_education_f1": 0.958317820654174,
+      "eval_environment_accuracy": 0.9736255572065379,
+      "eval_environment_f1": 0.9732156963181571,
+      "eval_leadership_accuracy": 0.8417533432392273,
+      "eval_leadership_f1": 0.8369018544959057,
+      "eval_loss": 0.2435985654592514,
+      "eval_overall_accuracy": 0.9273774145616641,
+      "eval_overall_f1": 0.9260046966635366,
+      "eval_race_accuracy": 0.9474368499257058,
+      "eval_race_f1": 0.945994966362508,
+      "eval_religion_accuracy": 0.9474368499257058,
+      "eval_religion_f1": 0.9464647349324496,
+      "eval_runtime": 6.067,
+      "eval_safety_accuracy": 0.9037890044576523,
+      "eval_safety_f1": 0.9033098458116402,
+      "eval_samples_per_second": 887.42,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.546,
+      "step": 8076
+    },
+    {
+      "epoch": 6.017830609212481,
+      "grad_norm": 1.2368193864822388,
+      "learning_rate": 2.0682870370370373e-05,
+      "loss": 0.0415,
+      "step": 8100
+    },
+    {
+      "epoch": 6.092124814264487,
+      "grad_norm": 0.41253241896629333,
+      "learning_rate": 2.0297067901234568e-05,
+      "loss": 0.0264,
+      "step": 8200
+    },
+    {
+      "epoch": 6.166419019316494,
+      "grad_norm": 1.4119162559509277,
+      "learning_rate": 1.9911265432098765e-05,
+      "loss": 0.029,
+      "step": 8300
+    },
+    {
+      "epoch": 6.240713224368499,
+      "grad_norm": 0.38587984442710876,
+      "learning_rate": 1.9525462962962966e-05,
+      "loss": 0.0293,
+      "step": 8400
+    },
+    {
+      "epoch": 6.315007429420505,
+      "grad_norm": 1.214526653289795,
+      "learning_rate": 1.913966049382716e-05,
+      "loss": 0.0286,
+      "step": 8500
+    },
+    {
+      "epoch": 6.3893016344725115,
+      "grad_norm": 2.2572736740112305,
+      "learning_rate": 1.8753858024691358e-05,
+      "loss": 0.0309,
+      "step": 8600
+    },
+    {
+      "epoch": 6.463595839524517,
+      "grad_norm": 0.7722110152244568,
+      "learning_rate": 1.836805555555556e-05,
+      "loss": 0.0316,
+      "step": 8700
+    },
+    {
+      "epoch": 6.537890044576523,
+      "grad_norm": 1.0314061641693115,
+      "learning_rate": 1.7982253086419753e-05,
+      "loss": 0.0292,
+      "step": 8800
+    },
+    {
+      "epoch": 6.612184249628529,
+      "grad_norm": 0.6228373050689697,
+      "learning_rate": 1.759645061728395e-05,
+      "loss": 0.0287,
+      "step": 8900
+    },
+    {
+      "epoch": 6.686478454680535,
+      "grad_norm": 0.3270525336265564,
+      "learning_rate": 1.721064814814815e-05,
+      "loss": 0.0307,
+      "step": 9000
+    },
+    {
+      "epoch": 6.760772659732541,
+      "grad_norm": 1.1799579858779907,
+      "learning_rate": 1.6824845679012346e-05,
+      "loss": 0.0277,
+      "step": 9100
+    },
+    {
+      "epoch": 6.8350668647845465,
+      "grad_norm": 3.962522029876709,
+      "learning_rate": 1.6439043209876544e-05,
+      "loss": 0.029,
+      "step": 9200
+    },
+    {
+      "epoch": 6.909361069836553,
+      "grad_norm": 0.8366211652755737,
+      "learning_rate": 1.605324074074074e-05,
+      "loss": 0.03,
+      "step": 9300
+    },
+    {
+      "epoch": 6.983655274888559,
+      "grad_norm": 1.2808723449707031,
+      "learning_rate": 1.566743827160494e-05,
+      "loss": 0.0284,
+      "step": 9400
+    },
+    {
+      "epoch": 7.0,
+      "eval_administration_accuracy": 0.8759286775631501,
+      "eval_administration_f1": 0.8768026075421302,
+      "eval_corruption_accuracy": 0.9476225854383358,
+      "eval_corruption_f1": 0.9471725413953416,
+      "eval_democracy_accuracy": 0.9351783060921248,
+      "eval_democracy_f1": 0.9350529993842286,
+      "eval_development_accuracy": 0.8688707280832095,
+      "eval_development_f1": 0.8719178288623293,
+      "eval_economy_accuracy": 0.9188335809806835,
+      "eval_economy_f1": 0.9195020015774136,
+      "eval_education_accuracy": 0.9546805349182764,
+      "eval_education_f1": 0.9557389094775754,
+      "eval_environment_accuracy": 0.9732540861812778,
+      "eval_environment_f1": 0.9731958552682995,
+      "eval_leadership_accuracy": 0.8395245170876672,
+      "eval_leadership_f1": 0.840487098777998,
+      "eval_loss": 0.25289186835289,
+      "eval_overall_accuracy": 0.9253652798415057,
+      "eval_overall_f1": 0.9258748564697528,
+      "eval_race_accuracy": 0.9491084695393759,
+      "eval_race_f1": 0.9488621247872209,
+      "eval_religion_accuracy": 0.9459509658246656,
+      "eval_religion_f1": 0.945886068594284,
+      "eval_runtime": 6.0881,
+      "eval_safety_accuracy": 0.8954309063893017,
+      "eval_safety_f1": 0.8958802419702108,
+      "eval_samples_per_second": 884.354,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.354,
+      "step": 9422
+    },
+    {
+      "epoch": 7.057949479940564,
+      "grad_norm": 1.4738227128982544,
+      "learning_rate": 1.5281635802469136e-05,
+      "loss": 0.0245,
+      "step": 9500
+    },
+    {
+      "epoch": 7.132243684992571,
+      "grad_norm": 1.0899150371551514,
+      "learning_rate": 1.4895833333333334e-05,
+      "loss": 0.022,
+      "step": 9600
+    },
+    {
+      "epoch": 7.206537890044577,
+      "grad_norm": 0.9878177642822266,
+      "learning_rate": 1.4510030864197532e-05,
+      "loss": 0.0218,
+      "step": 9700
+    },
+    {
+      "epoch": 7.280832095096582,
+      "grad_norm": 0.37595194578170776,
+      "learning_rate": 1.4124228395061728e-05,
+      "loss": 0.0232,
+      "step": 9800
+    },
+    {
+      "epoch": 7.355126300148588,
+      "grad_norm": 0.7727621793746948,
+      "learning_rate": 1.3738425925925927e-05,
+      "loss": 0.0216,
+      "step": 9900
+    },
+    {
+      "epoch": 7.429420505200595,
+      "grad_norm": 0.3330998718738556,
+      "learning_rate": 1.3352623456790126e-05,
+      "loss": 0.0222,
+      "step": 10000
+    },
+    {
+      "epoch": 7.5037147102526,
+      "grad_norm": 0.5806456804275513,
+      "learning_rate": 1.296682098765432e-05,
+      "loss": 0.0219,
+      "step": 10100
+    },
+    {
+      "epoch": 7.578008915304606,
+      "grad_norm": 0.7578392028808594,
+      "learning_rate": 1.258101851851852e-05,
+      "loss": 0.0218,
+      "step": 10200
+    },
+    {
+      "epoch": 7.6523031203566125,
+      "grad_norm": 0.3120606541633606,
+      "learning_rate": 1.2195216049382717e-05,
+      "loss": 0.02,
+      "step": 10300
+    },
+    {
+      "epoch": 7.726597325408618,
+      "grad_norm": 0.637631893157959,
+      "learning_rate": 1.1809413580246915e-05,
+      "loss": 0.0196,
+      "step": 10400
+    },
+    {
+      "epoch": 7.800891530460624,
+      "grad_norm": 0.6013413071632385,
+      "learning_rate": 1.142361111111111e-05,
+      "loss": 0.0234,
+      "step": 10500
+    },
+    {
+      "epoch": 7.8751857355126305,
+      "grad_norm": 2.5481185913085938,
+      "learning_rate": 1.1037808641975308e-05,
+      "loss": 0.0218,
+      "step": 10600
+    },
+    {
+      "epoch": 7.949479940564636,
+      "grad_norm": 0.5179031491279602,
+      "learning_rate": 1.0652006172839508e-05,
+      "loss": 0.0208,
+      "step": 10700
+    },
+    {
+      "epoch": 8.0,
+      "eval_administration_accuracy": 0.8813150074294205,
+      "eval_administration_f1": 0.8795800439008289,
+      "eval_corruption_accuracy": 0.9455794947994056,
+      "eval_corruption_f1": 0.9433562694219033,
+      "eval_democracy_accuracy": 0.9366641901931649,
+      "eval_democracy_f1": 0.9365011786875334,
+      "eval_development_accuracy": 0.8694279346210996,
+      "eval_development_f1": 0.8688370502444763,
+      "eval_economy_accuracy": 0.9184621099554234,
+      "eval_economy_f1": 0.918124164419619,
+      "eval_education_accuracy": 0.9580237741456167,
+      "eval_education_f1": 0.9574723795948901,
+      "eval_environment_accuracy": 0.9738112927191679,
+      "eval_environment_f1": 0.9736854631574718,
+      "eval_leadership_accuracy": 0.8393387815750372,
+      "eval_leadership_f1": 0.839741016757979,
+      "eval_loss": 0.2596803605556488,
+      "eval_overall_accuracy": 0.9265725606736006,
+      "eval_overall_f1": 0.9260616678064877,
+      "eval_race_accuracy": 0.9465081723625557,
+      "eval_race_f1": 0.9461343616633416,
+      "eval_religion_accuracy": 0.9446508172362555,
+      "eval_religion_f1": 0.9445423673916528,
+      "eval_runtime": 6.0851,
+      "eval_safety_accuracy": 0.9050891530460624,
+      "eval_safety_f1": 0.904765718438156,
+      "eval_samples_per_second": 884.782,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.381,
+      "step": 10768
+    },
+    {
+      "epoch": 8.023774145616642,
+      "grad_norm": 0.6615686416625977,
+      "learning_rate": 1.0266203703703704e-05,
+      "loss": 0.0205,
+      "step": 10800
+    },
+    {
+      "epoch": 8.098068350668647,
+      "grad_norm": 2.661421060562134,
+      "learning_rate": 9.880401234567901e-06,
+      "loss": 0.0185,
+      "step": 10900
+    },
+    {
+      "epoch": 8.172362555720653,
+      "grad_norm": 0.6415339112281799,
+      "learning_rate": 9.494598765432099e-06,
+      "loss": 0.0164,
+      "step": 11000
+    },
+    {
+      "epoch": 8.246656760772659,
+      "grad_norm": 0.761589765548706,
+      "learning_rate": 9.108796296296296e-06,
+      "loss": 0.017,
+      "step": 11100
+    },
+    {
+      "epoch": 8.320950965824666,
+      "grad_norm": 0.6105137467384338,
+      "learning_rate": 8.722993827160494e-06,
+      "loss": 0.0174,
+      "step": 11200
+    },
+    {
+      "epoch": 8.395245170876672,
+      "grad_norm": 0.6517733931541443,
+      "learning_rate": 8.337191358024692e-06,
+      "loss": 0.0175,
+      "step": 11300
+    },
+    {
+      "epoch": 8.469539375928678,
+      "grad_norm": 0.6607377529144287,
+      "learning_rate": 7.95138888888889e-06,
+      "loss": 0.0172,
+      "step": 11400
+    },
+    {
+      "epoch": 8.543833580980683,
+      "grad_norm": 0.72126305103302,
+      "learning_rate": 7.565586419753088e-06,
+      "loss": 0.0155,
+      "step": 11500
+    },
+    {
+      "epoch": 8.618127786032689,
+      "grad_norm": 0.4402889609336853,
+      "learning_rate": 7.1797839506172844e-06,
+      "loss": 0.0173,
+      "step": 11600
+    },
+    {
+      "epoch": 8.692421991084695,
+      "grad_norm": 0.08074043691158295,
+      "learning_rate": 6.793981481481482e-06,
+      "loss": 0.014,
+      "step": 11700
+    },
+    {
+      "epoch": 8.766716196136702,
+      "grad_norm": 0.1940842866897583,
+      "learning_rate": 6.408179012345679e-06,
+      "loss": 0.0145,
+      "step": 11800
+    },
+    {
+      "epoch": 8.841010401188708,
+      "grad_norm": 0.4365254044532776,
+      "learning_rate": 6.022376543209876e-06,
+      "loss": 0.0152,
+      "step": 11900
+    },
+    {
+      "epoch": 8.915304606240714,
+      "grad_norm": 0.4619617462158203,
+      "learning_rate": 5.636574074074075e-06,
+      "loss": 0.0166,
+      "step": 12000
+    },
+    {
+      "epoch": 8.98959881129272,
+      "grad_norm": 0.22596906125545502,
+      "learning_rate": 5.250771604938272e-06,
+      "loss": 0.0156,
+      "step": 12100
+    },
+    {
+      "epoch": 9.0,
+      "eval_administration_accuracy": 0.888001485884101,
+      "eval_administration_f1": 0.8840369764257654,
+      "eval_corruption_accuracy": 0.9474368499257058,
+      "eval_corruption_f1": 0.9462275023250412,
+      "eval_democracy_accuracy": 0.937035661218425,
+      "eval_democracy_f1": 0.9349797337427957,
+      "eval_development_accuracy": 0.8777860326894502,
+      "eval_development_f1": 0.8758984879855292,
+      "eval_economy_accuracy": 0.9188335809806835,
+      "eval_economy_f1": 0.9183485908645431,
+      "eval_education_accuracy": 0.9613670133729569,
+      "eval_education_f1": 0.9605424054563209,
+      "eval_environment_accuracy": 0.9745542347696879,
+      "eval_environment_f1": 0.97406579666089,
+      "eval_leadership_accuracy": 0.8447251114413076,
+      "eval_leadership_f1": 0.8447097008519563,
+      "eval_loss": 0.26206690073013306,
+      "eval_overall_accuracy": 0.9286001733531449,
+      "eval_overall_f1": 0.9276388104924375,
+      "eval_race_accuracy": 0.9476225854383358,
+      "eval_race_f1": 0.947246539022533,
+      "eval_religion_accuracy": 0.9446508172362555,
+      "eval_religion_f1": 0.9438393498317825,
+      "eval_runtime": 6.0648,
+      "eval_safety_accuracy": 0.9011887072808321,
+      "eval_safety_f1": 0.9017706427420923,
+      "eval_samples_per_second": 887.753,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.567,
+      "step": 12114
+    },
+    {
+      "epoch": 9.063893016344725,
+      "grad_norm": 0.4198947846889496,
+      "learning_rate": 4.864969135802469e-06,
+      "loss": 0.0129,
+      "step": 12200
+    },
+    {
+      "epoch": 9.13818722139673,
+      "grad_norm": 0.26229700446128845,
+      "learning_rate": 4.479166666666667e-06,
+      "loss": 0.013,
+      "step": 12300
+    },
+    {
+      "epoch": 9.212481426448736,
+      "grad_norm": 1.2866747379302979,
+      "learning_rate": 4.0933641975308644e-06,
+      "loss": 0.014,
+      "step": 12400
+    },
+    {
+      "epoch": 9.286775631500744,
+      "grad_norm": 0.4733564257621765,
+      "learning_rate": 3.707561728395062e-06,
+      "loss": 0.0116,
+      "step": 12500
+    },
+    {
+      "epoch": 9.36106983655275,
+      "grad_norm": 0.26384237408638,
+      "learning_rate": 3.3217592592592592e-06,
+      "loss": 0.0141,
+      "step": 12600
+    },
+    {
+      "epoch": 9.435364041604755,
+      "grad_norm": 0.34422609210014343,
+      "learning_rate": 2.9359567901234573e-06,
+      "loss": 0.0126,
+      "step": 12700
+    },
+    {
+      "epoch": 9.50965824665676,
+      "grad_norm": 0.3310413360595703,
+      "learning_rate": 2.5501543209876544e-06,
+      "loss": 0.0137,
+      "step": 12800
+    },
+    {
+      "epoch": 9.583952451708766,
+      "grad_norm": 0.6999865174293518,
+      "learning_rate": 2.1643518518518516e-06,
+      "loss": 0.0127,
+      "step": 12900
+    },
+    {
+      "epoch": 9.658246656760772,
+      "grad_norm": 0.10555438697338104,
+      "learning_rate": 1.7785493827160492e-06,
+      "loss": 0.0126,
+      "step": 13000
+    },
+    {
+      "epoch": 9.732540861812778,
+      "grad_norm": 0.3336666524410248,
+      "learning_rate": 1.392746913580247e-06,
+      "loss": 0.0132,
+      "step": 13100
+    },
+    {
+      "epoch": 9.806835066864785,
+      "grad_norm": 0.6781222224235535,
+      "learning_rate": 1.0069444444444447e-06,
+      "loss": 0.013,
+      "step": 13200
+    },
+    {
+      "epoch": 9.881129271916791,
+      "grad_norm": 0.07187670469284058,
+      "learning_rate": 6.211419753086421e-07,
+      "loss": 0.0127,
+      "step": 13300
+    },
+    {
+      "epoch": 9.955423476968797,
+      "grad_norm": 0.46965786814689636,
+      "learning_rate": 2.3533950617283953e-07,
+      "loss": 0.0143,
+      "step": 13400
+    },
+    {
+      "epoch": 10.0,
+      "eval_administration_accuracy": 0.8837295690936107,
+      "eval_administration_f1": 0.8818033155613924,
+      "eval_corruption_accuracy": 0.9481797919762258,
+      "eval_corruption_f1": 0.9468526341391379,
+      "eval_democracy_accuracy": 0.937221396731055,
+      "eval_democracy_f1": 0.9362318536991674,
+      "eval_development_accuracy": 0.8763001485884101,
+      "eval_development_f1": 0.8755224543096787,
+      "eval_economy_accuracy": 0.9192050520059435,
+      "eval_economy_f1": 0.9186284798866873,
+      "eval_education_accuracy": 0.9598811292719168,
+      "eval_education_f1": 0.9592558180372266,
+      "eval_environment_accuracy": 0.9741827637444279,
+      "eval_environment_f1": 0.9737776195503588,
+      "eval_leadership_accuracy": 0.8423105497771174,
+      "eval_leadership_f1": 0.8434399815395168,
+      "eval_loss": 0.26387640833854675,
+      "eval_overall_accuracy": 0.9280894006934126,
+      "eval_overall_f1": 0.9276201716738023,
+      "eval_race_accuracy": 0.9479940564635958,
+      "eval_race_f1": 0.9474766439680601,
+      "eval_religion_accuracy": 0.9448365527488856,
+      "eval_religion_f1": 0.9445715277991047,
+      "eval_runtime": 6.0635,
+      "eval_safety_accuracy": 0.9032317979197623,
+      "eval_safety_f1": 0.9038817315952975,
+      "eval_samples_per_second": 887.937,
+      "eval_stability_accuracy": 1.0,
+      "eval_stability_f1": 1.0,
+      "eval_steps_per_second": 55.579,
+      "step": 13460
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 13460,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 1
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5.642720195479142e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": {
+    "gradient_accumulation_steps": 1,
+    "learning_rate": 5e-05,
+    "num_train_epochs": 10
+  }
+}

base/run-0/checkpoint-13460/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a9f417d3b26827f3c2091fa30ae27025fb9a89bba46b9e16e8ce16798492c41b
+size 5841

base/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a9f417d3b26827f3c2091fa30ae27025fb9a89bba46b9e16e8ce16798492c41b
+size 5841

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c1cb16e6d293cfcf0160e3255988e8f860aa54c37c35874fb33b2edc9aea21ff
 size 438100144

 version https://git-lfs.github.com/spec/v1
+oid sha256:b6d31366fb92da1c2f70020227f8b0eb1357968071e3bcf2657a21622d292634
 size 438100144

run-0/checkpoint-1011/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-1011/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69d961b7c9c66dc43830278b1687db5149230d91ba6d80df5b8e0ae86624d9ec
+size 438100144

run-0/checkpoint-1011/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83865090135d1e0a596e168764bdcfd0a3c5ce3c9043e89292f9bc82690a070a
+size 876324619

run-0/checkpoint-1011/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2336cb0162aa649da80d774dd375fe462ee046c5de7100aea50899cab0033550
+size 14645

run-0/checkpoint-1011/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19ced76e4b26ff9c7e28969ae263d508804558ca5fb49575ed7c93389ef7e878
+size 1383

run-0/checkpoint-1011/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:87b4f705378abe5bddc82dc3bbe7d53a58c7c8f3b0d2b6de843f4af480b4890f
+size 1465

run-0/checkpoint-1011/trainer_state.json ADDED Viewed

	@@ -0,0 +1,219 @@

+{
+  "best_global_step": 1011,
+  "best_metric": 0.9175833864600228,
+  "best_model_checkpoint": "./results/run-0/checkpoint-1011",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 1011,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2969561989606533,
+      "grad_norm": 1.1367077827453613,
+      "learning_rate": 9.900000000000002e-06,
+      "loss": 0.4115,
+      "step": 100
+    },
+    {
+      "epoch": 0.5939123979213066,
+      "grad_norm": 1.127586007118225,
+      "learning_rate": 1.9900000000000003e-05,
+      "loss": 0.3507,
+      "step": 200
+    },
+    {
+      "epoch": 0.89086859688196,
+      "grad_norm": 1.15813148021698,
+      "learning_rate": 2.9900000000000002e-05,
+      "loss": 0.3184,
+      "step": 300
+    },
+    {
+      "epoch": 1.0,
+      "eval_administration_accuracy": 0.8622098421541319,
+      "eval_administration_f1": 0.8377043137649639,
+      "eval_corruption_accuracy": 0.9379758588672238,
+      "eval_corruption_f1": 0.9310385616534254,
+      "eval_democracy_accuracy": 0.9238625812441968,
+      "eval_democracy_f1": 0.907103895237725,
+      "eval_development_accuracy": 0.8462395543175487,
+      "eval_development_f1": 0.8229509269515034,
+      "eval_economy_accuracy": 0.887836583101207,
+      "eval_economy_f1": 0.8696896434372372,
+      "eval_education_accuracy": 0.9478180129990715,
+      "eval_education_f1": 0.9425187888090035,
+      "eval_environment_accuracy": 0.9569173630454968,
+      "eval_environment_f1": 0.9527187476104269,
+      "eval_instability_accuracy": 0.9093779015784587,
+      "eval_instability_f1": 0.8913980249894993,
+      "eval_leadership_accuracy": 0.7756731662024141,
+      "eval_leadership_f1": 0.7455137881899888,
+      "eval_loss": 0.29490533471107483,
+      "eval_overall_accuracy": 0.898963169297431,
+      "eval_overall_f1": 0.884602913882178,
+      "eval_race_accuracy": 0.9387186629526463,
+      "eval_race_f1": 0.933273316670087,
+      "eval_religion_accuracy": 0.9273909006499536,
+      "eval_religion_f1": 0.9189375034944831,
+      "eval_runtime": 6.0718,
+      "eval_safety_accuracy": 0.8735376044568245,
+      "eval_safety_f1": 0.862387455777795,
+      "eval_samples_per_second": 886.885,
+      "eval_steps_per_second": 55.502,
+      "step": 337
+    },
+    {
+      "epoch": 1.1870824053452116,
+      "grad_norm": 1.293520212173462,
+      "learning_rate": 3.99e-05,
+      "loss": 0.2893,
+      "step": 400
+    },
+    {
+      "epoch": 1.4840386043058649,
+      "grad_norm": 0.9718915224075317,
+      "learning_rate": 4.99e-05,
+      "loss": 0.2673,
+      "step": 500
+    },
+    {
+      "epoch": 1.7809948032665182,
+      "grad_norm": 0.9016148447990417,
+      "learning_rate": 4.5822784810126584e-05,
+      "loss": 0.2499,
+      "step": 600
+    },
+    {
+      "epoch": 2.0,
+      "eval_administration_accuracy": 0.8817084493964716,
+      "eval_administration_f1": 0.8581364741485047,
+      "eval_corruption_accuracy": 0.9504178272980501,
+      "eval_corruption_f1": 0.9481110730839337,
+      "eval_democracy_accuracy": 0.9364902506963788,
+      "eval_democracy_f1": 0.9256699878558502,
+      "eval_development_accuracy": 0.8683379758588672,
+      "eval_development_f1": 0.8524920643431206,
+      "eval_economy_accuracy": 0.8989786443825442,
+      "eval_economy_f1": 0.8968225936331777,
+      "eval_education_accuracy": 0.9569173630454968,
+      "eval_education_f1": 0.9525043175986375,
+      "eval_environment_accuracy": 0.9691736304549675,
+      "eval_environment_f1": 0.9696177677301354,
+      "eval_instability_accuracy": 0.9223769730733519,
+      "eval_instability_f1": 0.9182716939857773,
+      "eval_leadership_accuracy": 0.8053853296193129,
+      "eval_leadership_f1": 0.7803578231203789,
+      "eval_loss": 0.24944739043712616,
+      "eval_overall_accuracy": 0.9152274837511607,
+      "eval_overall_f1": 0.9074667582350125,
+      "eval_race_accuracy": 0.9513463324048282,
+      "eval_race_f1": 0.9475861405850222,
+      "eval_religion_accuracy": 0.9457753017641597,
+      "eval_religion_f1": 0.9461902504041225,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.8958217270194986,
+      "eval_safety_f1": 0.8938409123314907,
+      "eval_samples_per_second": 884.502,
+      "eval_steps_per_second": 55.353,
+      "step": 674
+    },
+    {
+      "epoch": 2.0772086117297697,
+      "grad_norm": 0.7925682663917542,
+      "learning_rate": 4.1603375527426166e-05,
+      "loss": 0.2355,
+      "step": 700
+    },
+    {
+      "epoch": 2.374164810690423,
+      "grad_norm": 1.0376709699630737,
+      "learning_rate": 3.7383966244725735e-05,
+      "loss": 0.1931,
+      "step": 800
+    },
+    {
+      "epoch": 2.6711210096510767,
+      "grad_norm": 1.358044981956482,
+      "learning_rate": 3.316455696202532e-05,
+      "loss": 0.1818,
+      "step": 900
+    },
+    {
+      "epoch": 2.9680772086117297,
+      "grad_norm": 0.9971312284469604,
+      "learning_rate": 2.8945147679324896e-05,
+      "loss": 0.1774,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_administration_accuracy": 0.8861652739090065,
+      "eval_administration_f1": 0.8738444277192003,
+      "eval_corruption_accuracy": 0.9513463324048282,
+      "eval_corruption_f1": 0.9491062362635426,
+      "eval_democracy_accuracy": 0.9420612813370474,
+      "eval_democracy_f1": 0.9372178375746801,
+      "eval_development_accuracy": 0.8729805013927576,
+      "eval_development_f1": 0.8645602610410228,
+      "eval_economy_accuracy": 0.9065923862581244,
+      "eval_economy_f1": 0.9052374047877222,
+      "eval_education_accuracy": 0.962116991643454,
+      "eval_education_f1": 0.9605337374058789,
+      "eval_environment_accuracy": 0.9673166202414113,
+      "eval_environment_f1": 0.9674105228824886,
+      "eval_instability_accuracy": 0.9257195914577531,
+      "eval_instability_f1": 0.9245614298805196,
+      "eval_leadership_accuracy": 0.8341689879294336,
+      "eval_leadership_f1": 0.8290965652136555,
+      "eval_loss": 0.23423036932945251,
+      "eval_overall_accuracy": 0.9208604147322809,
+      "eval_overall_f1": 0.9175833864600228,
+      "eval_race_accuracy": 0.9502321262766945,
+      "eval_race_f1": 0.9495917574024151,
+      "eval_religion_accuracy": 0.9455896007428041,
+      "eval_religion_f1": 0.9459064433064331,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.9060352831940576,
+      "eval_safety_f1": 0.903934014042716,
+      "eval_samples_per_second": 884.503,
+      "eval_steps_per_second": 55.353,
+      "step": 1011
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 1685,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.683026917097472e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": {
+    "gradient_accumulation_steps": 4,
+    "learning_rate": 5e-05,
+    "num_train_epochs": 5
+  }
+}

run-0/checkpoint-1011/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2467658aede69590024c2472029c6010ad84b62a00af5819a2894048e9c36494
+size 5905

run-0/checkpoint-1348/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-1348/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c069aea40b3b11e6ff0ffeec0bd06957831d2f30e502b444b4ed179574323110
+size 438100144

run-0/checkpoint-1348/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:afe04eec1eea4f1e4ea614efe18d176c924fbec07e5a92ffcde6d67b9db40d09
+size 876324619

run-0/checkpoint-1348/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4b3e48c92222d3c4733090c0bda97c1bc5936e6e546f2d8ff55b5c89c8888a8
+size 14645

run-0/checkpoint-1348/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb958c8c4611c8d2f0af86b177ec35a226bf63f6b0cc54e6d7e35dac9363c1c7
+size 1383

run-0/checkpoint-1348/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80fb557f3d1d8bb3e724b15e454fd44b3814d365d80e2d6a13aace0eba46757e
+size 1465

run-0/checkpoint-1348/trainer_state.json ADDED Viewed

	@@ -0,0 +1,274 @@

+{
+  "best_global_step": 1348,
+  "best_metric": 0.9203680470994868,
+  "best_model_checkpoint": "./results/run-0/checkpoint-1348",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 1348,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2969561989606533,
+      "grad_norm": 1.1367077827453613,
+      "learning_rate": 9.900000000000002e-06,
+      "loss": 0.4115,
+      "step": 100
+    },
+    {
+      "epoch": 0.5939123979213066,
+      "grad_norm": 1.127586007118225,
+      "learning_rate": 1.9900000000000003e-05,
+      "loss": 0.3507,
+      "step": 200
+    },
+    {
+      "epoch": 0.89086859688196,
+      "grad_norm": 1.15813148021698,
+      "learning_rate": 2.9900000000000002e-05,
+      "loss": 0.3184,
+      "step": 300
+    },
+    {
+      "epoch": 1.0,
+      "eval_administration_accuracy": 0.8622098421541319,
+      "eval_administration_f1": 0.8377043137649639,
+      "eval_corruption_accuracy": 0.9379758588672238,
+      "eval_corruption_f1": 0.9310385616534254,
+      "eval_democracy_accuracy": 0.9238625812441968,
+      "eval_democracy_f1": 0.907103895237725,
+      "eval_development_accuracy": 0.8462395543175487,
+      "eval_development_f1": 0.8229509269515034,
+      "eval_economy_accuracy": 0.887836583101207,
+      "eval_economy_f1": 0.8696896434372372,
+      "eval_education_accuracy": 0.9478180129990715,
+      "eval_education_f1": 0.9425187888090035,
+      "eval_environment_accuracy": 0.9569173630454968,
+      "eval_environment_f1": 0.9527187476104269,
+      "eval_instability_accuracy": 0.9093779015784587,
+      "eval_instability_f1": 0.8913980249894993,
+      "eval_leadership_accuracy": 0.7756731662024141,
+      "eval_leadership_f1": 0.7455137881899888,
+      "eval_loss": 0.29490533471107483,
+      "eval_overall_accuracy": 0.898963169297431,
+      "eval_overall_f1": 0.884602913882178,
+      "eval_race_accuracy": 0.9387186629526463,
+      "eval_race_f1": 0.933273316670087,
+      "eval_religion_accuracy": 0.9273909006499536,
+      "eval_religion_f1": 0.9189375034944831,
+      "eval_runtime": 6.0718,
+      "eval_safety_accuracy": 0.8735376044568245,
+      "eval_safety_f1": 0.862387455777795,
+      "eval_samples_per_second": 886.885,
+      "eval_steps_per_second": 55.502,
+      "step": 337
+    },
+    {
+      "epoch": 1.1870824053452116,
+      "grad_norm": 1.293520212173462,
+      "learning_rate": 3.99e-05,
+      "loss": 0.2893,
+      "step": 400
+    },
+    {
+      "epoch": 1.4840386043058649,
+      "grad_norm": 0.9718915224075317,
+      "learning_rate": 4.99e-05,
+      "loss": 0.2673,
+      "step": 500
+    },
+    {
+      "epoch": 1.7809948032665182,
+      "grad_norm": 0.9016148447990417,
+      "learning_rate": 4.5822784810126584e-05,
+      "loss": 0.2499,
+      "step": 600
+    },
+    {
+      "epoch": 2.0,
+      "eval_administration_accuracy": 0.8817084493964716,
+      "eval_administration_f1": 0.8581364741485047,
+      "eval_corruption_accuracy": 0.9504178272980501,
+      "eval_corruption_f1": 0.9481110730839337,
+      "eval_democracy_accuracy": 0.9364902506963788,
+      "eval_democracy_f1": 0.9256699878558502,
+      "eval_development_accuracy": 0.8683379758588672,
+      "eval_development_f1": 0.8524920643431206,
+      "eval_economy_accuracy": 0.8989786443825442,
+      "eval_economy_f1": 0.8968225936331777,
+      "eval_education_accuracy": 0.9569173630454968,
+      "eval_education_f1": 0.9525043175986375,
+      "eval_environment_accuracy": 0.9691736304549675,
+      "eval_environment_f1": 0.9696177677301354,
+      "eval_instability_accuracy": 0.9223769730733519,
+      "eval_instability_f1": 0.9182716939857773,
+      "eval_leadership_accuracy": 0.8053853296193129,
+      "eval_leadership_f1": 0.7803578231203789,
+      "eval_loss": 0.24944739043712616,
+      "eval_overall_accuracy": 0.9152274837511607,
+      "eval_overall_f1": 0.9074667582350125,
+      "eval_race_accuracy": 0.9513463324048282,
+      "eval_race_f1": 0.9475861405850222,
+      "eval_religion_accuracy": 0.9457753017641597,
+      "eval_religion_f1": 0.9461902504041225,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.8958217270194986,
+      "eval_safety_f1": 0.8938409123314907,
+      "eval_samples_per_second": 884.502,
+      "eval_steps_per_second": 55.353,
+      "step": 674
+    },
+    {
+      "epoch": 2.0772086117297697,
+      "grad_norm": 0.7925682663917542,
+      "learning_rate": 4.1603375527426166e-05,
+      "loss": 0.2355,
+      "step": 700
+    },
+    {
+      "epoch": 2.374164810690423,
+      "grad_norm": 1.0376709699630737,
+      "learning_rate": 3.7383966244725735e-05,
+      "loss": 0.1931,
+      "step": 800
+    },
+    {
+      "epoch": 2.6711210096510767,
+      "grad_norm": 1.358044981956482,
+      "learning_rate": 3.316455696202532e-05,
+      "loss": 0.1818,
+      "step": 900
+    },
+    {
+      "epoch": 2.9680772086117297,
+      "grad_norm": 0.9971312284469604,
+      "learning_rate": 2.8945147679324896e-05,
+      "loss": 0.1774,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_administration_accuracy": 0.8861652739090065,
+      "eval_administration_f1": 0.8738444277192003,
+      "eval_corruption_accuracy": 0.9513463324048282,
+      "eval_corruption_f1": 0.9491062362635426,
+      "eval_democracy_accuracy": 0.9420612813370474,
+      "eval_democracy_f1": 0.9372178375746801,
+      "eval_development_accuracy": 0.8729805013927576,
+      "eval_development_f1": 0.8645602610410228,
+      "eval_economy_accuracy": 0.9065923862581244,
+      "eval_economy_f1": 0.9052374047877222,
+      "eval_education_accuracy": 0.962116991643454,
+      "eval_education_f1": 0.9605337374058789,
+      "eval_environment_accuracy": 0.9673166202414113,
+      "eval_environment_f1": 0.9674105228824886,
+      "eval_instability_accuracy": 0.9257195914577531,
+      "eval_instability_f1": 0.9245614298805196,
+      "eval_leadership_accuracy": 0.8341689879294336,
+      "eval_leadership_f1": 0.8290965652136555,
+      "eval_loss": 0.23423036932945251,
+      "eval_overall_accuracy": 0.9208604147322809,
+      "eval_overall_f1": 0.9175833864600228,
+      "eval_race_accuracy": 0.9502321262766945,
+      "eval_race_f1": 0.9495917574024151,
+      "eval_religion_accuracy": 0.9455896007428041,
+      "eval_religion_f1": 0.9459064433064331,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.9060352831940576,
+      "eval_safety_f1": 0.903934014042716,
+      "eval_samples_per_second": 884.503,
+      "eval_steps_per_second": 55.353,
+      "step": 1011
+    },
+    {
+      "epoch": 3.2642910170749815,
+      "grad_norm": 0.8202979564666748,
+      "learning_rate": 2.4725738396624472e-05,
+      "loss": 0.1398,
+      "step": 1100
+    },
+    {
+      "epoch": 3.5612472160356345,
+      "grad_norm": 0.8103386759757996,
+      "learning_rate": 2.0506329113924054e-05,
+      "loss": 0.1362,
+      "step": 1200
+    },
+    {
+      "epoch": 3.858203414996288,
+      "grad_norm": 0.7706596851348877,
+      "learning_rate": 1.628691983122363e-05,
+      "loss": 0.132,
+      "step": 1300
+    },
+    {
+      "epoch": 4.0,
+      "eval_administration_accuracy": 0.8891364902506964,
+      "eval_administration_f1": 0.8799307094225493,
+      "eval_corruption_accuracy": 0.9506035283194058,
+      "eval_corruption_f1": 0.9484943116838682,
+      "eval_democracy_accuracy": 0.9441039925719591,
+      "eval_democracy_f1": 0.9386490275754458,
+      "eval_development_accuracy": 0.8789229340761374,
+      "eval_development_f1": 0.8726999754002892,
+      "eval_economy_accuracy": 0.9149489322191272,
+      "eval_economy_f1": 0.9115444384683159,
+      "eval_education_accuracy": 0.9600742804085423,
+      "eval_education_f1": 0.9589725262235815,
+      "eval_environment_accuracy": 0.9704735376044569,
+      "eval_environment_f1": 0.9698588908694847,
+      "eval_instability_accuracy": 0.9301764159702879,
+      "eval_instability_f1": 0.9264928998102437,
+      "eval_leadership_accuracy": 0.8358402971216342,
+      "eval_leadership_f1": 0.8320914070689603,
+      "eval_loss": 0.23071259260177612,
+      "eval_overall_accuracy": 0.9235995047972764,
+      "eval_overall_f1": 0.9203680470994868,
+      "eval_race_accuracy": 0.9515320334261839,
+      "eval_race_f1": 0.9496886745661435,
+      "eval_religion_accuracy": 0.9468895078922934,
+      "eval_religion_f1": 0.9473765040380958,
+      "eval_runtime": 6.0642,
+      "eval_safety_accuracy": 0.9104921077065924,
+      "eval_safety_f1": 0.9086172000668638,
+      "eval_samples_per_second": 887.991,
+      "eval_steps_per_second": 55.572,
+      "step": 1348
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 1685,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.187619128557568e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": {
+    "gradient_accumulation_steps": 4,
+    "learning_rate": 5e-05,
+    "num_train_epochs": 5
+  }
+}

run-0/checkpoint-1348/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2467658aede69590024c2472029c6010ad84b62a00af5819a2894048e9c36494
+size 5905

run-0/checkpoint-1685/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-0/checkpoint-1685/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ae34050d7ecb9ccc6a9f73d3aee219b589d51e507cef46c578586d4383aa682
+size 438100144

run-0/checkpoint-1685/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f174efa39e8742d13a588732165e7d530f9aa68121c9ada20334765012c4b5a7
+size 876324619

run-0/checkpoint-1685/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e590151069bb6bc505f9ec54912ea73b0b5ce98ecdee7e1bacb0e2f6ae75b28d
+size 14645

run-0/checkpoint-1685/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b0d3fe37ce74cd7a18b7a55f336180d86659b85cd3b4a13d201a3636feda476
+size 1383

run-0/checkpoint-1685/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4178bb040d3eca68d2f150c151af1ae58b42f1c1fbc30c5aaf7e95f32879b2dc
+size 1465

run-0/checkpoint-1685/trainer_state.json ADDED Viewed

	@@ -0,0 +1,329 @@

+{
+  "best_global_step": 1348,
+  "best_metric": 0.9203680470994868,
+  "best_model_checkpoint": "./results/run-0/checkpoint-1348",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 1685,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2969561989606533,
+      "grad_norm": 1.1367077827453613,
+      "learning_rate": 9.900000000000002e-06,
+      "loss": 0.4115,
+      "step": 100
+    },
+    {
+      "epoch": 0.5939123979213066,
+      "grad_norm": 1.127586007118225,
+      "learning_rate": 1.9900000000000003e-05,
+      "loss": 0.3507,
+      "step": 200
+    },
+    {
+      "epoch": 0.89086859688196,
+      "grad_norm": 1.15813148021698,
+      "learning_rate": 2.9900000000000002e-05,
+      "loss": 0.3184,
+      "step": 300
+    },
+    {
+      "epoch": 1.0,
+      "eval_administration_accuracy": 0.8622098421541319,
+      "eval_administration_f1": 0.8377043137649639,
+      "eval_corruption_accuracy": 0.9379758588672238,
+      "eval_corruption_f1": 0.9310385616534254,
+      "eval_democracy_accuracy": 0.9238625812441968,
+      "eval_democracy_f1": 0.907103895237725,
+      "eval_development_accuracy": 0.8462395543175487,
+      "eval_development_f1": 0.8229509269515034,
+      "eval_economy_accuracy": 0.887836583101207,
+      "eval_economy_f1": 0.8696896434372372,
+      "eval_education_accuracy": 0.9478180129990715,
+      "eval_education_f1": 0.9425187888090035,
+      "eval_environment_accuracy": 0.9569173630454968,
+      "eval_environment_f1": 0.9527187476104269,
+      "eval_instability_accuracy": 0.9093779015784587,
+      "eval_instability_f1": 0.8913980249894993,
+      "eval_leadership_accuracy": 0.7756731662024141,
+      "eval_leadership_f1": 0.7455137881899888,
+      "eval_loss": 0.29490533471107483,
+      "eval_overall_accuracy": 0.898963169297431,
+      "eval_overall_f1": 0.884602913882178,
+      "eval_race_accuracy": 0.9387186629526463,
+      "eval_race_f1": 0.933273316670087,
+      "eval_religion_accuracy": 0.9273909006499536,
+      "eval_religion_f1": 0.9189375034944831,
+      "eval_runtime": 6.0718,
+      "eval_safety_accuracy": 0.8735376044568245,
+      "eval_safety_f1": 0.862387455777795,
+      "eval_samples_per_second": 886.885,
+      "eval_steps_per_second": 55.502,
+      "step": 337
+    },
+    {
+      "epoch": 1.1870824053452116,
+      "grad_norm": 1.293520212173462,
+      "learning_rate": 3.99e-05,
+      "loss": 0.2893,
+      "step": 400
+    },
+    {
+      "epoch": 1.4840386043058649,
+      "grad_norm": 0.9718915224075317,
+      "learning_rate": 4.99e-05,
+      "loss": 0.2673,
+      "step": 500
+    },
+    {
+      "epoch": 1.7809948032665182,
+      "grad_norm": 0.9016148447990417,
+      "learning_rate": 4.5822784810126584e-05,
+      "loss": 0.2499,
+      "step": 600
+    },
+    {
+      "epoch": 2.0,
+      "eval_administration_accuracy": 0.8817084493964716,
+      "eval_administration_f1": 0.8581364741485047,
+      "eval_corruption_accuracy": 0.9504178272980501,
+      "eval_corruption_f1": 0.9481110730839337,
+      "eval_democracy_accuracy": 0.9364902506963788,
+      "eval_democracy_f1": 0.9256699878558502,
+      "eval_development_accuracy": 0.8683379758588672,
+      "eval_development_f1": 0.8524920643431206,
+      "eval_economy_accuracy": 0.8989786443825442,
+      "eval_economy_f1": 0.8968225936331777,
+      "eval_education_accuracy": 0.9569173630454968,
+      "eval_education_f1": 0.9525043175986375,
+      "eval_environment_accuracy": 0.9691736304549675,
+      "eval_environment_f1": 0.9696177677301354,
+      "eval_instability_accuracy": 0.9223769730733519,
+      "eval_instability_f1": 0.9182716939857773,
+      "eval_leadership_accuracy": 0.8053853296193129,
+      "eval_leadership_f1": 0.7803578231203789,
+      "eval_loss": 0.24944739043712616,
+      "eval_overall_accuracy": 0.9152274837511607,
+      "eval_overall_f1": 0.9074667582350125,
+      "eval_race_accuracy": 0.9513463324048282,
+      "eval_race_f1": 0.9475861405850222,
+      "eval_religion_accuracy": 0.9457753017641597,
+      "eval_religion_f1": 0.9461902504041225,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.8958217270194986,
+      "eval_safety_f1": 0.8938409123314907,
+      "eval_samples_per_second": 884.502,
+      "eval_steps_per_second": 55.353,
+      "step": 674
+    },
+    {
+      "epoch": 2.0772086117297697,
+      "grad_norm": 0.7925682663917542,
+      "learning_rate": 4.1603375527426166e-05,
+      "loss": 0.2355,
+      "step": 700
+    },
+    {
+      "epoch": 2.374164810690423,
+      "grad_norm": 1.0376709699630737,
+      "learning_rate": 3.7383966244725735e-05,
+      "loss": 0.1931,
+      "step": 800
+    },
+    {
+      "epoch": 2.6711210096510767,
+      "grad_norm": 1.358044981956482,
+      "learning_rate": 3.316455696202532e-05,
+      "loss": 0.1818,
+      "step": 900
+    },
+    {
+      "epoch": 2.9680772086117297,
+      "grad_norm": 0.9971312284469604,
+      "learning_rate": 2.8945147679324896e-05,
+      "loss": 0.1774,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_administration_accuracy": 0.8861652739090065,
+      "eval_administration_f1": 0.8738444277192003,
+      "eval_corruption_accuracy": 0.9513463324048282,
+      "eval_corruption_f1": 0.9491062362635426,
+      "eval_democracy_accuracy": 0.9420612813370474,
+      "eval_democracy_f1": 0.9372178375746801,
+      "eval_development_accuracy": 0.8729805013927576,
+      "eval_development_f1": 0.8645602610410228,
+      "eval_economy_accuracy": 0.9065923862581244,
+      "eval_economy_f1": 0.9052374047877222,
+      "eval_education_accuracy": 0.962116991643454,
+      "eval_education_f1": 0.9605337374058789,
+      "eval_environment_accuracy": 0.9673166202414113,
+      "eval_environment_f1": 0.9674105228824886,
+      "eval_instability_accuracy": 0.9257195914577531,
+      "eval_instability_f1": 0.9245614298805196,
+      "eval_leadership_accuracy": 0.8341689879294336,
+      "eval_leadership_f1": 0.8290965652136555,
+      "eval_loss": 0.23423036932945251,
+      "eval_overall_accuracy": 0.9208604147322809,
+      "eval_overall_f1": 0.9175833864600228,
+      "eval_race_accuracy": 0.9502321262766945,
+      "eval_race_f1": 0.9495917574024151,
+      "eval_religion_accuracy": 0.9455896007428041,
+      "eval_religion_f1": 0.9459064433064331,
+      "eval_runtime": 6.0882,
+      "eval_safety_accuracy": 0.9060352831940576,
+      "eval_safety_f1": 0.903934014042716,
+      "eval_samples_per_second": 884.503,
+      "eval_steps_per_second": 55.353,
+      "step": 1011
+    },
+    {
+      "epoch": 3.2642910170749815,
+      "grad_norm": 0.8202979564666748,
+      "learning_rate": 2.4725738396624472e-05,
+      "loss": 0.1398,
+      "step": 1100
+    },
+    {
+      "epoch": 3.5612472160356345,
+      "grad_norm": 0.8103386759757996,
+      "learning_rate": 2.0506329113924054e-05,
+      "loss": 0.1362,
+      "step": 1200
+    },
+    {
+      "epoch": 3.858203414996288,
+      "grad_norm": 0.7706596851348877,
+      "learning_rate": 1.628691983122363e-05,
+      "loss": 0.132,
+      "step": 1300
+    },
+    {
+      "epoch": 4.0,
+      "eval_administration_accuracy": 0.8891364902506964,
+      "eval_administration_f1": 0.8799307094225493,
+      "eval_corruption_accuracy": 0.9506035283194058,
+      "eval_corruption_f1": 0.9484943116838682,
+      "eval_democracy_accuracy": 0.9441039925719591,
+      "eval_democracy_f1": 0.9386490275754458,
+      "eval_development_accuracy": 0.8789229340761374,
+      "eval_development_f1": 0.8726999754002892,
+      "eval_economy_accuracy": 0.9149489322191272,
+      "eval_economy_f1": 0.9115444384683159,
+      "eval_education_accuracy": 0.9600742804085423,
+      "eval_education_f1": 0.9589725262235815,
+      "eval_environment_accuracy": 0.9704735376044569,
+      "eval_environment_f1": 0.9698588908694847,
+      "eval_instability_accuracy": 0.9301764159702879,
+      "eval_instability_f1": 0.9264928998102437,
+      "eval_leadership_accuracy": 0.8358402971216342,
+      "eval_leadership_f1": 0.8320914070689603,
+      "eval_loss": 0.23071259260177612,
+      "eval_overall_accuracy": 0.9235995047972764,
+      "eval_overall_f1": 0.9203680470994868,
+      "eval_race_accuracy": 0.9515320334261839,
+      "eval_race_f1": 0.9496886745661435,
+      "eval_religion_accuracy": 0.9468895078922934,
+      "eval_religion_f1": 0.9473765040380958,
+      "eval_runtime": 6.0642,
+      "eval_safety_accuracy": 0.9104921077065924,
+      "eval_safety_f1": 0.9086172000668638,
+      "eval_samples_per_second": 887.991,
+      "eval_steps_per_second": 55.572,
+      "step": 1348
+    },
+    {
+      "epoch": 4.154417223459539,
+      "grad_norm": 0.759730339050293,
+      "learning_rate": 1.2067510548523207e-05,
+      "loss": 0.1193,
+      "step": 1400
+    },
+    {
+      "epoch": 4.451373422420193,
+      "grad_norm": 0.895845353603363,
+      "learning_rate": 7.848101265822786e-06,
+      "loss": 0.1074,
+      "step": 1500
+    },
+    {
+      "epoch": 4.748329621380846,
+      "grad_norm": 0.889885425567627,
+      "learning_rate": 3.6286919831223627e-06,
+      "loss": 0.1074,
+      "step": 1600
+    },
+    {
+      "epoch": 5.0,
+      "eval_administration_accuracy": 0.8870937790157846,
+      "eval_administration_f1": 0.8800187021336342,
+      "eval_corruption_accuracy": 0.949489322191272,
+      "eval_corruption_f1": 0.9478600433858793,
+      "eval_democracy_accuracy": 0.9403899721448468,
+      "eval_democracy_f1": 0.9368950511711482,
+      "eval_development_accuracy": 0.8794800371402043,
+      "eval_development_f1": 0.8729188521267028,
+      "eval_economy_accuracy": 0.9112349117920149,
+      "eval_economy_f1": 0.9084007954063611,
+      "eval_education_accuracy": 0.9595171773444754,
+      "eval_education_f1": 0.9586986398725112,
+      "eval_environment_accuracy": 0.9693593314763231,
+      "eval_environment_f1": 0.9688217857436425,
+      "eval_instability_accuracy": 0.9283194057567317,
+      "eval_instability_f1": 0.9249472293024158,
+      "eval_leadership_accuracy": 0.8395543175487465,
+      "eval_leadership_f1": 0.8365072895157208,
+      "eval_loss": 0.23093268275260925,
+      "eval_overall_accuracy": 0.9227329000309501,
+      "eval_overall_f1": 0.9201225505567104,
+      "eval_race_accuracy": 0.952460538532962,
+      "eval_race_f1": 0.9514489266576783,
+      "eval_religion_accuracy": 0.9467038068709378,
+      "eval_religion_f1": 0.9472204828765739,
+      "eval_runtime": 6.0594,
+      "eval_safety_accuracy": 0.909192200557103,
+      "eval_safety_f1": 0.9077328084882567,
+      "eval_samples_per_second": 888.699,
+      "eval_steps_per_second": 55.616,
+      "step": 1685
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 1685,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 1
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.692211340017664e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": {
+    "gradient_accumulation_steps": 4,
+    "learning_rate": 5e-05,
+    "num_train_epochs": 5
+  }
+}

run-0/checkpoint-1685/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2467658aede69590024c2472029c6010ad84b62a00af5819a2894048e9c36494
+size 5905

run-1/checkpoint-1011/config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Democracy Unknown",
+    "1": "Democracy Negative",
+    "2": "Democracy Neutral",
+    "3": "Democracy Positive",
+    "4": "Economy Unknown",
+    "5": "Economy Negative",
+    "6": "Economy Neutral",
+    "7": "Economy Positive",
+    "8": "Race Unknown",
+    "9": "Race Negative",
+    "10": "Race Neutral",
+    "11": "Race Positive",
+    "12": "Leadership Unknown",
+    "13": "Leadership Negative",
+    "14": "Leadership Neutral",
+    "15": "Leadership Positive",
+    "16": "Development Unknown",
+    "17": "Development Negative",
+    "18": "Development Neutral",
+    "19": "Development Positive",
+    "20": "Corruption Unknown",
+    "21": "Corruption Negative",
+    "22": "Corruption Neutral",
+    "23": "Corruption Positive",
+    "24": "Instability Unknown",
+    "25": "Instability Negative",
+    "26": "Instability Neutral",
+    "27": "Instability Positive",
+    "28": "Safety Unknown",
+    "29": "Safety Negative",
+    "30": "Safety Neutral",
+    "31": "Safety Positive",
+    "32": "Administration Unknown",
+    "33": "Administration Negative",
+    "34": "Administration Neutral",
+    "35": "Administration Positive",
+    "36": "Education Unknown",
+    "37": "Education Negative",
+    "38": "Education Neutral",
+    "39": "Education Positive",
+    "40": "Religion Unknown",
+    "41": "Religion Negative",
+    "42": "Religion Neutral",
+    "43": "Religion Positive",
+    "44": "Environment Unknown",
+    "45": "Environment Negative",
+    "46": "Environment Neutral",
+    "47": "Environment Positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Administration Negative": 33,
+    "Administration Neutral": 34,
+    "Administration Positive": 35,
+    "Administration Unknown": 32,
+    "Corruption Negative": 21,
+    "Corruption Neutral": 22,
+    "Corruption Positive": 23,
+    "Corruption Unknown": 20,
+    "Democracy Negative": 1,
+    "Democracy Neutral": 2,
+    "Democracy Positive": 3,
+    "Democracy Unknown": 0,
+    "Development Negative": 17,
+    "Development Neutral": 18,
+    "Development Positive": 19,
+    "Development Unknown": 16,
+    "Economy Negative": 5,
+    "Economy Neutral": 6,
+    "Economy Positive": 7,
+    "Economy Unknown": 4,
+    "Education Negative": 37,
+    "Education Neutral": 38,
+    "Education Positive": 39,
+    "Education Unknown": 36,
+    "Environment Negative": 45,
+    "Environment Neutral": 46,
+    "Environment Positive": 47,
+    "Environment Unknown": 44,
+    "Instability Negative": 25,
+    "Instability Neutral": 26,
+    "Instability Positive": 27,
+    "Instability Unknown": 24,
+    "Leadership Negative": 13,
+    "Leadership Neutral": 14,
+    "Leadership Positive": 15,
+    "Leadership Unknown": 12,
+    "Race Negative": 9,
+    "Race Neutral": 10,
+    "Race Positive": 11,
+    "Race Unknown": 8,
+    "Religion Negative": 41,
+    "Religion Neutral": 42,
+    "Religion Positive": 43,
+    "Religion Unknown": 40,
+    "Safety Negative": 29,
+    "Safety Neutral": 30,
+    "Safety Positive": 31,
+    "Safety Unknown": 28
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-1/checkpoint-1011/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f24e627fb0f34f3734ca3162e3cdc3d91455714d3acb8708f7944124019813da
+size 438100144

run-1/checkpoint-1011/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3fb6acf24a00816f010d5a96d61239c6c184de7d6393f1305dcc3251a45a098
+size 876324619

run-1/checkpoint-1011/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2336cb0162aa649da80d774dd375fe462ee046c5de7100aea50899cab0033550
+size 14645

run-1/checkpoint-1011/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19ced76e4b26ff9c7e28969ae263d508804558ca5fb49575ed7c93389ef7e878
+size 1383

run-1/checkpoint-1011/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:87b4f705378abe5bddc82dc3bbe7d53a58c7c8f3b0d2b6de843f4af480b4890f
+size 1465