Rafeq
/

baby_chillanto2

Transformers

PyTorch

wav2vec2

Model card Files Files and versions

xet

Community

Rafeq commited on Feb 1, 2023

Commit

a426484

1 Parent(s): 4fd5678

Upload trainer_state.json

Browse files

Files changed (1) hide show

trainer_state.json +676 -0

trainer_state.json ADDED Viewed

	@@ -0,0 +1,676 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.9702315325248071,
+  "global_step": 440,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.77924944812362e-05,
+      "loss": 0.4213,
+      "step": 10
+    },
+    {
+      "epoch": 0.02,
+      "eval_accuracy": 0.9030836820602417,
+      "eval_loss": 0.24132861196994781,
+      "eval_runtime": 17.6613,
+      "eval_samples_per_second": 25.706,
+      "eval_steps_per_second": 6.455,
+      "step": 10
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.55849889624724e-05,
+      "loss": 0.4863,
+      "step": 20
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.865638792514801,
+      "eval_loss": 0.2710409164428711,
+      "eval_runtime": 19.2736,
+      "eval_samples_per_second": 23.556,
+      "eval_steps_per_second": 5.915,
+      "step": 20
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.337748344370862e-05,
+      "loss": 0.3922,
+      "step": 30
+    },
+    {
+      "epoch": 0.07,
+      "eval_accuracy": 0.8722466826438904,
+      "eval_loss": 0.3421204090118408,
+      "eval_runtime": 16.7045,
+      "eval_samples_per_second": 27.178,
+      "eval_steps_per_second": 6.825,
+      "step": 30
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.116997792494482e-05,
+      "loss": 0.1911,
+      "step": 40
+    },
+    {
+      "epoch": 0.09,
+      "eval_accuracy": 0.8127753138542175,
+      "eval_loss": 0.4282372295856476,
+      "eval_runtime": 18.8864,
+      "eval_samples_per_second": 24.039,
+      "eval_steps_per_second": 6.036,
+      "step": 40
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.896247240618102e-05,
+      "loss": 0.3023,
+      "step": 50
+    },
+    {
+      "epoch": 0.11,
+      "eval_accuracy": 0.8942731022834778,
+      "eval_loss": 0.4062748849391937,
+      "eval_runtime": 17.7274,
+      "eval_samples_per_second": 25.61,
+      "eval_steps_per_second": 6.431,
+      "step": 50
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.675496688741722e-05,
+      "loss": 0.3875,
+      "step": 60
+    },
+    {
+      "epoch": 0.13,
+      "eval_accuracy": 0.8722466826438904,
+      "eval_loss": 0.341449499130249,
+      "eval_runtime": 16.6774,
+      "eval_samples_per_second": 27.222,
+      "eval_steps_per_second": 6.836,
+      "step": 60
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 8.454746136865342e-05,
+      "loss": 0.2723,
+      "step": 70
+    },
+    {
+      "epoch": 0.15,
+      "eval_accuracy": 0.8744493126869202,
+      "eval_loss": 0.3896920084953308,
+      "eval_runtime": 16.9212,
+      "eval_samples_per_second": 26.83,
+      "eval_steps_per_second": 6.737,
+      "step": 70
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 8.233995584988962e-05,
+      "loss": 0.1704,
+      "step": 80
+    },
+    {
+      "epoch": 0.18,
+      "eval_accuracy": 0.8700440526008606,
+      "eval_loss": 0.3918803632259369,
+      "eval_runtime": 18.7956,
+      "eval_samples_per_second": 24.155,
+      "eval_steps_per_second": 6.065,
+      "step": 80
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 8.013245033112584e-05,
+      "loss": 0.3443,
+      "step": 90
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.8942731022834778,
+      "eval_loss": 0.3114801049232483,
+      "eval_runtime": 16.9667,
+      "eval_samples_per_second": 26.758,
+      "eval_steps_per_second": 6.719,
+      "step": 90
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 7.792494481236204e-05,
+      "loss": 0.2096,
+      "step": 100
+    },
+    {
+      "epoch": 0.22,
+      "eval_accuracy": 0.9030836820602417,
+      "eval_loss": 0.2851845622062683,
+      "eval_runtime": 16.7531,
+      "eval_samples_per_second": 27.1,
+      "eval_steps_per_second": 6.805,
+      "step": 100
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 7.571743929359824e-05,
+      "loss": 0.2619,
+      "step": 110
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.8964757919311523,
+      "eval_loss": 0.22432558238506317,
+      "eval_runtime": 18.4437,
+      "eval_samples_per_second": 24.615,
+      "eval_steps_per_second": 6.181,
+      "step": 110
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 7.350993377483444e-05,
+      "loss": 0.2568,
+      "step": 120
+    },
+    {
+      "epoch": 0.26,
+      "eval_accuracy": 0.8832598924636841,
+      "eval_loss": 0.3484536409378052,
+      "eval_runtime": 23.929,
+      "eval_samples_per_second": 18.973,
+      "eval_steps_per_second": 4.764,
+      "step": 120
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 7.130242825607064e-05,
+      "loss": 0.171,
+      "step": 130
+    },
+    {
+      "epoch": 0.29,
+      "eval_accuracy": 0.8854625821113586,
+      "eval_loss": 0.36249256134033203,
+      "eval_runtime": 16.6508,
+      "eval_samples_per_second": 27.266,
+      "eval_steps_per_second": 6.847,
+      "step": 130
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 6.909492273730685e-05,
+      "loss": 0.2208,
+      "step": 140
+    },
+    {
+      "epoch": 0.31,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.27433687448501587,
+      "eval_runtime": 17.0236,
+      "eval_samples_per_second": 26.669,
+      "eval_steps_per_second": 6.697,
+      "step": 140
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.688741721854305e-05,
+      "loss": 0.1581,
+      "step": 150
+    },
+    {
+      "epoch": 0.33,
+      "eval_accuracy": 0.9140968918800354,
+      "eval_loss": 0.2508123517036438,
+      "eval_runtime": 18.1498,
+      "eval_samples_per_second": 25.014,
+      "eval_steps_per_second": 6.281,
+      "step": 150
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.467991169977925e-05,
+      "loss": 0.2796,
+      "step": 160
+    },
+    {
+      "epoch": 0.35,
+      "eval_accuracy": 0.9118942618370056,
+      "eval_loss": 0.24465535581111908,
+      "eval_runtime": 16.9303,
+      "eval_samples_per_second": 26.816,
+      "eval_steps_per_second": 6.733,
+      "step": 160
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.247240618101545e-05,
+      "loss": 0.2155,
+      "step": 170
+    },
+    {
+      "epoch": 0.37,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.250988245010376,
+      "eval_runtime": 17.1735,
+      "eval_samples_per_second": 26.436,
+      "eval_steps_per_second": 6.638,
+      "step": 170
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.026490066225165e-05,
+      "loss": 0.2012,
+      "step": 180
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9118942618370056,
+      "eval_loss": 0.2246789187192917,
+      "eval_runtime": 16.6423,
+      "eval_samples_per_second": 27.28,
+      "eval_steps_per_second": 6.85,
+      "step": 180
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 5.805739514348786e-05,
+      "loss": 0.251,
+      "step": 190
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.91629958152771,
+      "eval_loss": 0.24300266802310944,
+      "eval_runtime": 17.9462,
+      "eval_samples_per_second": 25.298,
+      "eval_steps_per_second": 6.352,
+      "step": 190
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 5.607064017660044e-05,
+      "loss": 0.3025,
+      "step": 200
+    },
+    {
+      "epoch": 0.44,
+      "eval_accuracy": 0.91629958152771,
+      "eval_loss": 0.28177693486213684,
+      "eval_runtime": 16.5094,
+      "eval_samples_per_second": 27.499,
+      "eval_steps_per_second": 6.905,
+      "step": 200
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 5.386313465783664e-05,
+      "loss": 0.2298,
+      "step": 210
+    },
+    {
+      "epoch": 0.46,
+      "eval_accuracy": 0.907489001750946,
+      "eval_loss": 0.26173070073127747,
+      "eval_runtime": 16.7193,
+      "eval_samples_per_second": 27.154,
+      "eval_steps_per_second": 6.818,
+      "step": 210
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 5.165562913907285e-05,
+      "loss": 0.1938,
+      "step": 220
+    },
+    {
+      "epoch": 0.49,
+      "eval_accuracy": 0.8964757919311523,
+      "eval_loss": 0.3249448239803314,
+      "eval_runtime": 17.1352,
+      "eval_samples_per_second": 26.495,
+      "eval_steps_per_second": 6.653,
+      "step": 220
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.9448123620309056e-05,
+      "loss": 0.2256,
+      "step": 230
+    },
+    {
+      "epoch": 0.51,
+      "eval_accuracy": 0.8766520023345947,
+      "eval_loss": 0.3929162621498108,
+      "eval_runtime": 27.4825,
+      "eval_samples_per_second": 16.52,
+      "eval_steps_per_second": 4.148,
+      "step": 230
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.7240618101545256e-05,
+      "loss": 0.1327,
+      "step": 240
+    },
+    {
+      "epoch": 0.53,
+      "eval_accuracy": 0.907489001750946,
+      "eval_loss": 0.2901674509048462,
+      "eval_runtime": 17.1801,
+      "eval_samples_per_second": 26.426,
+      "eval_steps_per_second": 6.636,
+      "step": 240
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.5033112582781463e-05,
+      "loss": 0.1238,
+      "step": 250
+    },
+    {
+      "epoch": 0.55,
+      "eval_accuracy": 0.9140968918800354,
+      "eval_loss": 0.2505219280719757,
+      "eval_runtime": 17.0203,
+      "eval_samples_per_second": 26.674,
+      "eval_steps_per_second": 6.698,
+      "step": 250
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.2825607064017664e-05,
+      "loss": 0.1279,
+      "step": 260
+    },
+    {
+      "epoch": 0.57,
+      "eval_accuracy": 0.9030836820602417,
+      "eval_loss": 0.2885590195655823,
+      "eval_runtime": 16.8884,
+      "eval_samples_per_second": 26.882,
+      "eval_steps_per_second": 6.75,
+      "step": 260
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 4.0618101545253864e-05,
+      "loss": 0.3321,
+      "step": 270
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.9008810520172119,
+      "eval_loss": 0.301535964012146,
+      "eval_runtime": 17.9274,
+      "eval_samples_per_second": 25.324,
+      "eval_steps_per_second": 6.359,
+      "step": 270
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.8631346578366446e-05,
+      "loss": 0.2077,
+      "step": 280
+    },
+    {
+      "epoch": 0.62,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.28936102986335754,
+      "eval_runtime": 18.9025,
+      "eval_samples_per_second": 24.018,
+      "eval_steps_per_second": 6.031,
+      "step": 280
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.6423841059602646e-05,
+      "loss": 0.2746,
+      "step": 290
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.26631271839141846,
+      "eval_runtime": 17.2835,
+      "eval_samples_per_second": 26.268,
+      "eval_steps_per_second": 6.596,
+      "step": 290
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.4216335540838853e-05,
+      "loss": 0.1774,
+      "step": 300
+    },
+    {
+      "epoch": 0.66,
+      "eval_accuracy": 0.9140968918800354,
+      "eval_loss": 0.2531871497631073,
+      "eval_runtime": 18.4185,
+      "eval_samples_per_second": 24.649,
+      "eval_steps_per_second": 6.189,
+      "step": 300
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.200883002207506e-05,
+      "loss": 0.1757,
+      "step": 310
+    },
+    {
+      "epoch": 0.68,
+      "eval_accuracy": 0.91629958152771,
+      "eval_loss": 0.21960243582725525,
+      "eval_runtime": 17.2208,
+      "eval_samples_per_second": 26.363,
+      "eval_steps_per_second": 6.62,
+      "step": 310
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 2.980132450331126e-05,
+      "loss": 0.2271,
+      "step": 320
+    },
+    {
+      "epoch": 0.71,
+      "eval_accuracy": 0.9052863717079163,
+      "eval_loss": 0.25458627939224243,
+      "eval_runtime": 16.7182,
+      "eval_samples_per_second": 27.156,
+      "eval_steps_per_second": 6.819,
+      "step": 320
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 2.7593818984547465e-05,
+      "loss": 0.1546,
+      "step": 330
+    },
+    {
+      "epoch": 0.73,
+      "eval_accuracy": 0.8854625821113586,
+      "eval_loss": 0.32153868675231934,
+      "eval_runtime": 16.7413,
+      "eval_samples_per_second": 27.119,
+      "eval_steps_per_second": 6.809,
+      "step": 330
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 2.538631346578367e-05,
+      "loss": 0.1999,
+      "step": 340
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.9008810520172119,
+      "eval_loss": 0.25611090660095215,
+      "eval_runtime": 27.5096,
+      "eval_samples_per_second": 16.503,
+      "eval_steps_per_second": 4.144,
+      "step": 340
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 2.317880794701987e-05,
+      "loss": 0.2098,
+      "step": 350
+    },
+    {
+      "epoch": 0.77,
+      "eval_accuracy": 0.892070472240448,
+      "eval_loss": 0.24251103401184082,
+      "eval_runtime": 17.0522,
+      "eval_samples_per_second": 26.624,
+      "eval_steps_per_second": 6.685,
+      "step": 350
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 2.097130242825607e-05,
+      "loss": 0.1623,
+      "step": 360
+    },
+    {
+      "epoch": 0.79,
+      "eval_accuracy": 0.9052863717079163,
+      "eval_loss": 0.23717546463012695,
+      "eval_runtime": 16.9552,
+      "eval_samples_per_second": 26.776,
+      "eval_steps_per_second": 6.724,
+      "step": 360
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 1.8763796909492273e-05,
+      "loss": 0.2701,
+      "step": 370
+    },
+    {
+      "epoch": 0.82,
+      "eval_accuracy": 0.9229074716567993,
+      "eval_loss": 0.24308158457279205,
+      "eval_runtime": 17.2488,
+      "eval_samples_per_second": 26.321,
+      "eval_steps_per_second": 6.609,
+      "step": 370
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 1.655629139072848e-05,
+      "loss": 0.3512,
+      "step": 380
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.22931186854839325,
+      "eval_runtime": 18.2255,
+      "eval_samples_per_second": 24.91,
+      "eval_steps_per_second": 6.255,
+      "step": 380
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.4348785871964682e-05,
+      "loss": 0.2043,
+      "step": 390
+    },
+    {
+      "epoch": 0.86,
+      "eval_accuracy": 0.9030836820602417,
+      "eval_loss": 0.22873848676681519,
+      "eval_runtime": 17.3783,
+      "eval_samples_per_second": 26.124,
+      "eval_steps_per_second": 6.56,
+      "step": 390
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 1.2141280353200883e-05,
+      "loss": 0.1794,
+      "step": 400
+    },
+    {
+      "epoch": 0.88,
+      "eval_accuracy": 0.9096916317939758,
+      "eval_loss": 0.2241315245628357,
+      "eval_runtime": 17.0594,
+      "eval_samples_per_second": 26.613,
+      "eval_steps_per_second": 6.683,
+      "step": 400
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 9.933774834437086e-06,
+      "loss": 0.1664,
+      "step": 410
+    },
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.9052863717079163,
+      "eval_loss": 0.24238458275794983,
+      "eval_runtime": 17.031,
+      "eval_samples_per_second": 26.657,
+      "eval_steps_per_second": 6.694,
+      "step": 410
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 7.72626931567329e-06,
+      "loss": 0.1018,
+      "step": 420
+    },
+    {
+      "epoch": 0.93,
+      "eval_accuracy": 0.9052863717079163,
+      "eval_loss": 0.23826861381530762,
+      "eval_runtime": 18.4005,
+      "eval_samples_per_second": 24.673,
+      "eval_steps_per_second": 6.195,
+      "step": 420
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 5.518763796909492e-06,
+      "loss": 0.2466,
+      "step": 430
+    },
+    {
+      "epoch": 0.95,
+      "eval_accuracy": 0.907489001750946,
+      "eval_loss": 0.23324483633041382,
+      "eval_runtime": 16.9891,
+      "eval_samples_per_second": 26.723,
+      "eval_steps_per_second": 6.71,
+      "step": 430
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.3112582781456956e-06,
+      "loss": 0.2018,
+      "step": 440
+    },
+    {
+      "epoch": 0.97,
+      "eval_accuracy": 0.9140968918800354,
+      "eval_loss": 0.2161666452884674,
+      "eval_runtime": 17.0773,
+      "eval_samples_per_second": 26.585,
+      "eval_steps_per_second": 6.676,
+      "step": 440
+    }
+  ],
+  "max_steps": 453,
+  "num_train_epochs": 1,
+  "total_flos": 1.0743559886592e+17,
+  "trial_name": null,
+  "trial_params": null
+}