mau-cr
/

mms-maya-080min

+[
+  {
+    "loss": 3.9173959350585936,
+    "grad_norm": 1.2155354022979736,
+    "learning_rate": 0.00099,
+    "epoch": 4.3478260869565215,
+    "step": 100
+  },
+  {
+    "eval_loss": 0.5551369786262512,
+    "eval_wer": 0.533585619678335,
+    "eval_runtime": 4.1258,
+    "eval_samples_per_second": 36.842,
+    "eval_steps_per_second": 4.605,
+    "epoch": 4.3478260869565215,
+    "step": 100
+  },
+  {
+    "loss": 0.6211311721801758,
+    "grad_norm": 0.5991238355636597,
+    "learning_rate": 0.0008792682926829268,
+    "epoch": 8.695652173913043,
+    "step": 200
+  },
+  {
+    "eval_loss": 0.5127682089805603,
+    "eval_wer": 0.49479659413434246,
+    "eval_runtime": 4.1435,
+    "eval_samples_per_second": 36.684,
+    "eval_steps_per_second": 4.586,
+    "epoch": 8.695652173913043,
+    "step": 200
+  },
+  {
+    "loss": 0.48980007171630857,
+    "grad_norm": 0.5660077333450317,
+    "learning_rate": 0.0007573170731707317,
+    "epoch": 13.043478260869565,
+    "step": 300
+  },
+  {
+    "eval_loss": 0.5000773072242737,
+    "eval_wer": 0.47776726584673607,
+    "eval_runtime": 4.1244,
+    "eval_samples_per_second": 36.854,
+    "eval_steps_per_second": 4.607,
+    "epoch": 13.043478260869565,
+    "step": 300
+  },
+  {
+    "loss": 0.41821846008300784,
+    "grad_norm": 0.641327440738678,
+    "learning_rate": 0.0006353658536585366,
+    "epoch": 17.391304347826086,
+    "step": 400
+  },
+  {
+    "eval_loss": 0.4955653250217438,
+    "eval_wer": 0.4725638599810785,
+    "eval_runtime": 4.1284,
+    "eval_samples_per_second": 36.818,
+    "eval_steps_per_second": 4.602,
+    "epoch": 17.391304347826086,
+    "step": 400
+  },
+  {
+    "loss": 0.3750358200073242,
+    "grad_norm": 1.793125867843628,
+    "learning_rate": 0.0005134146341463415,
+    "epoch": 21.73913043478261,
+    "step": 500
+  },
+  {
+    "eval_loss": 0.516922116279602,
+    "eval_wer": 0.47540208136234624,
+    "eval_runtime": 4.1272,
+    "eval_samples_per_second": 36.829,
+    "eval_steps_per_second": 4.604,
+    "epoch": 21.73913043478261,
+    "step": 500
+  },
+  {
+    "loss": 0.3346158218383789,
+    "grad_norm": 0.6309618949890137,
+    "learning_rate": 0.00039146341463414634,
+    "epoch": 26.08695652173913,
+    "step": 600
+  },
+  {
+    "eval_loss": 0.507932186126709,
+    "eval_wer": 0.45931882686849573,
+    "eval_runtime": 4.1444,
+    "eval_samples_per_second": 36.676,
+    "eval_steps_per_second": 4.585,
+    "epoch": 26.08695652173913,
+    "step": 600
+  },
+  {
+    "loss": 0.30129409790039063,
+    "grad_norm": 0.8467895984649658,
+    "learning_rate": 0.0002695121951219512,
+    "epoch": 30.434782608695652,
+    "step": 700
+  },
+  {
+    "eval_loss": 0.5416971445083618,
+    "eval_wer": 0.4649952696310312,
+    "eval_runtime": 4.1267,
+    "eval_samples_per_second": 36.833,
+    "eval_steps_per_second": 4.604,
+    "epoch": 30.434782608695652,
+    "step": 700
+  },
+  {
+    "loss": 0.27793073654174805,
+    "grad_norm": 0.9243687391281128,
+    "learning_rate": 0.0001475609756097561,
+    "epoch": 34.78260869565217,
+    "step": 800
+  },
+  {
+    "eval_loss": 0.528235673904419,
+    "eval_wer": 0.45695364238410596,
+    "eval_runtime": 4.148,
+    "eval_samples_per_second": 36.644,
+    "eval_steps_per_second": 4.581,
+    "epoch": 34.78260869565217,
+    "step": 800
+  },
+  {
+    "loss": 0.25999046325683595,
+    "grad_norm": 1.9254482984542847,
+    "learning_rate": 2.5609756097560973e-05,
+    "epoch": 39.130434782608695,
+    "step": 900
+  },
+  {
+    "eval_loss": 0.5384841561317444,
+    "eval_wer": 0.4631031220435194,
+    "eval_runtime": 4.1312,
+    "eval_samples_per_second": 36.793,
+    "eval_steps_per_second": 4.599,
+    "epoch": 39.130434782608695,
+    "step": 900
+  },
+  {
+    "eval_loss": 0.5373823046684265,
+    "eval_wer": 0.4621570482497635,
+    "eval_runtime": 4.1433,
+    "eval_samples_per_second": 36.685,
+    "eval_steps_per_second": 4.586,
+    "epoch": 40.0,
+    "step": 920
+  },
+  {
+    "train_runtime": 14796.7383,
+    "train_samples_per_second": 1.987,
+    "train_steps_per_second": 0.062,
+    "total_flos": 3.925662755756644e+19,
+    "train_loss": 0.7654728495556375,
+    "epoch": 40.0,
+    "step": 920
+  },
+  {
+    "test_loss": 0.5563547015190125,
+    "test_wer": 0.46591276252019387,
+    "test_runtime": 6.8586,
+    "test_samples_per_second": 38.929,
+    "test_steps_per_second": 4.957,
+    "epoch": 40.0,
+    "step": 920
+  }
+]