ViFortune-AI
/

vit5_large_diasum

Safetensors

Model card Files Files and versions

xet

Community

Tnt3o5 commited on Oct 11, 2025

Commit

167ed37

verified ·

1 Parent(s): 7ef4397

Delete trainer_state.json

Browse files

Files changed (1) hide show

trainer_state.json +0 -342

trainer_state.json DELETED Viewed

@@ -1,342 +0,0 @@
-{
-  "best_global_step": null,
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 1.3249907986750091,
-  "eval_steps": 500,
-  "global_step": 3600,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0368052999631947,
-      "grad_norm": 6.317627906799316,
-      "learning_rate": 3.991842559741558e-05,
-      "loss": 1.3232,
-      "step": 100
-    },
-    {
-      "epoch": 0.0736105999263894,
-      "grad_norm": 6.4019927978515625,
-      "learning_rate": 3.9770967337294366e-05,
-      "loss": 1.1983,
-      "step": 200
-    },
-    {
-      "epoch": 0.1104158998895841,
-      "grad_norm": 5.58203649520874,
-      "learning_rate": 3.962350907717314e-05,
-      "loss": 1.1226,
-      "step": 300
-    },
-    {
-      "epoch": 0.1472211998527788,
-      "grad_norm": 4.505954742431641,
-      "learning_rate": 3.947605081705192e-05,
-      "loss": 0.7575,
-      "step": 400
-    },
-    {
-      "epoch": 0.1840264998159735,
-      "grad_norm": 5.4588165283203125,
-      "learning_rate": 3.93285925569307e-05,
-      "loss": 0.684,
-      "step": 500
-    },
-    {
-      "epoch": 0.1840264998159735,
-      "eval_loss": 2.1012208461761475,
-      "eval_runtime": 663.3742,
-      "eval_samples_per_second": 8.193,
-      "eval_steps_per_second": 1.025,
-      "step": 500
-    },
-    {
-      "epoch": 0.2208317997791682,
-      "grad_norm": 4.757272720336914,
-      "learning_rate": 3.918113429680948e-05,
-      "loss": 0.6552,
-      "step": 600
-    },
-    {
-      "epoch": 0.2576370997423629,
-      "grad_norm": 4.794644355773926,
-      "learning_rate": 3.903367603668826e-05,
-      "loss": 0.6429,
-      "step": 700
-    },
-    {
-      "epoch": 0.2944423997055576,
-      "grad_norm": 5.151235103607178,
-      "learning_rate": 3.888621777656704e-05,
-      "loss": 0.6567,
-      "step": 800
-    },
-    {
-      "epoch": 0.3312476996687523,
-      "grad_norm": 5.006649971008301,
-      "learning_rate": 3.8738759516445824e-05,
-      "loss": 0.6278,
-      "step": 900
-    },
-    {
-      "epoch": 0.368052999631947,
-      "grad_norm": 6.711447715759277,
-      "learning_rate": 3.85913012563246e-05,
-      "loss": 0.637,
-      "step": 1000
-    },
-    {
-      "epoch": 0.368052999631947,
-      "eval_loss": 2.1562345027923584,
-      "eval_runtime": 663.0039,
-      "eval_samples_per_second": 8.198,
-      "eval_steps_per_second": 1.026,
-      "step": 1000
-    },
-    {
-      "epoch": 0.4048582995951417,
-      "grad_norm": 5.702431678771973,
-      "learning_rate": 3.844384299620338e-05,
-      "loss": 0.5867,
-      "step": 1100
-    },
-    {
-      "epoch": 0.4416635995583364,
-      "grad_norm": 4.582945346832275,
-      "learning_rate": 3.829638473608216e-05,
-      "loss": 0.6156,
-      "step": 1200
-    },
-    {
-      "epoch": 0.4784688995215311,
-      "grad_norm": 4.968910217285156,
-      "learning_rate": 3.814892647596094e-05,
-      "loss": 0.6213,
-      "step": 1300
-    },
-    {
-      "epoch": 0.5152741994847257,
-      "grad_norm": 5.8628950119018555,
-      "learning_rate": 3.800146821583972e-05,
-      "loss": 0.6036,
-      "step": 1400
-    },
-    {
-      "epoch": 0.5520794994479205,
-      "grad_norm": 4.60435676574707,
-      "learning_rate": 3.7854009955718494e-05,
-      "loss": 0.5947,
-      "step": 1500
-    },
-    {
-      "epoch": 0.5520794994479205,
-      "eval_loss": 2.2223360538482666,
-      "eval_runtime": 662.8599,
-      "eval_samples_per_second": 8.199,
-      "eval_steps_per_second": 1.026,
-      "step": 1500
-    },
-    {
-      "epoch": 0.5888847994111152,
-      "grad_norm": 4.219241142272949,
-      "learning_rate": 3.7706551695597275e-05,
-      "loss": 0.61,
-      "step": 1600
-    },
-    {
-      "epoch": 0.6256900993743099,
-      "grad_norm": 4.9983344078063965,
-      "learning_rate": 3.7559093435476055e-05,
-      "loss": 0.5801,
-      "step": 1700
-    },
-    {
-      "epoch": 0.6624953993375046,
-      "grad_norm": 5.795677185058594,
-      "learning_rate": 3.7411635175354836e-05,
-      "loss": 0.6016,
-      "step": 1800
-    },
-    {
-      "epoch": 0.6993006993006993,
-      "grad_norm": 4.981507778167725,
-      "learning_rate": 3.726417691523362e-05,
-      "loss": 0.5839,
-      "step": 1900
-    },
-    {
-      "epoch": 0.736105999263894,
-      "grad_norm": 5.115480899810791,
-      "learning_rate": 3.71167186551124e-05,
-      "loss": 0.5946,
-      "step": 2000
-    },
-    {
-      "epoch": 0.736105999263894,
-      "eval_loss": 2.1914401054382324,
-      "eval_runtime": 663.2825,
-      "eval_samples_per_second": 8.194,
-      "eval_steps_per_second": 1.025,
-      "step": 2000
-    },
-    {
-      "epoch": 0.7729112992270887,
-      "grad_norm": 4.6113176345825195,
-      "learning_rate": 3.696926039499117e-05,
-      "loss": 0.5763,
-      "step": 2100
-    },
-    {
-      "epoch": 0.8097165991902834,
-      "grad_norm": 4.699350833892822,
-      "learning_rate": 3.682180213486995e-05,
-      "loss": 0.6007,
-      "step": 2200
-    },
-    {
-      "epoch": 0.8465218991534781,
-      "grad_norm": 4.8883233070373535,
-      "learning_rate": 3.667434387474873e-05,
-      "loss": 0.5741,
-      "step": 2300
-    },
-    {
-      "epoch": 0.8833271991166728,
-      "grad_norm": 5.460277557373047,
-      "learning_rate": 3.652688561462751e-05,
-      "loss": 0.5596,
-      "step": 2400
-    },
-    {
-      "epoch": 0.9201324990798675,
-      "grad_norm": 4.431008338928223,
-      "learning_rate": 3.6379427354506294e-05,
-      "loss": 0.5831,
-      "step": 2500
-    },
-    {
-      "epoch": 0.9201324990798675,
-      "eval_loss": 2.2241196632385254,
-      "eval_runtime": 662.9801,
-      "eval_samples_per_second": 8.198,
-      "eval_steps_per_second": 1.026,
-      "step": 2500
-    },
-    {
-      "epoch": 0.9569377990430622,
-      "grad_norm": 4.917581081390381,
-      "learning_rate": 3.6231969094385074e-05,
-      "loss": 0.5956,
-      "step": 2600
-    },
-    {
-      "epoch": 0.9937430990062569,
-      "grad_norm": 5.325926780700684,
-      "learning_rate": 3.6084510834263855e-05,
-      "loss": 0.6783,
-      "step": 2700
-    },
-    {
-      "epoch": 1.0305483989694515,
-      "grad_norm": 3.779780149459839,
-      "learning_rate": 3.593705257414263e-05,
-      "loss": 0.356,
-      "step": 2800
-    },
-    {
-      "epoch": 1.0673536989326462,
-      "grad_norm": 7.602641582489014,
-      "learning_rate": 3.5789594314021416e-05,
-      "loss": 0.2066,
-      "step": 2900
-    },
-    {
-      "epoch": 1.104158998895841,
-      "grad_norm": 5.734857082366943,
-      "learning_rate": 3.564213605390019e-05,
-      "loss": 0.2202,
-      "step": 3000
-    },
-    {
-      "epoch": 1.104158998895841,
-      "eval_loss": 2.732856512069702,
-      "eval_runtime": 663.1541,
-      "eval_samples_per_second": 8.196,
-      "eval_steps_per_second": 1.025,
-      "step": 3000
-    },
-    {
-      "epoch": 1.1409642988590356,
-      "grad_norm": 5.713295936584473,
-      "learning_rate": 3.549467779377897e-05,
-      "loss": 0.6849,
-      "step": 3100
-    },
-    {
-      "epoch": 1.1777695988222303,
-      "grad_norm": 8.02027702331543,
-      "learning_rate": 3.534721953365775e-05,
-      "loss": 0.6996,
-      "step": 3200
-    },
-    {
-      "epoch": 1.214574898785425,
-      "grad_norm": 7.312982082366943,
-      "learning_rate": 3.5199761273536525e-05,
-      "loss": 0.6721,
-      "step": 3300
-    },
-    {
-      "epoch": 1.2513801987486197,
-      "grad_norm": 6.537501811981201,
-      "learning_rate": 3.505230301341531e-05,
-      "loss": 0.6689,
-      "step": 3400
-    },
-    {
-      "epoch": 1.2881854987118144,
-      "grad_norm": 6.13110876083374,
-      "learning_rate": 3.4904844753294086e-05,
-      "loss": 0.6943,
-      "step": 3500
-    },
-    {
-      "epoch": 1.2881854987118144,
-      "eval_loss": 2.2627553939819336,
-      "eval_runtime": 662.7328,
-      "eval_samples_per_second": 8.201,
-      "eval_steps_per_second": 1.026,
-      "step": 3500
-    },
-    {
-      "epoch": 1.3249907986750091,
-      "grad_norm": 7.125514984130859,
-      "learning_rate": 3.4757386493172874e-05,
-      "loss": 0.6925,
-      "step": 3600
-    }
-  ],
-  "logging_steps": 100,
-  "max_steps": 27170,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
-  "save_steps": 100,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": false
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 1.001052086206464e+17,
-  "train_batch_size": 8,
-  "trial_name": null,
-  "trial_params": null
-}