Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

all_results.json +11 -0
eval_results.json +6 -0
model.safetensors +3 -0
t3_full_finetuned.safetensors +3 -0
train_results.json +8 -0
trainer_state.json +273 -0
training_args.bin +3 -0
training_log.txt +53 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 1.9932075471698112,
+    "eval_runtime": 0.8671,
+    "eval_samples_per_second": 6.919,
+    "eval_steps_per_second": 1.153,
+    "total_flos": 0.0,
+    "train_loss": 3.8633889573993105,
+    "train_runtime": 2643.5458,
+    "train_samples_per_second": 8.02,
+    "train_steps_per_second": 0.125
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "epoch": 1.9932075471698112,
+    "eval_runtime": 0.8671,
+    "eval_samples_per_second": 6.919,
+    "eval_steps_per_second": 1.153
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03280e5c7cdcd527337ae5509dcf44f5212259b74fdd465695ed4e04103a2604
+size 2143990656

t3_full_finetuned.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5967346b10f31d670dca74905451f68bf617d770c6e6cda026f5b86703609440
+size 2143989752

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 1.9932075471698112,
+    "total_flos": 0.0,
+    "train_loss": 3.8633889573993105,
+    "train_runtime": 2643.5458,
+    "train_samples_per_second": 8.02,
+    "train_steps_per_second": 0.125
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,273 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.9932075471698112,
+  "eval_steps": 500.0,
+  "global_step": 330,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.06037735849056604,
+      "grad_norm": 102.50332641601562,
+      "learning_rate": 3e-06,
+      "loss": 5.0564,
+      "step": 10
+    },
+    {
+      "epoch": 0.12075471698113208,
+      "grad_norm": 100.99700164794922,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 4.6092,
+      "step": 20
+    },
+    {
+      "epoch": 0.1811320754716981,
+      "grad_norm": 79.72400665283203,
+      "learning_rate": 1.3000000000000001e-05,
+      "loss": 4.456,
+      "step": 30
+    },
+    {
+      "epoch": 0.24150943396226415,
+      "grad_norm": 73.68656921386719,
+      "learning_rate": 1.8e-05,
+      "loss": 4.3422,
+      "step": 40
+    },
+    {
+      "epoch": 0.3018867924528302,
+      "grad_norm": 63.52485275268555,
+      "learning_rate": 2.3000000000000003e-05,
+      "loss": 4.0122,
+      "step": 50
+    },
+    {
+      "epoch": 0.3622641509433962,
+      "grad_norm": 81.21367645263672,
+      "learning_rate": 2.8000000000000003e-05,
+      "loss": 4.1135,
+      "step": 60
+    },
+    {
+      "epoch": 0.4226415094339623,
+      "grad_norm": 53.12013244628906,
+      "learning_rate": 3.3e-05,
+      "loss": 3.8562,
+      "step": 70
+    },
+    {
+      "epoch": 0.4830188679245283,
+      "grad_norm": 66.63668823242188,
+      "learning_rate": 3.8e-05,
+      "loss": 4.2626,
+      "step": 80
+    },
+    {
+      "epoch": 0.5433962264150943,
+      "grad_norm": 64.65432739257812,
+      "learning_rate": 4.3e-05,
+      "loss": 4.0323,
+      "step": 90
+    },
+    {
+      "epoch": 0.6037735849056604,
+      "grad_norm": 58.95002365112305,
+      "learning_rate": 4.8e-05,
+      "loss": 4.1304,
+      "step": 100
+    },
+    {
+      "epoch": 0.6641509433962264,
+      "grad_norm": 71.38043975830078,
+      "learning_rate": 4.8695652173913046e-05,
+      "loss": 3.8795,
+      "step": 110
+    },
+    {
+      "epoch": 0.7245283018867924,
+      "grad_norm": 57.298316955566406,
+      "learning_rate": 4.6521739130434785e-05,
+      "loss": 4.0055,
+      "step": 120
+    },
+    {
+      "epoch": 0.7849056603773585,
+      "grad_norm": 59.41974639892578,
+      "learning_rate": 4.4347826086956525e-05,
+      "loss": 4.1426,
+      "step": 130
+    },
+    {
+      "epoch": 0.8452830188679246,
+      "grad_norm": 58.00967788696289,
+      "learning_rate": 4.2173913043478264e-05,
+      "loss": 4.0285,
+      "step": 140
+    },
+    {
+      "epoch": 0.9056603773584906,
+      "grad_norm": 63.804954528808594,
+      "learning_rate": 4e-05,
+      "loss": 4.1778,
+      "step": 150
+    },
+    {
+      "epoch": 0.9660377358490566,
+      "grad_norm": 61.9858512878418,
+      "learning_rate": 3.7826086956521736e-05,
+      "loss": 4.2706,
+      "step": 160
+    },
+    {
+      "epoch": 1.0271698113207548,
+      "grad_norm": 56.96372985839844,
+      "learning_rate": 3.565217391304348e-05,
+      "loss": 3.7699,
+      "step": 170
+    },
+    {
+      "epoch": 1.0875471698113208,
+      "grad_norm": 70.83443450927734,
+      "learning_rate": 3.347826086956522e-05,
+      "loss": 3.7837,
+      "step": 180
+    },
+    {
+      "epoch": 1.1479245283018868,
+      "grad_norm": 61.61659240722656,
+      "learning_rate": 3.130434782608696e-05,
+      "loss": 3.6811,
+      "step": 190
+    },
+    {
+      "epoch": 1.2083018867924529,
+      "grad_norm": 63.96455001831055,
+      "learning_rate": 2.9130434782608696e-05,
+      "loss": 3.7169,
+      "step": 200
+    },
+    {
+      "epoch": 1.268679245283019,
+      "grad_norm": 54.126808166503906,
+      "learning_rate": 2.6956521739130436e-05,
+      "loss": 3.4802,
+      "step": 210
+    },
+    {
+      "epoch": 1.329056603773585,
+      "grad_norm": 66.76802062988281,
+      "learning_rate": 2.4782608695652175e-05,
+      "loss": 3.7544,
+      "step": 220
+    },
+    {
+      "epoch": 1.389433962264151,
+      "grad_norm": 62.32306671142578,
+      "learning_rate": 2.2608695652173914e-05,
+      "loss": 3.2619,
+      "step": 230
+    },
+    {
+      "epoch": 1.449811320754717,
+      "grad_norm": 70.75401306152344,
+      "learning_rate": 2.0434782608695654e-05,
+      "loss": 3.4987,
+      "step": 240
+    },
+    {
+      "epoch": 1.510188679245283,
+      "grad_norm": 75.13993072509766,
+      "learning_rate": 1.8260869565217393e-05,
+      "loss": 3.4636,
+      "step": 250
+    },
+    {
+      "epoch": 1.570566037735849,
+      "grad_norm": 75.18315887451172,
+      "learning_rate": 1.608695652173913e-05,
+      "loss": 3.4056,
+      "step": 260
+    },
+    {
+      "epoch": 1.630943396226415,
+      "grad_norm": 65.60991668701172,
+      "learning_rate": 1.391304347826087e-05,
+      "loss": 3.5469,
+      "step": 270
+    },
+    {
+      "epoch": 1.691320754716981,
+      "grad_norm": 61.672264099121094,
+      "learning_rate": 1.173913043478261e-05,
+      "loss": 3.4558,
+      "step": 280
+    },
+    {
+      "epoch": 1.751698113207547,
+      "grad_norm": 80.44284057617188,
+      "learning_rate": 9.565217391304349e-06,
+      "loss": 3.644,
+      "step": 290
+    },
+    {
+      "epoch": 1.8120754716981131,
+      "grad_norm": 63.004974365234375,
+      "learning_rate": 7.391304347826088e-06,
+      "loss": 3.2974,
+      "step": 300
+    },
+    {
+      "epoch": 1.8724528301886791,
+      "grad_norm": 63.83254623413086,
+      "learning_rate": 5.217391304347826e-06,
+      "loss": 3.4935,
+      "step": 310
+    },
+    {
+      "epoch": 1.9328301886792452,
+      "grad_norm": 77.79533386230469,
+      "learning_rate": 3.0434782608695654e-06,
+      "loss": 3.1741,
+      "step": 320
+    },
+    {
+      "epoch": 1.9932075471698112,
+      "grad_norm": 54.132991790771484,
+      "learning_rate": 8.695652173913044e-07,
+      "loss": 3.6886,
+      "step": 330
+    },
+    {
+      "epoch": 1.9932075471698112,
+      "step": 330,
+      "total_flos": 0.0,
+      "train_loss": 3.8633889573993105,
+      "train_runtime": 2643.5458,
+      "train_samples_per_second": 8.02,
+      "train_steps_per_second": 0.125
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 330,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49acf4bb8926bbd127842d3bcffe2e9347353bf753a309caaae7398506c8c0c4
+size 5304

training_log.txt ADDED Viewed

	@@ -0,0 +1,53 @@

+================================================================================
+ChatterboxMultilingualTTS Full Fine-Tuning Log
+================================================================================
+Training started at step 0
+Total steps: 330
+Epochs: 2.0
+--------------------------------------------------------------------------------
+Step 10: loss=5.0564 lr=3.00e-06 epoch=0.06
+Step 20: loss=4.6092 lr=8.00e-06 epoch=0.12
+Step 30: loss=4.4560 lr=1.30e-05 epoch=0.18
+Step 40: loss=4.3422 lr=1.80e-05 epoch=0.24
+Step 50: loss=4.0122 lr=2.30e-05 epoch=0.30
+Step 60: loss=4.1135 lr=2.80e-05 epoch=0.36
+Step 70: loss=3.8562 lr=3.30e-05 epoch=0.42
+Step 80: loss=4.2626 lr=3.80e-05 epoch=0.48
+Step 90: loss=4.0323 lr=4.30e-05 epoch=0.54
+Completed step 100/330
+Step 100: loss=4.1304 lr=4.80e-05 epoch=0.60
+Step 110: loss=3.8795 lr=4.87e-05 epoch=0.66
+Step 120: loss=4.0055 lr=4.65e-05 epoch=0.72
+Step 130: loss=4.1426 lr=4.43e-05 epoch=0.78
+Step 140: loss=4.0285 lr=4.22e-05 epoch=0.85
+Step 150: loss=4.1778 lr=4.00e-05 epoch=0.91
+Step 160: loss=4.2706 lr=3.78e-05 epoch=0.97
+Step 170: loss=3.7699 lr=3.57e-05 epoch=1.03
+Step 180: loss=3.7837 lr=3.35e-05 epoch=1.09
+Step 190: loss=3.6811 lr=3.13e-05 epoch=1.15
+Completed step 200/330
+Step 200: loss=3.7169 lr=2.91e-05 epoch=1.21
+Step 210: loss=3.4802 lr=2.70e-05 epoch=1.27
+Step 220: loss=3.7544 lr=2.48e-05 epoch=1.33
+Step 230: loss=3.2619 lr=2.26e-05 epoch=1.39
+Step 240: loss=3.4987 lr=2.04e-05 epoch=1.45
+Step 250: loss=3.4636 lr=1.83e-05 epoch=1.51
+Step 260: loss=3.4056 lr=1.61e-05 epoch=1.57
+Step 270: loss=3.5469 lr=1.39e-05 epoch=1.63
+Step 280: loss=3.4558 lr=1.17e-05 epoch=1.69
+Step 290: loss=3.6440 lr=9.57e-06 epoch=1.75
+Completed step 300/330
+Step 300: loss=3.2974 lr=7.39e-06 epoch=1.81
+Step 310: loss=3.4935 lr=5.22e-06 epoch=1.87
+Step 320: loss=3.1741 lr=3.04e-06 epoch=1.93
+Step 330: loss=3.6886 lr=8.70e-07 epoch=1.99
+Checkpoint saved at step 330
+Step 330: epoch=1.99
+================================================================================
+Training completed!
+Final step: 330
+================================================================================
+Step 330: epoch=1.99