End of training

Browse files

Files changed (4) hide show

README.md +19 -65
adapter.hch.safetensors +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,7 +1,5 @@
 ---
 library_name: transformers
-license: cc-by-nc-4.0
-base_model: facebook/mms-1b-all
 tags:
 - generated_from_trainer
 metrics:
@@ -16,11 +14,11 @@ should probably proofread and complete it, then remove this comment. -->
 # ssc-hch-mms-model-mix-adapt-max3-devtrain
-This model is a fine-tuned version of [facebook/mms-1b-all](https://huggingface.co/facebook/mms-1b-all) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3053
-- Cer: 0.1045
-- Wer: 0.6115
 ## Model description
@@ -40,75 +38,31 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
-- train_batch_size: 8
 - eval_batch_size: 6
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 100
-- num_epochs: 20
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch   | Step  | Validation Loss | Cer    | Wer    |
-|:-------------:|:-------:|:-----:|:---------------:|:------:|:------:|
-| 1.4276        | 0.3660  | 200   | 0.9544          | 0.2735 | 0.9803 |
-| 1.161         | 0.7319  | 400   | 0.7525          | 0.2255 | 0.9350 |
-| 1.0239        | 1.0970  | 600   | 0.6291          | 0.2027 | 0.9035 |
-| 1.0017        | 1.4629  | 800   | 0.6006          | 0.1892 | 0.8764 |
-| 0.9205        | 1.8289  | 1000  | 0.5486          | 0.1751 | 0.8497 |
-| 0.8995        | 2.1940  | 1200  | 0.5242          | 0.1767 | 0.8525 |
-| 0.826         | 2.5599  | 1400  | 0.4803          | 0.1651 | 0.8168 |
-| 0.883         | 2.9259  | 1600  | 0.4681          | 0.1631 | 0.8080 |
-| 0.8183        | 3.2909  | 1800  | 0.4751          | 0.1525 | 0.7907 |
-| 0.8069        | 3.6569  | 2000  | 0.4530          | 0.1571 | 0.7835 |
-| 0.7999        | 4.0220  | 2200  | 0.4156          | 0.1456 | 0.7588 |
-| 0.7343        | 4.3879  | 2400  | 0.4135          | 0.1398 | 0.7347 |
-| 0.7828        | 4.7539  | 2600  | 0.4156          | 0.1402 | 0.7455 |
-| 0.6965        | 5.1189  | 2800  | 0.4064          | 0.1375 | 0.7383 |
-| 0.7361        | 5.4849  | 3000  | 0.3888          | 0.1362 | 0.7316 |
-| 0.7471        | 5.8509  | 3200  | 0.3795          | 0.1316 | 0.7148 |
-| 0.6734        | 6.2159  | 3400  | 0.3919          | 0.1313 | 0.7085 |
-| 0.6824        | 6.5819  | 3600  | 0.3979          | 0.1280 | 0.7089 |
-| 0.6755        | 6.9478  | 3800  | 0.3972          | 0.1287 | 0.7029 |
-| 0.6782        | 7.3129  | 4000  | 0.4095          | 0.1269 | 0.6907 |
-| 0.6285        | 7.6789  | 4200  | 0.4088          | 0.1284 | 0.6932 |
-| 0.6501        | 8.0439  | 4400  | 0.3619          | 0.1247 | 0.6881 |
-| 0.6508        | 8.4099  | 4600  | 0.3708          | 0.1257 | 0.6886 |
-| 0.6154        | 8.7758  | 4800  | 0.3512          | 0.1227 | 0.6795 |
-| 0.5889        | 9.1409  | 5000  | 0.3874          | 0.1215 | 0.6694 |
-| 0.6095        | 9.5069  | 5200  | 0.3942          | 0.1247 | 0.6842 |
-| 0.6149        | 9.8728  | 5400  | 0.3711          | 0.1198 | 0.6641 |
-| 0.5771        | 10.2379 | 5600  | 0.3817          | 0.1189 | 0.6550 |
-| 0.6132        | 10.6038 | 5800  | 0.3287          | 0.1182 | 0.6562 |
-| 0.5934        | 10.9698 | 6000  | 0.3257          | 0.1142 | 0.6550 |
-| 0.5774        | 11.3349 | 6200  | 0.3352          | 0.1170 | 0.6571 |
-| 0.5632        | 11.7008 | 6400  | 0.3274          | 0.1131 | 0.6425 |
-| 0.5534        | 12.0659 | 6600  | 0.3450          | 0.1161 | 0.6476 |
-| 0.5547        | 12.4318 | 6800  | 0.3396          | 0.1136 | 0.6453 |
-| 0.5281        | 12.7978 | 7000  | 0.3411          | 0.1136 | 0.6411 |
-| 0.5361        | 13.1629 | 7200  | 0.3187          | 0.1111 | 0.6450 |
-| 0.5335        | 13.5288 | 7400  | 0.2954          | 0.1111 | 0.6372 |
-| 0.5424        | 13.8948 | 7600  | 0.3327          | 0.1109 | 0.6399 |
-| 0.5248        | 14.2598 | 7800  | 0.3223          | 0.1119 | 0.6377 |
-| 0.5281        | 14.6258 | 8000  | 0.3159          | 0.1110 | 0.6296 |
-| 0.5291        | 14.9918 | 8200  | 0.3163          | 0.1086 | 0.6302 |
-| 0.5076        | 15.3568 | 8400  | 0.3148          | 0.1080 | 0.6230 |
-| 0.5189        | 15.7228 | 8600  | 0.3256          | 0.1084 | 0.6230 |
-| 0.5173        | 16.0878 | 8800  | 0.3157          | 0.1093 | 0.6267 |
-| 0.5077        | 16.4538 | 9000  | 0.3076          | 0.1072 | 0.6203 |
-| 0.4914        | 16.8198 | 9200  | 0.3051          | 0.1066 | 0.6205 |
-| 0.4983        | 17.1848 | 9400  | 0.3137          | 0.1071 | 0.6237 |
-| 0.5008        | 17.5508 | 9600  | 0.3192          | 0.1072 | 0.6161 |
-| 0.4766        | 17.9167 | 9800  | 0.3039          | 0.1061 | 0.6168 |
-| 0.4845        | 18.2818 | 10000 | 0.3179          | 0.1060 | 0.6164 |
-| 0.4955        | 18.6478 | 10200 | 0.3164          | 0.1049 | 0.6133 |
-| 0.466         | 19.0128 | 10400 | 0.3124          | 0.1045 | 0.6129 |
-| 0.4639        | 19.3788 | 10600 | 0.3071          | 0.1045 | 0.6115 |
-| 0.4944        | 19.7447 | 10800 | 0.3053          | 0.1045 | 0.6115 |
 ### Framework versions

 ---
 library_name: transformers
 tags:
 - generated_from_trainer
 metrics:
 # ssc-hch-mms-model-mix-adapt-max3-devtrain
+This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2614
+- Cer: 0.1088
+- Wer: 0.6374
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
+- train_batch_size: 1
 - eval_batch_size: 6
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 2
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 100
+- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Cer    | Wer    |
+|:-------------:|:------:|:----:|:---------------:|:------:|:------:|
+| 0.3141        | 0.4739 | 200  | 0.2800          | 0.1156 | 0.6619 |
+| 0.3367        | 0.9479 | 400  | 0.2720          | 0.1125 | 0.6523 |
+| 0.2839        | 1.4218 | 600  | 0.2836          | 0.1166 | 0.6643 |
+| 0.3091        | 1.8957 | 800  | 0.2665          | 0.1116 | 0.6487 |
+| 0.2442        | 2.3697 | 1000 | 0.2818          | 0.1131 | 0.6497 |
+| 0.249         | 2.8436 | 1200 | 0.2785          | 0.1124 | 0.6550 |
+| 0.2169        | 3.3175 | 1400 | 0.2674          | 0.1117 | 0.6481 |
+| 0.2255        | 3.7915 | 1600 | 0.2593          | 0.1092 | 0.6400 |
+| 0.2075        | 4.2654 | 1800 | 0.2625          | 0.1087 | 0.6307 |
+| 0.2047        | 4.7393 | 2000 | 0.2614          | 0.1088 | 0.6374 |
 ### Framework versions

adapter.hch.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6fdf1d2bc8239d350d1b554e7f4d68e2205315cfea5d0f2010c9c1b9425bdee2
 size 9039376

 version https://git-lfs.github.com/spec/v1
+oid sha256:67c6018f9fbb8aa32f9fc0e180175d2cafb4a38ce6313576914c270e827c7687
 size 9039376

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9358b9de9159993b6418f1220d2f1295677b122b80ad79c54e2d930a3e273636
 size 3859131752

 version https://git-lfs.github.com/spec/v1
+oid sha256:902cad9825dc98092f4cacd4b13877d2a82219a0117d332e656f184afb0f336a
 size 3859131752

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d335b454df421db5ceb9b2a0114bb03910d4ef655f3315824d663d0655e31ab0
 size 5969

 version https://git-lfs.github.com/spec/v1
+oid sha256:8acd04a79c8eff7da1d5b4f873c5b8ca6d8650d6128c5fb792e84b9212399cdd
 size 5969