Model save

Browse files

Files changed (4) hide show

README.md +63 -63
config.json +4 -4
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/wav2vec2-large-960h](https://huggingface.co/facebook/wav2vec2-large-960h) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 32.5406
-- Wer: 0.0515
 ## Model description
@@ -42,7 +42,7 @@ The following hyperparameters were used during training:
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 60
 - mixed_precision_training: Native AMP
@@ -51,66 +51,66 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss | Wer    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|
-| 1153.3836     | 1.0   | 488   | 850.3044        | 0.6449 |
-| 928.434       | 2.0   | 976   | 691.6172        | 0.5685 |
-| 811.1838      | 3.0   | 1464  | 598.8566        | 0.4987 |
-| 717.7333      | 4.0   | 1952  | 552.0085        | 0.4545 |
-| 647.3931      | 5.0   | 2440  | 463.2961        | 0.3979 |
-| 586.5474      | 6.0   | 2928  | 417.2820        | 0.3674 |
-| 533.4568      | 7.0   | 3416  | 398.9988        | 0.3179 |
-| 488.8762      | 8.0   | 3904  | 369.4180        | 0.3068 |
-| 444.0211      | 9.0   | 4392  | 301.7917        | 0.2615 |
-| 413.0845      | 10.0  | 4880  | 251.3396        | 0.2400 |
-| 372.2671      | 11.0  | 5368  | 249.1012        | 0.2238 |
-| 347.6574      | 12.0  | 5856  | 230.7993        | 0.1970 |
-| 314.716       | 13.0  | 6344  | 217.9398        | 0.1959 |
-| 298.8911      | 14.0  | 6832  | 189.8561        | 0.1857 |
-| 283.848       | 15.0  | 7320  | 191.2605        | 0.1741 |
-| 258.3081      | 16.0  | 7808  | 143.3509        | 0.1580 |
-| 243.6687      | 17.0  | 8296  | 145.5848        | 0.1499 |
-| 233.2926      | 18.0  | 8784  | 140.6835        | 0.1495 |
-| 211.4206      | 19.0  | 9272  | 124.2010        | 0.1386 |
-| 208.7865      | 20.0  | 9760  | 118.0089        | 0.1269 |
-| 195.4273      | 21.0  | 10248 | 117.8243        | 0.1262 |
-| 184.6244      | 22.0  | 10736 | 97.7215         | 0.1164 |
-| 171.8441      | 23.0  | 11224 | 111.4605        | 0.1131 |
-| 163.1848      | 24.0  | 11712 | 89.1710         | 0.1134 |
-| 153.9752      | 25.0  | 12200 | 87.3499         | 0.1047 |
-| 147.2633      | 26.0  | 12688 | 87.4700         | 0.1082 |
-| 142.8953      | 27.0  | 13176 | 83.6597         | 0.1020 |
-| 136.2411      | 28.0  | 13664 | 82.2492         | 0.0981 |
-| 125.4659      | 29.0  | 14152 | 80.2814         | 0.0996 |
-| 123.5863      | 30.0  | 14640 | 72.3761         | 0.0878 |
-| 123.4564      | 31.0  | 15128 | 74.1428         | 0.0898 |
-| 119.1795      | 32.0  | 15616 | 60.4706         | 0.0805 |
-| 106.3762      | 33.0  | 16104 | 70.6227         | 0.0834 |
-| 108.1521      | 34.0  | 16592 | 59.9063         | 0.0785 |
-| 102.576       | 35.0  | 17080 | 56.8914         | 0.0781 |
-| 94.8957       | 36.0  | 17568 | 58.9398         | 0.0785 |
-| 96.225        | 37.0  | 18056 | 55.8423         | 0.0777 |
-| 91.3152       | 38.0  | 18544 | 55.6489         | 0.0747 |
-| 94.8994       | 39.0  | 19032 | 55.0808         | 0.0701 |
-| 86.3052       | 40.0  | 19520 | 51.2320         | 0.0716 |
-| 81.8472       | 41.0  | 20008 | 47.2280         | 0.0641 |
-| 84.5362       | 42.0  | 20496 | 48.6431         | 0.0654 |
-| 80.2845       | 43.0  | 20984 | 44.2606         | 0.0663 |
-| 79.6424       | 44.0  | 21472 | 46.5519         | 0.0612 |
-| 78.9052       | 45.0  | 21960 | 47.1750         | 0.0654 |
-| 75.1781       | 46.0  | 22448 | 41.0039         | 0.0630 |
-| 66.398        | 47.0  | 22936 | 41.1136         | 0.0599 |
-| 68.9468       | 48.0  | 23424 | 39.4498         | 0.0577 |
-| 69.0842       | 49.0  | 23912 | 39.5141         | 0.0590 |
-| 63.1563       | 50.0  | 24400 | 38.1891         | 0.0572 |
-| 66.0264       | 51.0  | 24888 | 36.2524         | 0.0606 |
-| 64.2084       | 52.0  | 25376 | 39.5151         | 0.0579 |
-| 63.0642       | 53.0  | 25864 | 36.7211         | 0.0579 |
-| 61.9061       | 54.0  | 26352 | 37.9883         | 0.0564 |
-| 60.9176       | 55.0  | 26840 | 35.0138         | 0.0528 |
-| 56.4366       | 56.0  | 27328 | 33.8095         | 0.0519 |
-| 60.1974       | 57.0  | 27816 | 32.5853         | 0.0492 |
-| 57.5505       | 58.0  | 28304 | 34.2817         | 0.0512 |
-| 58.9594       | 59.0  | 28792 | 32.7452         | 0.0519 |
-| 58.9188       | 60.0  | 29280 | 32.5406         | 0.0515 |
 ### Framework versions

 This model is a fine-tuned version of [facebook/wav2vec2-large-960h](https://huggingface.co/facebook/wav2vec2-large-960h) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 22.0317
+- Wer: 0.0531
 ## Model description
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 60
 - mixed_precision_training: Native AMP
 | Training Loss | Epoch | Step  | Validation Loss | Wer    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|
+| 898.4883      | 1.0   | 505   | 613.9966        | 0.5030 |
+| 700.9432      | 2.0   | 1010  | 474.9732        | 0.4287 |
+| 616.9108      | 3.0   | 1515  | 412.2095        | 0.3757 |
+| 546.7158      | 4.0   | 2020  | 376.4230        | 0.3477 |
+| 495.3992      | 5.0   | 2525  | 327.5403        | 0.3052 |
+| 457.4469      | 6.0   | 3030  | 277.4165        | 0.2692 |
+| 419.2608      | 7.0   | 3535  | 264.2311        | 0.2557 |
+| 387.4688      | 8.0   | 4040  | 260.7827        | 0.2309 |
+| 358.4347      | 9.0   | 4545  | 213.9615        | 0.2112 |
+| 334.2494      | 10.0  | 5050  | 198.8723        | 0.1903 |
+| 309.9395      | 11.0  | 5555  | 164.4527        | 0.1853 |
+| 288.1617      | 12.0  | 6060  | 164.5457        | 0.1783 |
+| 265.1981      | 13.0  | 6565  | 151.1678        | 0.1663 |
+| 247.7314      | 14.0  | 7070  | 142.4500        | 0.1665 |
+| 234.6288      | 15.0  | 7575  | 119.6140        | 0.1476 |
+| 217.8525      | 16.0  | 8080  | 118.9178        | 0.1399 |
+| 212.3975      | 17.0  | 8585  | 109.2142        | 0.1278 |
+| 197.9598      | 18.0  | 9090  | 98.2246         | 0.1245 |
+| 181.3615      | 19.0  | 9595  | 98.2521         | 0.1250 |
+| 177.8549      | 20.0  | 10100 | 83.1861         | 0.1130 |
+| 170.1361      | 21.0  | 10605 | 83.6687         | 0.1139 |
+| 152.4907      | 22.0  | 11110 | 72.1740         | 0.0974 |
+| 149.9199      | 23.0  | 11615 | 76.4454         | 0.0990 |
+| 146.3055      | 24.0  | 12120 | 66.7212         | 0.0949 |
+| 140.3444      | 25.0  | 12625 | 65.7427         | 0.0927 |
+| 131.9466      | 26.0  | 13130 | 62.4010         | 0.0875 |
+| 131.0567      | 27.0  | 13635 | 63.4794         | 0.0921 |
+| 120.657       | 28.0  | 14140 | 58.2065         | 0.0824 |
+| 118.117       | 29.0  | 14645 | 57.8397         | 0.0762 |
+| 112.2041      | 30.0  | 15150 | 48.3423         | 0.0791 |
+| 112.5141      | 31.0  | 15655 | 51.5712         | 0.0825 |
+| 103.9626      | 32.0  | 16160 | 42.7415         | 0.0661 |
+| 100.5436      | 33.0  | 16665 | 45.6458         | 0.0704 |
+| 101.6996      | 34.0  | 17170 | 41.2959         | 0.0647 |
+| 94.8516       | 35.0  | 17675 | 41.7417         | 0.0694 |
+| 96.989        | 36.0  | 18180 | 41.1608         | 0.0647 |
+| 92.9812       | 37.0  | 18685 | 44.2804         | 0.0738 |
+| 88.2919       | 38.0  | 19190 | 41.8735         | 0.0654 |
+| 84.4574       | 39.0  | 19695 | 41.3105         | 0.0615 |
+| 82.7767       | 40.0  | 20200 | 39.5144         | 0.0651 |
+| 80.9119       | 41.0  | 20705 | 31.5262         | 0.0545 |
+| 80.6782       | 42.0  | 21210 | 34.7946         | 0.0603 |
+| 76.5013       | 43.0  | 21715 | 31.3224         | 0.0594 |
+| 76.2344       | 44.0  | 22220 | 35.6723         | 0.0625 |
+| 76.0117       | 45.0  | 22725 | 32.7431         | 0.0688 |
+| 75.4117       | 46.0  | 23230 | 34.8090         | 0.0617 |
+| 74.5649       | 47.0  | 23735 | 35.5215         | 0.0726 |
+| 70.9009       | 48.0  | 24240 | 30.4729         | 0.0654 |
+| 70.0265       | 49.0  | 24745 | 34.5584         | 0.0719 |
+| 70.4782       | 50.0  | 25250 | 38.5341         | 0.0699 |
+| 66.4355       | 51.0  | 25755 | 31.3699         | 0.0700 |
+| 68.6737       | 52.0  | 26260 | 37.2897         | 0.0695 |
+| 64.2738       | 53.0  | 26765 | 33.8824         | 0.0699 |
+| 62.5659       | 54.0  | 27270 | 29.2762         | 0.0632 |
+| 62.469        | 55.0  | 27775 | 32.5962         | 0.0692 |
+| 60.5259       | 56.0  | 28280 | 28.6182         | 0.0656 |
+| 61.5349       | 57.0  | 28785 | 27.0813         | 0.0617 |
+| 59.6488       | 58.0  | 29290 | 23.4508         | 0.0565 |
+| 59.56         | 59.0  | 29795 | 29.5856         | 0.0575 |
+| 58.864        | 60.0  | 30300 | 22.0317         | 0.0531 |
 ### Framework versions

config.json CHANGED Viewed

@@ -9,7 +9,7 @@
   "architectures": [
     "Wav2Vec2ForCTC"
   ],
-  "attention_dropout": 0.1,
   "bos_token_id": 1,
   "classifier_proj_size": 256,
   "codevector_dim": 256,
@@ -50,11 +50,11 @@
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "group",
-  "feat_proj_dropout": 0.15,
   "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.1,
   "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,

   "architectures": [
     "Wav2Vec2ForCTC"
   ],
+  "attention_dropout": 0.15,
   "bos_token_id": 1,
   "classifier_proj_size": 256,
   "codevector_dim": 256,
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.2,
   "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.15,
   "hidden_act": "gelu",
+  "hidden_dropout": 0.15,
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2697b097013f682f8cd1e0f08264f66eca8babc158c67656d80e4295dbb0f059
 size 1261897368

 version https://git-lfs.github.com/spec/v1
+oid sha256:e186bfc7b9a89f2b578b81e13de26edaaf81350f8208394fedc55303ef463591
 size 1261897368

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c3933599f5e4a5a9973599931182d82005e10cb49b72302ce0b90417f54bbfe1
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ece9d55fd867ab888f57a748a5372a385c13395916b233f23479cc1fc0bc414
 size 5240