End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -4,8 +4,6 @@ license: apache-2.0
 base_model: openai/whisper-base
 tags:
 - generated_from_trainer
-metrics:
-- wer
 model-index:
 - name: whisper-base-v4
   results: []
@@ -18,8 +16,13 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [openai/whisper-base](https://huggingface.co/openai/whisper-base) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.1814
-- Wer: 43.8709
 ## Model description
@@ -38,29 +41,19 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0002
 - train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
 - training_steps: 2000
 - mixed_precision_training: Native AMP
-### Training results
-| Training Loss | Epoch | Step | Validation Loss | Wer     |
-|:-------------:|:-----:|:----:|:---------------:|:-------:|
-| 0.4275        | 10.0  | 500  | 0.8866          | 50.2836 |
-| 0.069         | 20.0  | 1000 | 1.0774          | 47.0699 |
-| 0.0134        | 30.0  | 1500 | 1.1680          | 44.5689 |
-| 0.002         | 40.0  | 2000 | 1.1814          | 43.8709 |
 ### Framework versions
-- Transformers 4.45.2
 - Pytorch 2.5.0+cu121
-- Datasets 3.0.2
-- Tokenizers 0.20.1

 base_model: openai/whisper-base
 tags:
 - generated_from_trainer
 model-index:
 - name: whisper-base-v4
   results: []
 This model is a fine-tuned version of [openai/whisper-base](https://huggingface.co/openai/whisper-base) on the None dataset.
 It achieves the following results on the evaluation set:
+- eval_loss: 2.6242
+- eval_wer: 90.4248
+- eval_runtime: 99.7998
+- eval_samples_per_second: 2.004
+- eval_steps_per_second: 0.251
+- epoch: 20.0
+- step: 1000
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0001
 - train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
 - training_steps: 2000
 - mixed_precision_training: Native AMP
 ### Framework versions
+- Transformers 4.46.2
 - Pytorch 2.5.0+cu121
+- Datasets 3.1.0
+- Tokenizers 0.20.3

generation_config.json CHANGED Viewed

@@ -1,36 +1,44 @@
 {
   "alignment_heads": [
     [
-      3,
-      1
     ],
     [
-      4,
-      2
     ],
     [
-      4,
-      3
     ],
     [
-      4,
       7
     ],
     [
-      5,
-      1
     ],
     [
-      5,
-      2
     ],
     [
-      5,
-      4
     ],
     [
-      5,
-      6
     ]
   ],
   "begin_suppress_tokens": [
@@ -39,8 +47,17 @@
   ],
   "bos_token_id": 50257,
   "decoder_start_token_id": 50258,
-  "dropout": 0.1,
   "eos_token_id": 50257,
   "is_multilingual": true,
   "lang_to_id": {
     "<|af|>": 50327,
@@ -244,5 +261,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.45.2"
 }

 {
   "alignment_heads": [
     [
+      5,
+      3
     ],
     [
+      5,
+      9
     ],
     [
+      8,
+      0
+    ],
+    [
+      8,
+      4
     ],
     [
+      8,
       7
     ],
     [
+      8,
+      8
     ],
     [
+      9,
+      0
     ],
     [
+      9,
+      7
     ],
     [
+      9,
+      9
+    ],
+    [
+      10,
+      5
     ]
   ],
   "begin_suppress_tokens": [
   ],
   "bos_token_id": 50257,
   "decoder_start_token_id": 50258,
   "eos_token_id": 50257,
+  "forced_decoder_ids": [
+    [
+      1,
+      null
+    ],
+    [
+      2,
+      50359
+    ]
+  ],
   "is_multilingual": true,
   "lang_to_id": {
     "<|af|>": 50327,
     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.46.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38f3ca61eaf6db16f6996e30b8d2af7af4c00cfe5e55a8fd2bce8deb2c551589
 size 437763864

 version https://git-lfs.github.com/spec/v1
+oid sha256:a316a06183fc77f742287a5ef65925c935d70fbf40bee841991c389eb21e5c58
 size 437763864

runs/Nov07_03-43-44_9817841b8cc1/events.out.tfevents.1730951035.9817841b8cc1.753.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74bf171e804ba8edbcc67b2c15ef06a782b2c78468d3f38c690516e2f321bf6f
-size 15091

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea1f4cff0ba2935bfccd063e9edb302bcae18c169481ad432a9e787b0e23b0c1
+size 15935