Model save

Files changed (9) hide show

README.md CHANGED Viewed

@@ -34,15 +34,21 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 200
-- training_steps: 3000
 - mixed_precision_training: Native AMP
 ### Framework versions
 - Transformers 4.48.0

 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 100
+- num_epochs: 3
 - mixed_precision_training: Native AMP
+### Training results
 ### Framework versions
 - Transformers 4.48.0

added_tokens.json CHANGED Viewed

@@ -1568,7 +1568,6 @@
   "<|notimestamps|>": 50363,
   "<|no|>": 50288,
   "<|oc|>": 50328,
-  "<|pad|>": 51865,
   "<|pa|>": 50321,
   "<|pl|>": 50269,
   "<|ps|>": 50340,

   "<|notimestamps|>": 50363,
   "<|no|>": 50288,
   "<|oc|>": 50328,
   "<|pa|>": 50321,
   "<|pl|>": 50269,
   "<|ps|>": 50340,

config.json CHANGED Viewed

@@ -51,11 +51,11 @@
   "model_type": "whisper",
   "num_hidden_layers": 12,
   "num_mel_bins": 80,
-  "pad_token_id": 51865,
   "scale_embedding": false,
   "torch_dtype": "float32",
   "transformers_version": "4.48.0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
-  "vocab_size": 51866
 }

   "model_type": "whisper",
   "num_hidden_layers": 12,
   "num_mel_bins": 80,
+  "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
   "transformers_version": "4.48.0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
+  "vocab_size": 51865
 }

generation_config.json CHANGED Viewed

@@ -254,7 +254,6 @@
     50361,
     50362
   ],
-  "task": "transcribe",
   "task_to_id": {
     "transcribe": 50359,
     "translate": 50358

     50361,
     50362
   ],
   "task_to_id": {
     "transcribe": 50359,
     "translate": 50358

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba1e551713187f7efec2dad768483ea9f6019a48fb363a7a051b6145ff1bc7ee
-size 966998152

 version https://git-lfs.github.com/spec/v1
+oid sha256:fde5bfd14e47cb11b8ce09d313774b4b241ff7957b2219482963e1297a21f7a0
+size 966995080

runs/Jul14_21-10-34_04cc561c7ab8/events.out.tfevents.1752527463.04cc561c7ab8.4457.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:14f2ed7f54063117980a0d739f4f35aa2a4fde7918bd98c3bd0eca988c041091
+size 7182

special_tokens_map.json CHANGED Viewed

@@ -122,7 +122,13 @@
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": "<|pad|>",
   "unk_token": {
     "content": "<|endoftext|>",
     "lstrip": false,

     "rstrip": false,
     "single_word": false
   },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
   "unk_token": {
     "content": "<|endoftext|>",
     "lstrip": false,

tokenizer_config.json CHANGED Viewed

@@ -12865,14 +12865,6 @@
       "rstrip": false,
       "single_word": false,
       "special": false
-    },
-    "51865": {
-      "content": "<|pad|>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
     }
   },
   "additional_special_tokens": [
@@ -12990,7 +12982,7 @@
   "errors": "replace",
   "extra_special_tokens": {},
   "model_max_length": 1024,
-  "pad_token": "<|pad|>",
   "processor_class": "WhisperProcessor",
   "return_attention_mask": false,
   "tokenizer_class": "WhisperTokenizer",

       "rstrip": false,
       "single_word": false,
       "special": false
     }
   },
   "additional_special_tokens": [
   "errors": "replace",
   "extra_special_tokens": {},
   "model_max_length": 1024,
+  "pad_token": "<|endoftext|>",
   "processor_class": "WhisperProcessor",
   "return_attention_mask": false,
   "tokenizer_class": "WhisperTokenizer",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8148987a2cf6713a63cac2832a072d7cefae38eb77b4c20f4ac8017d7087afb7
-size 5560

 version https://git-lfs.github.com/spec/v1
+oid sha256:64c82bef36d340d33d9b45056109e24f90c214102456d2ab85a6b2a386a319a7
+size 5496