End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,5 +1,6 @@
 ---
 library_name: transformers
 tags:
 - generated_from_trainer
 model-index:
@@ -12,9 +13,9 @@ should probably proofread and complete it, then remove this comment. -->
 # rut5-base-phonetic
-This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0289
 ## Model description
@@ -37,26 +38,22 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 3
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
-| 0.0513        | 0.3582 | 500  | 0.0429          |
-| 0.0436        | 0.7163 | 1000 | 0.0395          |
-| 0.0343        | 1.0745 | 1500 | 0.0354          |
-| 0.0253        | 1.4327 | 2000 | 0.0357          |
-| 0.0242        | 1.7908 | 2500 | 0.0330          |
-| 0.0194        | 2.1490 | 3000 | 0.0335          |
-| 0.033         | 2.5072 | 3500 | 0.0297          |
-| 0.032         | 2.8653 | 4000 | 0.0289          |
 ### Framework versions
-- Transformers 4.44.2
-- Pytorch 2.5.0+cu121
-- Tokenizers 0.19.1

 ---
 library_name: transformers
+base_model: NancyBlack/rut5-base-phonetic
 tags:
 - generated_from_trainer
 model-index:
 # rut5-base-phonetic
+This model is a fine-tuned version of [NancyBlack/rut5-base-phonetic](https://huggingface.co/NancyBlack/rut5-base-phonetic) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0362
 ## Model description
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 5
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
+| 0.0153        | 0.3582 | 500  | 0.0354          |
+| 0.0137        | 0.7163 | 1000 | 0.0358          |
+| 0.0115        | 1.0745 | 1500 | 0.0379          |
+| 0.0085        | 1.4327 | 2000 | 0.0362          |
 ### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.1+cu121
+- Tokenizers 0.20.3

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 2,
   "pad_token_id": 0,
-  "transformers_version": "4.44.2"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 2,
   "pad_token_id": 0,
+  "transformers_version": "4.46.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ebe9a78217da862063a0b4d56a6430f61c60b3e27229bfc84681ca86c68460f
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:29445d3a9fea0ca6de33f784794d253f2a97e8981a30f54167eca585b68ddf8c
 size 891644712

runs/Nov19_19-14-28_084bef439486/events.out.tfevents.1732043669.084bef439486.367.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:475b64a4e2581c851b4205669b70c6989439cd79faf2a350609de397bd124aa1
-size 8047

 version https://git-lfs.github.com/spec/v1
+oid sha256:3dc0b7fb4a75bfce7266221f30629430a572f1a972c386f77f87f1481d69a132
+size 8401