KanWasTaken/EN-VI-Machine-Translation-RNN

Browse files

Files changed (3) hide show

README.md +9 -24
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7149
 ## Model description
@@ -34,37 +34,22 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 1024
-- eval_batch_size: 1024
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 20
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 7.829         | 1.0   | 131  | 5.6878          |
-| 4.0951        | 2.0   | 262  | 2.7482          |
-| 2.1201        | 3.0   | 393  | 1.5308          |
-| 1.3062        | 4.0   | 524  | 1.0420          |
-| 1.0218        | 5.0   | 655  | 0.8985          |
-| 0.927         | 6.0   | 786  | 0.8373          |
-| 0.8817        | 7.0   | 917  | 0.8036          |
-| 0.8538        | 8.0   | 1048 | 0.7808          |
-| 0.8348        | 9.0   | 1179 | 0.7639          |
-| 0.8204        | 10.0  | 1310 | 0.7518          |
-| 0.8099        | 11.0  | 1441 | 0.7427          |
-| 0.802         | 12.0  | 1572 | 0.7357          |
-| 0.7964        | 13.0  | 1703 | 0.7302          |
-| 0.7916        | 14.0  | 1834 | 0.7258          |
-| 0.7871        | 15.0  | 1965 | 0.7223          |
-| 0.7839        | 16.0  | 2096 | 0.7196          |
-| 0.7814        | 17.0  | 2227 | 0.7175          |
-| 0.7801        | 18.0  | 2358 | 0.7161          |
-| 0.7788        | 19.0  | 2489 | 0.7152          |
-| 0.7778        | 20.0  | 2620 | 0.7149          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7180
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 256
+- eval_batch_size: 256
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 4.3656        | 1.0   | 521  | 1.1849          |
+| 0.9343        | 2.0   | 1042 | 0.7810          |
+| 0.8145        | 3.0   | 1563 | 0.7373          |
+| 0.7882        | 4.0   | 2084 | 0.7221          |
+| 0.7793        | 5.0   | 2605 | 0.7180          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fea7520dd444bfd19df0a9f12fb27fcc2196b3a1adf61406c110ba8e51c48a50
 size 23893728

 version https://git-lfs.github.com/spec/v1
+oid sha256:207e2d19b486e542bbad23b7de68044bc99c39e0bfdceb56a14d1215fbda23d1
 size 23893728

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06f14e643cc297fdb3db7205c5a946d27a4acbaaf4306e2607a8e8d71d972e6c
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:42e087fb74a345090ebf9392a9de6e9411aebed501d9db7061affde8b69548d6
 size 5240