Upload 13 files

Files changed (12) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+source.spm filter=lfs diff=lfs merge=lfs -text
+target.spm filter=lfs diff=lfs merge=lfs -text

all_results.json CHANGED Viewed

@@ -1,11 +1,16 @@
 {
-    "epoch": 3.0,
-    "num_input_tokens_seen": 67927868,
-    "total_flos": 1.7989403580039168e+16,
-    "train_loss": 1.1922986107342055,
-    "train_runtime": 2155.3414,
-    "train_samples": 310916,
-    "train_samples_per_second": 432.761,
-    "train_steps_per_second": 54.096,
-    "train_tokens_per_second": 31520.605
 }

 {
+    "epoch": 10.0,
+    "eval_loss": 1.961527705192566,
+    "eval_runtime": 77.3959,
+    "eval_samples": 83311,
+    "eval_samples_per_second": 1076.426,
+    "eval_steps_per_second": 134.555,
+    "num_input_tokens_seen": 225160303,
+    "total_flos": 5.962942279994573e+16,
+    "train_loss": 1.8857571468166456,
+    "train_runtime": 16282.8843,
+    "train_samples": 333243,
+    "train_samples_per_second": 204.658,
+    "train_steps_per_second": 25.583,
+    "train_tokens_per_second": 13822.702
 }

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "Helsinki-NLP/opus-mt-en-zh",
   "activation_dropout": 0.0,
   "activation_function": "swish",
   "add_bias_logits": false,
@@ -8,11 +7,6 @@
     "MarianMTModel"
   ],
   "attention_dropout": 0.0,
-  "bad_words_ids": [
-    [
-      65000
-    ]
-  ],
   "bos_token_id": 0,
   "classif_dropout": 0.0,
   "classifier_dropout": 0.0,
@@ -46,19 +40,19 @@
     "LABEL_1": 1,
     "LABEL_2": 2
   },
-  "max_length": 512,
   "max_position_embeddings": 512,
   "model_type": "marian",
   "normalize_before": false,
   "normalize_embedding": false,
-  "num_beams": 4,
   "num_hidden_layers": 6,
   "pad_token_id": 65000,
   "scale_embedding": true,
   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.43.3",
   "use_cache": true,
   "vocab_size": 65001
 }

 {
   "activation_dropout": 0.0,
   "activation_function": "swish",
   "add_bias_logits": false,
     "MarianMTModel"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 0,
   "classif_dropout": 0.0,
   "classifier_dropout": 0.0,
     "LABEL_1": 1,
     "LABEL_2": 2
   },
+  "max_length": null,
   "max_position_embeddings": 512,
   "model_type": "marian",
   "normalize_before": false,
   "normalize_embedding": false,
+  "num_beams": null,
   "num_hidden_layers": 6,
   "pad_token_id": 65000,
   "scale_embedding": true,
   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.51.3",
   "use_cache": true,
   "vocab_size": 65001
 }

eval_results.json ADDED Viewed

+{
+    "epoch": 10.0,
+    "eval_loss": 1.961527705192566,
+    "eval_runtime": 77.3959,
+    "eval_samples": 83311,
+    "eval_samples_per_second": 1076.426,
+    "eval_steps_per_second": 134.555,
+    "num_input_tokens_seen": 225160303
+}

generation_config.json CHANGED Viewed

@@ -12,5 +12,5 @@
   "num_beams": 4,
   "pad_token_id": 65000,
   "renormalize_logits": true,
-  "transformers_version": "4.43.3"
 }

   "num_beams": 4,
   "pad_token_id": 65000,
   "renormalize_logits": true,
+  "transformers_version": "4.51.3"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2527b97d2fa376dbfe40f7b62f5adbf21e09020a8d156d2cc43e7773b2b565cd
 size 309965092

 version https://git-lfs.github.com/spec/v1
+oid sha256:aac5f96b0d1c2435c122ac11eef69a78fde5924dbd76351f1a233d6c0f28037c
 size 309965092

source.spm CHANGED Viewed

Binary files a/source.spm and b/source.spm differ

target.spm CHANGED Viewed

Binary files a/target.spm and b/target.spm differ

tokenizer_config.json CHANGED Viewed

@@ -25,8 +25,9 @@
       "special": true
     }
   },
-  "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "model_max_length": 512,
   "pad_token": "<pad>",
   "separate_vocabs": false,

       "special": true
     }
   },
+  "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
+  "extra_special_tokens": {},
   "model_max_length": 512,
   "pad_token": "<pad>",
   "separate_vocabs": false,

train_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-    "epoch": 3.0,
-    "num_input_tokens_seen": 67927868,
-    "total_flos": 1.7989403580039168e+16,
-    "train_loss": 1.1922986107342055,
-    "train_runtime": 2155.3414,
-    "train_samples": 310916,
-    "train_samples_per_second": 432.761,
-    "train_steps_per_second": 54.096,
-    "train_tokens_per_second": 31520.605
 }

 {
+    "epoch": 10.0,
+    "num_input_tokens_seen": 225160303,
+    "total_flos": 5.962942279994573e+16,
+    "train_loss": 1.8857571468166456,
+    "train_runtime": 16282.8843,
+    "train_samples": 333243,
+    "train_samples_per_second": 204.658,
+    "train_steps_per_second": 25.583,
+    "train_tokens_per_second": 13822.702
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c2ab7adeb91926a4ec4ef2638ee7aa6be062e73ea336464fe5971f4ecd328639
-size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:742b6e553683f5a8be3739142255defff5d894b12172be0396ab15afd216cd8a
+size 5496