add model

Files changed (11) hide show

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ model_index:
     dataset:
       name: oscar
       type: oscar
-      args: unshuffled_deduplicated_eo
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -39,7 +39,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
@@ -54,7 +54,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.9.0.dev0
 - Pytorch 1.8.1+cu111
-- Datasets 1.10.0
 - Tokenizers 0.10.3

     dataset:
       name: oscar
       type: oscar
+      args: unshuffled_original_eo
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
 ### Framework versions
+- Transformers 4.10.0.dev0
 - Pytorch 1.8.1+cu111
+- Datasets 1.10.3.dev0
 - Tokenizers 0.10.3

config.json CHANGED Viewed

@@ -4,6 +4,7 @@
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
   "eos_token_id": 2,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
@@ -19,8 +20,8 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.9.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,
-  "vocab_size": 52000
 }

   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
+  "classifier_dropout": null,
   "eos_token_id": 2,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.10.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,
+  "vocab_size": 12000
 }

merges.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3c807f81363ac4ff9d837b962d2cfce5996b9dda1954ba3c1cff64af0b84916
-size 334060082

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e6f078adc7b33e532883c54dc53ee965651b6682f8f5254f4394eeadef79b32
+size 211020082

runs/Jul26_11-51-33_brahms/1627314988.6503177/events.out.tfevents.1627314988.brahms.3059668.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:87005082cfb2701aaccb59c963fa802025acb40a37090c216bb14f814c1d155a
+size 4183

runs/Jul26_11-51-33_brahms/events.out.tfevents.1627314988.brahms.3059668.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ca719d2d5bdfa3ad093120ae68ea26b3bdaf38eb2c6f17f8c3be9cb228479d0
+size 7961

runs/Jul26_12-33-57_brahms/1627317243.9934251/events.out.tfevents.1627317243.brahms.3059668.3 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb40655d9d048f84ed463ba554f312c8d9d9b00f98e07b868320104ecd2316fa
+size 4183

runs/Jul26_12-33-57_brahms/events.out.tfevents.1627317243.brahms.3059668.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:47e54733e6aeabef6f8e4e303e2aa227eb2b48470c210eba1454b66d8a2b3f3d
+size 8042

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:58a4eb8baab968d5ba22542bc7671f464ad303343a2e96119bb7274e7f422553
 size 2607

 version https://git-lfs.github.com/spec/v1
+oid sha256:9a1b5f0af503374b81916d8aeaf9a450dbe6c2cd02ca8c9489eac1d920265b94
 size 2607

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff