yigagilbert/sunflower_language_ID

Browse files

Files changed (7) hide show

README.md +53 -52
config.json +2 -3
generation_config.json +1 -1
model.safetensors +1 -1
runs/Nov05_12-55-45_254b22cf8d87/events.out.tfevents.1762347355.254b22cf8d87.856.0 +3 -0
tokenizer_config.json +3 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -1,8 +1,9 @@
 ---
 license: apache-2.0
 tags:
 - generated_from_trainer
-base_model: google/t5-efficient-tiny
 datasets:
 - generator
 metrics:
@@ -11,8 +12,8 @@ model-index:
 - name: salt_language_ID
   results:
   - task:
-      type: text2text-generation
       name: Sequence-to-sequence Language Modeling
     dataset:
       name: generator
       type: generator
@@ -20,9 +21,9 @@ model-index:
       split: train
       args: default
     metrics:
-    - type: accuracy
-      value: 0.980510752688172
-      name: Accuracy
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +33,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/t5-efficient-tiny](https://huggingface.co/google/t5-efficient-tiny) on the generator dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0127
-- Accuracy: 0.9805
 ## Model description
@@ -56,7 +57,7 @@ The following hyperparameters were used during training:
 - train_batch_size: 64
 - eval_batch_size: 64
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 10
 - training_steps: 20000
@@ -65,51 +66,51 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss | Accuracy |
 |:-------------:|:-----:|:-----:|:---------------:|:--------:|
-| 0.5069        | 0.025 | 500   | 0.1145          | 0.8337   |
-| 0.0644        | 0.05  | 1000  | 0.0489          | 0.9170   |
-| 0.0511        | 0.075 | 1500  | 0.0605          | 0.9056   |
-| 0.0462        | 0.1   | 2000  | 0.0332          | 0.9432   |
-| 0.0411        | 0.125 | 2500  | 0.0358          | 0.9385   |
-| 0.0409        | 0.15  | 3000  | 0.0267          | 0.9509   |
-| 0.0365        | 0.175 | 3500  | 0.0244          | 0.9563   |
-| 0.0359        | 0.2   | 4000  | 0.0285          | 0.9536   |
-| 0.035         | 0.225 | 4500  | 0.0355          | 0.9388   |
-| 0.0321        | 0.25  | 5000  | 0.0264          | 0.9570   |
-| 0.0327        | 0.275 | 5500  | 0.0278          | 0.9513   |
-| 0.0313        | 0.3   | 6000  | 0.0217          | 0.9630   |
-| 0.0305        | 0.325 | 6500  | 0.0255          | 0.9556   |
-| 0.0285        | 0.35  | 7000  | 0.0187          | 0.9630   |
-| 0.0293        | 0.375 | 7500  | 0.0225          | 0.9620   |
-| 0.0264        | 0.4   | 8000  | 0.0228          | 0.9614   |
-| 0.0272        | 0.425 | 8500  | 0.0195          | 0.9664   |
-| 0.0268        | 0.45  | 9000  | 0.0178          | 0.9688   |
-| 0.0259        | 0.475 | 9500  | 0.0164          | 0.9677   |
-| 0.0256        | 0.5   | 10000 | 0.0167          | 0.9721   |
-| 0.0241        | 0.525 | 10500 | 0.0182          | 0.9647   |
-| 0.0235        | 0.55  | 11000 | 0.0212          | 0.9657   |
-| 0.0239        | 0.575 | 11500 | 0.0145          | 0.9735   |
-| 0.0239        | 0.6   | 12000 | 0.0173          | 0.9704   |
-| 0.0234        | 0.625 | 12500 | 0.0152          | 0.9768   |
-| 0.0229        | 0.65  | 13000 | 0.0181          | 0.9698   |
-| 0.023         | 0.675 | 13500 | 0.0154          | 0.9735   |
-| 0.0224        | 0.7   | 14000 | 0.0157          | 0.9708   |
-| 0.0221        | 0.725 | 14500 | 0.0155          | 0.9714   |
-| 0.0219        | 0.75  | 15000 | 0.0145          | 0.9755   |
-| 0.0213        | 0.775 | 15500 | 0.0159          | 0.9735   |
-| 0.0197        | 0.8   | 16000 | 0.0129          | 0.9751   |
-| 0.0206        | 0.825 | 16500 | 0.0154          | 0.9724   |
-| 0.02          | 0.85  | 17000 | 0.0140          | 0.9724   |
-| 0.0209        | 0.875 | 17500 | 0.0115          | 0.9772   |
-| 0.0191        | 0.9   | 18000 | 0.0129          | 0.9735   |
-| 0.0194        | 0.925 | 18500 | 0.0120          | 0.9765   |
-| 0.0191        | 0.95  | 19000 | 0.0133          | 0.9741   |
-| 0.0183        | 0.975 | 19500 | 0.0166          | 0.9731   |
-| 0.0207        | 1.0   | 20000 | 0.0127          | 0.9805   |
 ### Framework versions
-- Transformers 4.40.2
-- Pytorch 2.2.1+cu121
-- Datasets 2.19.1
-- Tokenizers 0.19.1

 ---
+library_name: transformers
 license: apache-2.0
+base_model: google/t5-efficient-tiny
 tags:
 - generated_from_trainer
 datasets:
 - generator
 metrics:
 - name: salt_language_ID
   results:
   - task:
       name: Sequence-to-sequence Language Modeling
+      type: text2text-generation
     dataset:
       name: generator
       type: generator
       split: train
       args: default
     metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.608582394590625
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google/t5-efficient-tiny](https://huggingface.co/google/t5-efficient-tiny) on the generator dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4200
+- Accuracy: 0.6086
 ## Model description
 - train_batch_size: 64
 - eval_batch_size: 64
 - seed: 42
+- optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 10
 - training_steps: 20000
 | Training Loss | Epoch | Step  | Validation Loss | Accuracy |
 |:-------------:|:-----:|:-----:|:---------------:|:--------:|
+| 0.9948        | 0.025 | 500   | 0.7153          | 0.1757   |
+| 0.3269        | 0.05  | 1000  | 0.7217          | 0.2611   |
+| 0.2853        | 0.075 | 1500  | 0.9151          | 0.2412   |
+| 0.1823        | 0.1   | 2000  | 0.5561          | 0.3965   |
+| 0.1953        | 0.125 | 2500  | 0.5975          | 0.3824   |
+| 0.1831        | 0.15  | 3000  | 0.5670          | 0.4264   |
+| 0.141         | 0.175 | 3500  | 0.7885          | 0.3443   |
+| 0.1081        | 0.2   | 4000  | 0.8961          | 0.3111   |
+| 0.154         | 0.225 | 4500  | 0.7975          | 0.3491   |
+| 0.1306        | 0.25  | 5000  | 0.4824          | 0.5092   |
+| 0.1013        | 0.275 | 5500  | 0.4946          | 0.4613   |
+| 0.1083        | 0.3   | 6000  | 0.6959          | 0.4038   |
+| 0.1121        | 0.325 | 6500  | 0.6938          | 0.4004   |
+| 0.1168        | 0.35  | 7000  | 0.7787          | 0.3948   |
+| 0.1202        | 0.375 | 7500  | 0.5420          | 0.4975   |
+| 0.1169        | 0.4   | 8000  | 0.5099          | 0.5128   |
+| 0.1119        | 0.425 | 8500  | 0.5815          | 0.4582   |
+| 0.1258        | 0.45  | 9000  | 0.5103          | 0.5002   |
+| 0.0878        | 0.475 | 9500  | 0.5189          | 0.5089   |
+| 0.1032        | 0.5   | 10000 | 0.4365          | 0.5674   |
+| 0.0854        | 0.525 | 10500 | 0.5854          | 0.5176   |
+| 0.1028        | 0.55  | 11000 | 0.5167          | 0.5253   |
+| 0.0853        | 0.575 | 11500 | 0.4268          | 0.5922   |
+| 0.0716        | 0.6   | 12000 | 0.5486          | 0.5204   |
+| 0.0771        | 0.625 | 12500 | 0.4643          | 0.5532   |
+| 0.0613        | 0.65  | 13000 | 0.5525          | 0.5050   |
+| 0.0819        | 0.675 | 13500 | 0.4500          | 0.5953   |
+| 0.0785        | 0.7   | 14000 | 0.5016          | 0.5245   |
+| 0.079         | 0.725 | 14500 | 0.4453          | 0.5789   |
+| 0.0749        | 0.75  | 15000 | 0.4218          | 0.5866   |
+| 0.0749        | 0.775 | 15500 | 0.4208          | 0.6114   |
+| 0.0655        | 0.8   | 16000 | 0.4203          | 0.6133   |
+| 0.077         | 0.825 | 16500 | 0.4446          | 0.5891   |
+| 0.0516        | 0.85  | 17000 | 0.4239          | 0.5985   |
+| 0.0555        | 0.875 | 17500 | 0.4040          | 0.6237   |
+| 0.0622        | 0.9   | 18000 | 0.4575          | 0.5978   |
+| 0.0752        | 0.925 | 18500 | 0.4257          | 0.5959   |
+| 0.0555        | 0.95  | 19000 | 0.4462          | 0.5997   |
+| 0.0646        | 0.975 | 19500 | 0.4225          | 0.6124   |
+| 0.0676        | 1.0   | 20000 | 0.4200          | 0.6086   |
 ### Framework versions
+- Transformers 4.57.1
+- Pytorch 2.8.0+cu126
+- Datasets 4.4.0
+- Tokenizers 0.22.1

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "google/t5-efficient-tiny",
   "architectures": [
     "T5ForConditionalGeneration"
   ],
@@ -10,6 +9,7 @@
   "decoder_start_token_id": 0,
   "dense_act_fn": "relu",
   "dropout_rate": 0.1,
   "eos_token_id": 1,
   "feed_forward_proj": "relu",
   "initializer_factor": 1.0,
@@ -24,8 +24,7 @@
   "pad_token_id": 0,
   "relative_attention_max_distance": 128,
   "relative_attention_num_buckets": 32,
-  "torch_dtype": "float32",
-  "transformers_version": "4.40.2",
   "use_cache": true,
   "vocab_size": 32128
 }

 {
   "architectures": [
     "T5ForConditionalGeneration"
   ],
   "decoder_start_token_id": 0,
   "dense_act_fn": "relu",
   "dropout_rate": 0.1,
+  "dtype": "float32",
   "eos_token_id": 1,
   "feed_forward_proj": "relu",
   "initializer_factor": 1.0,
   "pad_token_id": 0,
   "relative_attention_max_distance": 128,
   "relative_attention_num_buckets": 32,
+  "transformers_version": "4.57.1",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.40.2"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.57.1"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:da8e3f5353a304aaa3427bcc1a832edd023f325f520fd821b629705c47e723f4
 size 62293080

 version https://git-lfs.github.com/spec/v1
+oid sha256:a7e90d49e4c7e9e993800a6427094c6e3694fed5d41649c66ecec07975899ec3
 size 62293080

runs/Nov05_12-55-45_254b22cf8d87/events.out.tfevents.1762347355.254b22cf8d87.856.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:efad07ff5857d7df922dce0628e8b2e3b814d9d9328159d3bb608f7a8ab720fe
+size 5316

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",
@@ -927,9 +928,10 @@
     "<extra_id_98>",
     "<extra_id_99>"
   ],
-  "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "extra_ids": 100,
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sp_model_kwargs": {},

 {
+  "add_prefix_space": null,
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",
     "<extra_id_98>",
     "<extra_id_99>"
   ],
+  "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
   "extra_ids": 100,
+  "extra_special_tokens": {},
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sp_model_kwargs": {},

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbf65a2117c3857ff03b0cfa6555fb01aed1b57452bc916c71367155aa1fd6a5
-size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e33217ca5619b1e381fcb22e86ca10b8e90d8327b18bd3187e12c0987a58d91
+size 6033