jarod0411
/

stage1

@@ -1,5 +1,4 @@
 ---
-license: mit
 base_model: jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1
 tags:
 - generated_from_trainer
@@ -15,10 +14,10 @@ should probably proofread and complete it, then remove this comment. -->
 # stage1
-This model is a fine-tuned version of [jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1](https://huggingface.co/jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2469
-- Accuracy: 0.9158
 ## Model description
@@ -38,13 +37,13 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 1
 - distributed_type: multi-GPU
-- num_devices: 8
-- total_train_batch_size: 128
-- total_eval_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10.0
@@ -53,21 +52,21 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step   | Validation Loss | Accuracy |
 |:-------------:|:-----:|:------:|:---------------:|:--------:|
-| 0.3374        | 1.0   | 16956  | 0.2982          | 0.9016   |
-| 0.2955        | 2.0   | 33912  | 0.2682          | 0.9104   |
-| 0.2795        | 3.0   | 50868  | 0.2593          | 0.9126   |
-| 0.2713        | 4.0   | 67824  | 0.2549          | 0.9137   |
-| 0.2661        | 5.0   | 84780  | 0.2522          | 0.9144   |
-| 0.2626        | 6.0   | 101736 | 0.2501          | 0.9150   |
-| 0.2602        | 7.0   | 118692 | 0.2488          | 0.9153   |
-| 0.2585        | 8.0   | 135648 | 0.2478          | 0.9156   |
-| 0.2574        | 9.0   | 152604 | 0.2471          | 0.9158   |
-| 0.2569        | 10.0  | 169560 | 0.2469          | 0.9158   |
 ### Framework versions
-- Transformers 4.36.0.dev0
-- Pytorch 2.1.1+cu121
-- Datasets 2.15.0
-- Tokenizers 0.15.0

 ---
 base_model: jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1
 tags:
 - generated_from_trainer
 # stage1
+This model is a fine-tuned version of [jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1](https://huggingface.co/jarod0411/zinc10M_gpt2_SMILES_bpe_combined_step1) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3311
+- Accuracy: 0.8936
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 24
+- eval_batch_size: 24
 - seed: 1
 - distributed_type: multi-GPU
+- num_devices: 6
+- total_train_batch_size: 144
+- total_eval_batch_size: 144
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10.0
 | Training Loss | Epoch | Step   | Validation Loss | Accuracy |
 |:-------------:|:-----:|:------:|:---------------:|:--------:|
+| 0.375         | 1.0   | 23931  | 0.3615          | 0.8853   |
+| 0.3609        | 2.0   | 47862  | 0.3494          | 0.8887   |
+| 0.3533        | 3.0   | 71793  | 0.3432          | 0.8904   |
+| 0.3486        | 4.0   | 95724  | 0.3394          | 0.8914   |
+| 0.3456        | 5.0   | 119655 | 0.3367          | 0.8921   |
+| 0.3432        | 6.0   | 143586 | 0.3346          | 0.8927   |
+| 0.3412        | 7.0   | 167517 | 0.3333          | 0.8930   |
+| 0.3397        | 8.0   | 191448 | 0.3322          | 0.8933   |
+| 0.339         | 9.0   | 215379 | 0.3314          | 0.8935   |
+| 0.3383        | 10.0  | 239310 | 0.3311          | 0.8936   |
 ### Framework versions
+- Transformers 4.38.0.dev0
+- Pytorch 2.2.0+cu121
+- Datasets 2.17.0
+- Tokenizers 0.15.2

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.36.0.dev0"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.38.0.dev0"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:078d2870da4d63f1311470fa5e5fc2d5f983f85b110f8e4afd3886e16cfcc4be
 size 497774208

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c152ca75c2c4a2cc62abcdd39c8e9ddfc98d22cf20aa7e503c7285c1bc580c3
 size 497774208