isek-ai
/

SDPrompt-RetNet-v2-beta

Text Generation

Model card Files Files and versions

p1atdev commited on Dec 16, 2023

Commit

fba69ac

·

1 Parent(s): d9acdef

Create README.md

Files changed (1) hide show

README.md +71 -0

README.md ADDED Viewed

	@@ -0,0 +1,71 @@

+---
+license: mit
+datasets:
+- isek-ai/danbooru-tags-2016-2023
+language:
+- en
+library_name: transformers
+---
+# SDPrompt-RetNet-v2
+This model is a pretrained RetNet model trained from scratch using https://github.com/syncdoth/RetNet.
+It achieves the following results on the evaluation set:
+- Loss: 0.5923
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0001
+- train_batch_size: 32
+- eval_batch_size: 8
+- seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 64
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 500
+- num_epochs: 1
+### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 0.975         | 0.07  | 500  | 1.0005          |
+| 0.7549        | 0.13  | 1000 | 0.7604          |
+| 0.6923        | 0.2   | 1500 | 0.7090          |
+| 0.6753        | 0.26  | 2000 | 0.6778          |
+| 0.6591        | 0.33  | 2500 | 0.6568          |
+| 0.6337        | 0.39  | 3000 | 0.6429          |
+| 0.6288        | 0.46  | 3500 | 0.6319          |
+| 0.624         | 0.53  | 4000 | 0.6218          |
+| 0.62          | 0.59  | 4500 | 0.6172          |
+| 0.603         | 0.66  | 5000 | 0.6090          |
+| 0.5931        | 0.72  | 5500 | 0.6032          |
+| 0.5957        | 0.79  | 6000 | 0.5986          |
+| 0.5972        | 0.85  | 6500 | 0.5948          |
+| 0.5928        | 0.92  | 7000 | 0.5926          |
+| 0.5904        | 0.98  | 7500 | 0.5923          |
+### Framework versions
+- Transformers 4.36.1
+- Pytorch 2.1.2+cu121
+- Datasets 2.15.0
+- Tokenizers 0.15.0