Defalt-404
/

GPT-6B_Tuned_small_pile

Text Generation

Model card Files Files and versions

Defalt-404 commited on May 8, 2023

Commit

38a656e

·

1 Parent(s): 5047984

Update README.md

Files changed (1) hide show

README.md +26 -13

README.md CHANGED Viewed

@@ -19,19 +19,32 @@ GPT-6B_Tuned_small_pile is a GPT-j-6B model trained on 0.1 million example of pi
 n_embd: 4096, n_layer: 28, n_positions: 2048
 Tuning Parameters:
-  val_split_percent: 20,
-  momentum: 0.9
-  train_batch_size (eff) : 32
-  train_micro_batch: 16
-  gradient_accumulation_steps: 2
-  gradient_clipping: 0.5
-  learning_rate: 0.00001
-  weight_decay: 0.01
-  lr_schedular: cosine
-  lr_warmup_steps: 1000
-  lr_decay: 0.1
-  lr_decay_step: 2000
-  mixed_precision: bf16

 n_embd: 4096, n_layer: 28, n_positions: 2048
 Tuning Parameters:
+    val_split_percent: 20,
+    momentum: 0.9
+    train_batch_size (eff) : 32
+    train_micro_batch: 16
+    gradient_accumulation_steps: 2
+    gradient_clipping: 0.5
+    learning_rate: 0.00001
+    weight_decay: 0.01
+    lr_schedular: cosine
+    lr_warmup_steps: 1000
+    lr_decay: 0.1
+    lr_decay_step: 2000
+    mixed_precision: bf16