LLM360
/

AmberChat

@@ -81,6 +81,15 @@ python3 -m fastchat.serve.cli --model-path LLM360/AmberChat
 | Max Seq Length   | 2048        |
 | Vocab Size | 32000 |
 # Evaluation

 | Max Seq Length   | 2048        |
 | Vocab Size | 32000 |
+| Training Hyperparameter      | Value |
+| ----------- | ----------- |
+| learning_rate      | 2e-5       |
+| num_train_epochs  |  3        |
+| per_device_train_batch_size   | 2        |
+| gradient_accumulation_steps  | 16        |
+| warmup_ratio | 0.04      |
+| model_max_length | 2048     |
 # Evaluation