ManthanKulakarni
/

LLaMa-13b_Text2JQLBuilder

Model card Files Files and versions

ManthanKulakarni commited on Jun 24, 2023

Commit

22103f1

·

1 Parent(s): 65b1e66

Upload 2 files

Files changed (2) hide show

training_log.json +10 -0
training_parameters.json +26 -0

training_log.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "train_runtime": 665.8011,
+  "train_samples_per_second": 1.494,
+  "train_steps_per_second": 0.011,
+  "total_flos": 1.772375330783232e+16,
+  "train_loss": 2.5272955894470215,
+  "epoch": 0.9,
+  "loss": 2.6658,
+  "learning_rate": 0.00021428571428571427
+}

training_parameters.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "lora_name": "jql_llama_13b",
+  "always_override": true,
+  "save_steps": 0.0,
+  "micro_batch_size": 8,
+  "batch_size": 128,
+  "epochs": 1.0,
+  "learning_rate": "3e-4",
+  "lr_scheduler_type": "linear",
+  "lora_rank": 32,
+  "lora_alpha": 64,
+  "lora_dropout": 0.05,
+  "cutoff_len": 256,
+  "dataset": "jql_chat_gpt_v2",
+  "eval_dataset": "None",
+  "format": "jql-format",
+  "eval_steps": 100.0,
+  "raw_text_file": "None",
+  "overlap_len": 128,
+  "newline_favor_len": 128,
+  "higher_rank_limit": false,
+  "warmup_steps": 100.0,
+  "optimizer": "adamw_torch",
+  "hard_cut_string": "\\n\\n\\n",
+  "train_only_after": ""
+}