V2 initial

Files changed (5) hide show

adapter_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "base_model_name_or_path": "decapoda-research/llama-7b-hf",
   "bias": "none",
   "fan_in_fan_out": false,
   "inference_mode": true,

 {
+  "base_model_name_or_path": "huggyllama/llama-7b",
   "bias": "none",
   "fan_in_fan_out": false,
   "inference_mode": true,

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1929a4ec5b10b9a4fb61f34d18882205b89df8270444a035a19e00ce3673e19f
 size 67201357

 version https://git-lfs.github.com/spec/v1
+oid sha256:49c13a07e164ad6b0bbb8afe3cbe14c1664d729bc63bcf0d00b9c2a6b2392d04
 size 67201357

special_tokens_map.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "bos_token": "<s>",
-  "eos_token": "</s>",
-  "pad_token": "<unk>",
-  "sep_token": "<s>",
-  "unk_token": "<unk>"
 }

 {
+    "bos_token": "<s>",
+    "eos_token": "</s>",
+    "pad_token": "<unk>",
+    "sep_token": "<s>",
+    "unk_token": "<unk>"
 }

tokenizer_config.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "bos_token": "<s>",
-  "clean_up_tokenization_spaces": false,
-  "eos_token": "</s>",
-  "model_max_length": 2048,
-  "padding_side": "left",
-  "special_tokens_map_file": "special_tokens_map.json",
-  "tokenizer_class": "LlamaTokenizer",
-  "unk_token": "<unk>"
 }

 {
+    "tokenizer_class": "LlamaTokenizer",
+    "model_max_length": 2048,
+    "padding_side": "left",
+    "bos_token": "<s>",
+    "eos_token": "</s>",
+    "unk_token": "<unk>",
+    "clean_up_tokenization_spaces": false,
+    "special_tokens_map_file": "special_tokens_map.json"
 }

training_config.json CHANGED Viewed

@@ -27,7 +27,7 @@
     "load_in_8bit": true,
     "only_target_loss": true,
     "mode": "chat",
-    "templates_path": "ru_saiga_template.json",
     "model_name": "models/llama-7b",
     "model_type": "causal",
     "max_tokens_count": 2000

     "load_in_8bit": true,
     "only_target_loss": true,
     "mode": "chat",
+    "templates_path": "internal_prompts/saiga_v2.json",
     "model_name": "models/llama-7b",
     "model_type": "causal",
     "max_tokens_count": 2000