error577 commited on Apr 18, 2025

Commit

46658b4

verified ·

1 Parent(s): 6a06971

Training in progress, step 100

Browse files

Files changed (20) hide show

adapter_config.json +39 -0
adapter_model.safetensors +3 -0
added_tokens.json +5 -0
config.json +27 -0
runs/Apr18_21-22-13_0b8955eb08fd/events.out.tfevents.1745011362.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-28-16_0b8955eb08fd/events.out.tfevents.1745011725.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-32-39_0b8955eb08fd/events.out.tfevents.1745011990.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-34-08_0b8955eb08fd/events.out.tfevents.1745012077.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-36-20_0b8955eb08fd/events.out.tfevents.1745012190.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-38-14_0b8955eb08fd/events.out.tfevents.1745012304.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-40-39_0b8955eb08fd/events.out.tfevents.1745012448.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-42-27_0b8955eb08fd/events.out.tfevents.1745012557.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-46-24_0b8955eb08fd/events.out.tfevents.1745012813.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-53-27_0b8955eb08fd/events.out.tfevents.1745013236.0b8955eb08fd.101.0 +3 -0
runs/Apr18_21-59-40_0b8955eb08fd/events.out.tfevents.1745013610.0b8955eb08fd.101.0 +3 -0
special_tokens_map.json +35 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +73 -0
training_args.bin +3 -0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "berkeley-nest/Starling-LM-7B-alpha",
+  "bias": "none",
+  "corda_config": null,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_bias": false,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "k_proj",
+    "up_proj",
+    "gate_proj",
+    "q_proj",
+    "down_proj",
+    "o_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "trainable_token_indices": null,
+  "use_dora": false,
+  "use_rslora": true
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c8483f94645b8bf12d586ae196203b4ec6d46a3cfd8932dc27ae57563bb1993
+size 1195486552

added_tokens.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+  "<sep>": 32002,
+  "<|end_of_turn|>": 32000,
+  "<|pad_0|>": 32001
+}

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "MistralForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "eos_token_id": 32000,
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 8192,
+  "model_type": "mistral",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 10000.0,
+  "sliding_window": 4096,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.51.0",
+  "use_cache": false,
+  "vocab_size": 32003
+}

runs/Apr18_21-22-13_0b8955eb08fd/events.out.tfevents.1745011362.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6830226d621ed022600d56bfee76a07d431f7562d28788d411ead8b2614b9793
+size 9306

runs/Apr18_21-28-16_0b8955eb08fd/events.out.tfevents.1745011725.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:526ab58d94d95a54784bcc70924e5662a8148270f9e248b20fdaa867027b71ca
+size 9981

runs/Apr18_21-32-39_0b8955eb08fd/events.out.tfevents.1745011990.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a2176c3ee5de17e56185957ff0382184e9451c745d20a721624b20163b7b3a3
+size 7259

runs/Apr18_21-34-08_0b8955eb08fd/events.out.tfevents.1745012077.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6241c428678f23ac19f1d0e472d0349ee564d0e380082796657e5054712f5fd8
+size 7260

runs/Apr18_21-36-20_0b8955eb08fd/events.out.tfevents.1745012190.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:431b3835692746221d8a130faa3fe3c70bcca3c4bb2f3e0ed6d88d0d647d0c20
+size 7257

runs/Apr18_21-38-14_0b8955eb08fd/events.out.tfevents.1745012304.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f17cf8bb9d80119a14ebd3873dda4b981bd0787b36949113a5c1307a5c4e2ef1
+size 9285

runs/Apr18_21-40-39_0b8955eb08fd/events.out.tfevents.1745012448.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a092c0673591bd5e7dbf7d68caeb547356324148e62757fba09bbc112776f870
+size 7289

runs/Apr18_21-42-27_0b8955eb08fd/events.out.tfevents.1745012557.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2aee815c30214b085aaf83655c6de94776c993c9f16a87da991ee34448103296
+size 14720

runs/Apr18_21-46-24_0b8955eb08fd/events.out.tfevents.1745012813.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd81381fd65d2fac5fbf90d65c85dfc9eb91731db1fd4f943f368948c1afd8b2
+size 16751

runs/Apr18_21-53-27_0b8955eb08fd/events.out.tfevents.1745013236.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c756bacbf214362d581e939db0490782ad9b593ea4459261be3f47bd29b71aa4
+size 54608

runs/Apr18_21-59-40_0b8955eb08fd/events.out.tfevents.1745013610.0b8955eb08fd.101.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f446d027f086d8d12c4614a0fb6c6a749057621017d74a4df83357dfc8fc576
+size 74887

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "additional_special_tokens": [
+    "<|end_of_turn|>",
+    "<|pad_0|>"
+  ],
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|end_of_turn|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|end_of_turn|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": "<sep>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,73 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "add_prefix_space": null,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32000": {
+      "content": "<|end_of_turn|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32001": {
+      "content": "<|pad_0|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32002": {
+      "content": "<sep>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|end_of_turn|>",
+    "<|pad_0|>"
+  ],
+  "bos_token": "<s>",
+  "chat_template": "{{ bos_token }}{% for message in messages %}{{ 'GPT4 Correct ' + message['role'].title() + ': ' + message['content'] + '<|end_of_turn|>'}}{% endfor %}{% if add_generation_prompt %}{{ 'GPT4 Correct Assistant:' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|end_of_turn|>",
+  "extra_special_tokens": {},
+  "legacy": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|end_of_turn|>",
+  "sep_token": "<sep>",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a5d12d09b60268c013ceb752eb2c7528dc1800ca12cde2a72a3b95b45ac07d37
+size 8081