ricemonster commited on Apr 25, 2025

Commit

b3695af

verified ·

1 Parent(s): e320857

Upload folder using huggingface_hub

Browse files

Files changed (30) hide show

._added_tokens.json +0 -0
._config.json +0 -0
._generation_config.json +0 -0
._merges.txt +0 -0
._model.safetensors +3 -0
._optimizer.pt +3 -0
._rng_state.pth +3 -0
._scaler.pt +3 -0
._scheduler.pt +3 -0
._special_tokens_map.json +0 -0
._tokenizer.json +0 -0
._tokenizer_config.json +0 -0
._trainer_state.json +0 -0
._training_args.bin +3 -0
._vocab.json +0 -0
added_tokens.json +4 -0
config.json +35 -0
generation_config.json +7 -0
merges.txt +0 -0
model.safetensors +3 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
special_tokens_map.json +25 -0
tokenizer.json +0 -0
tokenizer_config.json +57 -0
trainer_state.json +0 -0
training_args.bin +3 -0
vocab.json +0 -0

._added_tokens.json ADDED Viewed

Binary file (4.1 kB). View file

._config.json ADDED Viewed

Binary file (4.1 kB). View file

._generation_config.json ADDED Viewed

Binary file (4.1 kB). View file

._merges.txt ADDED Viewed

Binary file (4.1 kB). View file

._model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._special_tokens_map.json ADDED Viewed

Binary file (4.1 kB). View file

._tokenizer.json ADDED Viewed

Binary file (4.1 kB). View file

._tokenizer_config.json ADDED Viewed

Binary file (4.1 kB). View file

._trainer_state.json ADDED Viewed

Binary file (4.1 kB). View file

._training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02783af53e23708725469e7f887d0422e5a74c296a6fb3f678a6608114bba812
+size 4096

._vocab.json ADDED Viewed

Binary file (4.1 kB). View file

added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "<EOL>": 50000,
+  "<|UNKNOWN|>": 50001
+}

config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_num_labels": 2,
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 0,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 2,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 768,
+  "n_head": 12,
+  "n_inner": null,
+  "n_layer": 12,
+  "n_positions": 1024,
+  "output_past": true,
+  "pad_token_id": 1,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.51.3",
+  "use_cache": true,
+  "vocab_size": 50002
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "pad_token_id": 1,
+  "transformers_version": "4.51.3"
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbb6836f7adc40524930e7b607300a9a49a74f2b2b64ae68420cbf211207584f
+size 496990848

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d8000748728d9b006879a316403467c0bb168e80ce316eb0e5a753ca722e08c7
+size 994075578

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:23983290c1d8b8eaeeae80462dbefdfdbe8e1ed2d0722526f8e835988e036d7a
+size 14244

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4074c17470a32b647f021f4ac98a1ab1676b829a0f2a808d134a2df97c4e6a18
+size 988

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa12e3e9e2e3ff5fd236bf40996d75489c996274a37f538af6674bd36e5dffbd
+size 1064

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "sep_token": "<EOL>",
+  "unk_token": {
+    "content": "<|UNKNOWN|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50000": {
+      "content": "<EOL>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50001": {
+      "content": "<|UNKNOWN|>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "extra_special_tokens": {},
+  "full_tokenizer_file": null,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "sep_token": "<EOL>",
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|UNKNOWN|>"
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2548ccee6d85db43dfb957544124cb6d5d710caa25c81f4da84a55f9f685d51
+size 5304

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff