Upload folder using huggingface_hub

Files changed (2) hide show

config.json CHANGED Viewed

@@ -1,39 +1 @@
-{
-    "architectures": [
-        "GptBertForMaskedLM"
-    ],
-    "auto_map": {
-        "AutoConfig": "configuration_gptbert.GptBertConfig",
-        "AutoModel": "modeling_gptbert.GptBertModel",
-        "AutoModelForCausalLM": "modeling_gptbert.GptBertForCausalLM",
-        "AutoModelForMaskedLM": "modeling_gptbert.GptBertForMaskedLM",
-        "AutoModelForSequenceClassification": "modeling_gptbert.GptBertForSequenceClassification",
-        "AutoModelForTokenClassification": "modeling_gptbert.GptBertForTokenClassification",
-        "AutoModelForQuestionAnswering": "modeling_gptbert.GptBertForQuestionAnswering",
-        "AutoModelForMultipleChoice": "modeling_gptbert.GptBertForMultipleChoice"
-    },
-    "unk_token_id": 1,
-    "bos_token_id": 2,
-    "eos_token_id": 3,
-    "pad_token_id": 0,
-    "mask_token_id": 4,
-    "hidden_size": 640,
-    "intermediate_size": 1664,
-    "max_sequence_length": 16384,
-    "num_layers": 24,
-    "attention_dropout": 0.0,
-    "hidden_dropout": 0.0,
-    "embedding_dropout": 0.1,
-    "classifier_dropout": 0.2,
-    "layer_norm_eps": 1e-07,
-    "query_key_head_size": 64,
-    "value_head_size": 64,
-    "num_attention_heads": 10,
-    "rope_theta": 160000,
-    "vocab_size": 51200,
-    "local_global_ratio": 4,
-    "global_window_length": 8192,
-    "local_window_length": 256,
-    "deterministic_flash_attn": false,
-    "use_cache": false
-  }


1	+ {"architectures": ["GptBertForMaskedLM"], "auto_map": {"AutoConfig": "configuration_gptbert.GptBertConfig", "AutoModel": "modeling_gptbert.GptBertModel", "AutoModelForCausalLM": "modeling_gptbert.GptBertForCausalLM", "AutoModelForMaskedLM": "modeling_gptbert.GptBertForMaskedLM", "AutoModelForSequenceClassification": "modeling_gptbert.GptBertForSequenceClassification", "AutoModelForTokenClassification": "modeling_gptbert.GptBertForTokenClassification", "AutoModelForQuestionAnswering": "modeling_gptbert.GptBertForQuestionAnswering", "AutoModelForMultipleChoice": "modeling_gptbert.GptBertForMultipleChoice"}, "unk_token_id": 1, "bos_token_id": 2, "eos_token_id": 3, "pad_token_id": 0, "mask_token_id": 4, "hidden_size": 640, "intermediate_size": 1664, "max_sequence_length": 16384, "num_layers": 24, "attention_dropout": 0.0, "hidden_dropout": 0.0, "embedding_dropout": 0.1, "classifier_dropout": 0.2, "layer_norm_eps": 1e-07, "query_key_head_size": 64, "value_head_size": 64, "num_attention_heads": 10, "rope_theta": 160000, "vocab_size": 32768, "local_global_ratio": 4, "global_window_length": 8192, "local_window_length": 256, "deterministic_flash_attn": false, "use_cache": false}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:99ee1b9087167cd2fd7aef32a562ec2cce866d56ebef319cecf9742254c3e5d9
 size 597586413

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d1a1418ca5c3298ebd7bb70a69913945b356688b0b87bb6dead800b7cc4030b
 size 597586413