Upload 10 files

Files changed (10) hide show

added_tokens.json ADDED Viewed

+{
+  "<|endoftext|>": 151643,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644
+}

config.json ADDED Viewed

+{
+  "_name_or_path": "/root/lwt/tech/mcmd-72b",
+  "architectures": [
+    "mcmdForCausalLM"
+  ],
+  "auto_map": {
+    "AutoConfig": "configuration_mcmd.mcmdConfig",
+    "AutoModel": "modeling_mcmd.mcmdForCausalLM",
+    "AutoModelForCausalLM": "modeling_mcmd.mcmdForCausalLM"
+  },
+  "clip_path": "/data1/model/DFN5B-CLIP-ViT-H-14-378",
+  "hidden_size": 8192,
+  "hidden_sizes": 8192,
+  "input_img_size": 378,
+  "lm_model": {
+    "attention_dropout": 0.0,
+    "bos_token_id": 151643,
+    "eos_token_id": 151645,
+    "hidden_act": "silu",
+    "hidden_size": 8192,
+    "initializer_range": 0.02,
+    "intermediate_size": 29696,
+    "max_position_embeddings": 32768,
+    "max_window_layers": 70,
+    "model_type": "qwen2",
+    "num_attention_heads": 64,
+    "num_hidden_layers": 80,
+    "num_key_value_heads": 8,
+    "rms_norm_eps": 1e-06,
+    "rope_theta": 1000000.0,
+    "sliding_window": 131072,
+    "tie_word_embeddings": false,
+    "torch_dtype": "bfloat16",
+    "transformers_version": "4.41.2",
+    "use_cache": true,
+    "use_sliding_window": false,
+    "vocab_size": 152064
+  },
+  "lm_path": "/data1/model/Qwen2-72B-Instruct",
+  "max_length": 1024,
+  "model_type": "mcmd",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.40.0",
+  "vision_config": "mlp2x_gelu",
+  "vocab_size": 152064
+}

configuration_mcmd.py ADDED Viewed

+from transformers.configuration_utils import PretrainedConfig
+class mcmdConfig(PretrainedConfig):
+    model_type = "mcmd"
+    _auto_class = "AutoConfig"
+    def __init__(
+        self,
+        **kwargs,
+    ):
+        super().__init__(
+            **kwargs,
+        )

latest ADDED Viewed

	@@ -0,0 +1 @@


1	+ global_step100000

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model-00001-of-00031.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0574798991a644b5858d4db2e7fdfb3f4860c24bfefed012581ae666d71e4ea1
+size 4695909400

model-00002-of-00031.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:50b1debb07d460f8e18ad0c22dee3e8f3433dce74cbc83375d522d8f80bc6287
+size 4781670640

model-00003-of-00031.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba6bcf17507be8c7d4ad96d7102b6c35e3cc9435aabd150e113ed700a44ef629
+size 4964101648

model-00004-of-00031.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffe86370a452e24971078f9751f7645eafaf13f2a9ac003c3c759817652063f4
+size 4781637624

model-00005-of-00031.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4dd1ef77fc8afe107ee5637f9d02bc63a1990e062aad653e8d28bf3e1b419d67
+size 4781670664