Veiterr
/

MNLP_M2_dpo_model

Text Generation

text-generation-inference

Model card Files Files and versions

Veiterr commited on May 27, 2025

Commit

df74cd8

·

verified ·

1 Parent(s): 115d2b8

Upload Qwen3ForCausalLM

Files changed (3) hide show

config.json +2 -2
generation_config.json +2 -9
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -5,13 +5,13 @@
   "attention_bias": false,
   "attention_dropout": 0.0,
   "bos_token_id": 151643,
-  "eos_token_id": 151645,
   "head_dim": 128,
   "hidden_act": "silu",
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
-  "max_position_embeddings": 40960,
   "max_window_layers": 28,
   "model_type": "qwen3",
   "num_attention_heads": 16,

   "attention_bias": false,
   "attention_dropout": 0.0,
   "bos_token_id": 151643,
+  "eos_token_id": 151643,
   "head_dim": 128,
   "hidden_act": "silu",
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
+  "max_position_embeddings": 32768,
   "max_window_layers": 28,
   "model_type": "qwen3",
   "num_attention_heads": 16,

generation_config.json CHANGED Viewed

@@ -1,13 +1,6 @@
 {
   "bos_token_id": 151643,
-  "do_sample": true,
-  "eos_token_id": [
-    151645,
-    151643
-  ],
-  "pad_token_id": 151643,
-  "temperature": 0.6,
-  "top_k": 20,
-  "top_p": 0.95,
   "transformers_version": "4.51.3"
 }

 {
   "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "max_new_tokens": 2048,
   "transformers_version": "4.51.3"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc721c7feece6a4281d6f0c17a3e9541585fd59c85972ec208495f08fbc37435
 size 1192135096

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bd75c04926a66c78ed7102ff75b9786ee829a25a404a5477f5bf9bb2fecabaa
 size 1192135096