zhimeng
/

Qwen2.5-1.5B-Open-R1-Code-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

zhimeng commited on Apr 19, 2025

Commit

f07940c

·

verified ·

1 Parent(s): 67f92a8

Training in progress, step 50

Files changed (4) hide show

config.json +3 -4
model.safetensors +1 -1
tokenizer_config.json +1 -1
training_args.bin +2 -2

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "Qwen/Qwen2.5-1.5B-Instruct",
   "architectures": [
     "Qwen2ForCausalLM"
   ],
@@ -11,7 +10,7 @@
   "initializer_range": 0.02,
   "intermediate_size": 8960,
   "max_position_embeddings": 32768,
-  "max_window_layers": 21,
   "model_type": "qwen2",
   "num_attention_heads": 12,
   "num_hidden_layers": 28,
@@ -22,8 +21,8 @@
   "sliding_window": 32768,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.49.0",
-  "use_cache": true,
   "use_sliding_window": false,
   "vocab_size": 151936
 }

 {
   "architectures": [
     "Qwen2ForCausalLM"
   ],
   "initializer_range": 0.02,
   "intermediate_size": 8960,
   "max_position_embeddings": 32768,
+  "max_window_layers": 28,
   "model_type": "qwen2",
   "num_attention_heads": 12,
   "num_hidden_layers": 28,
   "sliding_window": 32768,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.51.2",
+  "use_cache": false,
   "use_sliding_window": false,
   "vocab_size": 151936
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:86c79df12fe9eb83deadb33e00b076a353355e7cc6643863e46a97b09339fec7
 size 3087467144

 version https://git-lfs.github.com/spec/v1
+oid sha256:a521438ea04179ea5bb90019a057cfd0d65695bf549e5399ecfed99d9845b248
 size 3087467144

tokenizer_config.json CHANGED Viewed

@@ -200,7 +200,7 @@
   "eos_token": "<|im_end|>",
   "errors": "replace",
   "extra_special_tokens": {},
-  "model_max_length": 131072,
   "pad_token": "<|endoftext|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",

   "eos_token": "<|im_end|>",
   "errors": "replace",
   "extra_special_tokens": {},
+  "model_max_length": 32768,
   "pad_token": "<|endoftext|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2be873df351695990403692ed8e4babbe9498681f03910499bde7029ad15081a
-size 8248

 version https://git-lfs.github.com/spec/v1
+oid sha256:d72ae48201f0fcc91aad47076e604bb3f1c4c020ce45fb0292977a515b2ff401
+size 8376