Model save

Files changed (6) hide show

README.md CHANGED Viewed

@@ -1,10 +1,9 @@
 ---
 library_name: transformers
 license: apache-2.0
-base_model: Qwen/Qwen2.5-1.5B-Instruct
 tags:
 - llama-factory
-- full
 - generated_from_trainer
 model-index:
 - name: qwen2-5_multiple_samples_ground_truth_openr1_llm_verifier_clean
@@ -16,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 # qwen2-5_multiple_samples_ground_truth_openr1_llm_verifier_clean
-This model is a fine-tuned version of [Qwen/Qwen2.5-1.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct) on the mlfoundations-dev/instruction_filtering_scale_up_code_base_gemini_length_1K dataset.
 ## Model description
@@ -40,8 +39,10 @@ The following hyperparameters were used during training:
 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
 - gradient_accumulation_steps: 3
-- total_train_batch_size: 3
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1

 ---
 library_name: transformers
 license: apache-2.0
+base_model: Qwen/Qwen2.5-7B-Instruct
 tags:
 - llama-factory
 - generated_from_trainer
 model-index:
 - name: qwen2-5_multiple_samples_ground_truth_openr1_llm_verifier_clean
 # qwen2-5_multiple_samples_ground_truth_openr1_llm_verifier_clean
+This model is a fine-tuned version of [Qwen/Qwen2.5-7B-Instruct](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct) on an unknown dataset.
 ## Model description
 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
+- num_devices: 32
 - gradient_accumulation_steps: 3
+- total_train_batch_size: 96
+- total_eval_batch_size: 256
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1

generation_config.json CHANGED Viewed

@@ -6,7 +6,7 @@
     151643
   ],
   "pad_token_id": 151643,
-  "repetition_penalty": 1.1,
   "temperature": 0.7,
   "top_k": 20,
   "top_p": 0.8,

     151643
   ],
   "pad_token_id": 151643,
+  "repetition_penalty": 1.05,
   "temperature": 0.7,
   "top_k": 20,
   "top_p": 0.8,

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:76304d214fae0a740bb4fbc3c23abb9300610273f5b3d5ca132dcce44092b64f
 size 4877660776

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ae1634941827c62065f475455180268fe186cd4e4b8b88358f597c1221e980e
 size 4877660776

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:079bfb3f0ed47587461c74f3be997fcc232d133f9476971ec76d71f7a98e25ea
 size 4932751008

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddc8bab0965783d6373234ebda9eaec1fa1b9cdc96ef53a1e2e788dbe1f88b31
 size 4932751008

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:73745049d80771cf6f864bceb36015477879a88a966bc6b47906479f79b34525
 size 4330865200

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0d72b343eb118b97c15e46376b6f14a373380e4c8532fa92091c50fdc306a5b
 size 4330865200

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a8d94aa13d1614a7b4523b345cde3fcce160cd5190a9d5deb809a3a69d7557c
 size 1089994880

 version https://git-lfs.github.com/spec/v1
+oid sha256:108b6c338d3c55d8ebe18adb23f40f05dd52862f828a525c5406abc68bc21de3
 size 1089994880