guo1006
/

qwem_lora_clm_with_added_tokens

Generated from Trainer

Model card Files Files and versions

guo1006 commited on Oct 2

Commit

5845a1f

·

verified ·

1 Parent(s): 4508907

End of training

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -1,9 +1,9 @@
 ---
 license: apache-2.0
-base_model: Qwen/Qwen2.5-7B-Instruct
 tags:
 - generated_from_trainer
-library_name: peft
 model-index:
 - name: qwem_lora_clm_with_added_tokens
   results: []
@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 # qwem_lora_clm_with_added_tokens
-This model is a fine-tuned version of [Qwen/Qwen2.5-7B-Instruct](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct) on an unknown dataset.
 ## Model description
@@ -37,7 +37,7 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 12
 - num_epochs: 2
@@ -50,7 +50,7 @@ The following hyperparameters were used during training:
 ### Framework versions
 - PEFT 0.15.2
-- Transformers 4.43.1
 - Pytorch 2.6.0+cu124
 - Datasets 3.6.0
-- Tokenizers 0.19.1

 ---
+library_name: peft
 license: apache-2.0
+base_model: Qwen/Qwen2.5-7B
 tags:
 - generated_from_trainer
 model-index:
 - name: qwem_lora_clm_with_added_tokens
   results: []
 # qwem_lora_clm_with_added_tokens
+This model is a fine-tuned version of [Qwen/Qwen2.5-7B](https://huggingface.co/Qwen/Qwen2.5-7B) on an unknown dataset.
 ## Model description
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 12
 - num_epochs: 2
 ### Framework versions
 - PEFT 0.15.2
+- Transformers 4.56.2
 - Pytorch 2.6.0+cu124
 - Datasets 3.6.0
+- Tokenizers 0.22.1