souvik18
/

gen

souvik18 commited on Dec 15, 2025

Commit

a790c84

verified ·

1 Parent(s): b0e1595

End of training

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,12 +1,9 @@
 ---
-library_name: peft
 license: apache-2.0
 base_model: mistralai/Mistral-7B-Instruct-v0.2
 tags:
-- base_model:adapter:mistralai/Mistral-7B-Instruct-v0.2
-- lora
-- transformers
-pipeline_tag: text-generation
 model-index:
 - name: gen
   results: []
@@ -37,15 +34,14 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 16
-- optimizer: Use OptimizerNames.PAGED_ADAMW_8BIT with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 50
-- training_steps: 200
 - mixed_precision_training: Native AMP
 ### Training results
@@ -54,8 +50,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- PEFT 0.18.0
-- Transformers 4.57.3
-- Pytorch 2.6.0+cu124
-- Datasets 4.4.1
-- Tokenizers 0.22.1

 ---
 license: apache-2.0
 base_model: mistralai/Mistral-7B-Instruct-v0.2
 tags:
+- generated_from_trainer
+library_name: peft
 model-index:
 - name: gen
   results: []
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 8
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- training_steps: 10
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- PEFT 0.8.2
+- Transformers 4.36.2
+- Pytorch 2.1.2+cu121
+- Datasets 2.16.1
+- Tokenizers 0.15.2