furmaniak
/

pretrain

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

furmaniak commited on Feb 2, 2025

Commit

f87c629

·

verified ·

1 Parent(s): be96c53

Model save

Files changed (1) hide show

README.md +2 -3

README.md CHANGED Viewed

@@ -4,7 +4,6 @@ license: apache-2.0
 base_model: Qwen/Qwen2.5-32B
 tags:
 - llama-factory
-- full
 - generated_from_trainer
 model-index:
 - name: pretrain
@@ -16,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 # pretrain
-This model is a fine-tuned version of [Qwen/Qwen2.5-32B](https://huggingface.co/Qwen/Qwen2.5-32B) on the openalex_references dataset.
 ## Model description
@@ -35,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.001
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42

 base_model: Qwen/Qwen2.5-32B
 tags:
 - llama-factory
 - generated_from_trainer
 model-index:
 - name: pretrain
 # pretrain
+This model is a fine-tuned version of [Qwen/Qwen2.5-32B](https://huggingface.co/Qwen/Qwen2.5-32B) on an unknown dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 6e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42