mlfoundations-dev
/

hp_ablations_gemma_bsz1024

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

sedrickkeh commited on Dec 12, 2024

Commit

8b5d960

·

verified ·

1 Parent(s): ca97bf9

Model save

Files changed (1) hide show

README.md +2 -3

README.md CHANGED Viewed

@@ -4,7 +4,6 @@ license: gemma
 base_model: google/gemma-2-9b
 tags:
 - llama-factory
-- full
 - generated_from_trainer
 model-index:
 - name: hp_ablations_gemma_bsz1024
@@ -16,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 # hp_ablations_gemma_bsz1024
-This model is a fine-tuned version of [google/gemma-2-9b](https://huggingface.co/google/gemma-2-9b) on the mlfoundations-dev/oh-dcft-v3.1-gpt-4o-mini dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.5917
@@ -65,5 +64,5 @@ The following hyperparameters were used during training:
 - Transformers 4.46.1
 - Pytorch 2.3.0
-- Datasets 3.0.2
 - Tokenizers 0.20.3

 base_model: google/gemma-2-9b
 tags:
 - llama-factory
 - generated_from_trainer
 model-index:
 - name: hp_ablations_gemma_bsz1024
 # hp_ablations_gemma_bsz1024
+This model is a fine-tuned version of [google/gemma-2-9b](https://huggingface.co/google/gemma-2-9b) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.5917
 - Transformers 4.46.1
 - Pytorch 2.3.0
+- Datasets 3.1.0
 - Tokenizers 0.20.3