rbelanec
/

test

@@ -1,9 +1,9 @@
 ---
 library_name: peft
-license: llama3
-base_model: meta-llama/Meta-Llama-3-8B-Instruct
 tags:
-- base_model:adapter:meta-llama/Meta-Llama-3-8B-Instruct
 - llama-factory
 - transformers
 pipeline_tag: text-generation
@@ -17,10 +17,10 @@ should probably proofread and complete it, then remove this comment. -->
 # test
-This model is a fine-tuned version of [meta-llama/Meta-Llama-3-8B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct) on the wsc dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3497
-- Num Input Tokens Seen: 49376
 ## Model description
@@ -39,7 +39,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.03
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 123
@@ -52,23 +52,23 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Input Tokens Seen |
 |:-------------:|:-----:|:----:|:---------------:|:-----------------:|
-| 3.6273        | 0.056 | 7    | 6.9320          | 2880              |
-| 6.3813        | 0.112 | 14   | 1.6228          | 5920              |
-| 1.4507        | 0.168 | 21   | 0.4040          | 8416              |
-| 1.7771        | 0.224 | 28   | 3.6187          | 11264             |
-| 0.7848        | 0.28  | 35   | 0.3667          | 13824             |
-| 0.4314        | 0.336 | 42   | 0.3662          | 16672             |
-| 0.4096        | 0.392 | 49   | 0.5265          | 19296             |
-| 0.5554        | 0.448 | 56   | 0.3925          | 22432             |
-| 0.4968        | 0.504 | 63   | 2.6525          | 25504             |
-| 0.3298        | 0.56  | 70   | 0.3776          | 28064             |
-| 0.3663        | 0.616 | 77   | 0.3627          | 30720             |
-| 0.3654        | 0.672 | 84   | 0.3526          | 33504             |
-| 0.3495        | 0.728 | 91   | 0.3546          | 36128             |
-| 0.412         | 0.784 | 98   | 0.3497          | 38592             |
-| 0.349         | 0.84  | 105  | 0.3538          | 41280             |
-| 0.3482        | 0.896 | 112  | 0.3566          | 44160             |
-| 0.3258        | 0.952 | 119  | 0.3585          | 46944             |
 ### Framework versions

 ---
 library_name: peft
+license: llama3.2
+base_model: meta-llama/Llama-3.2-1B-Instruct
 tags:
+- base_model:adapter:meta-llama/Llama-3.2-1B-Instruct
 - llama-factory
 - transformers
 pipeline_tag: text-generation
 # test
+This model is a fine-tuned version of [meta-llama/Llama-3.2-1B-Instruct](https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4413
+- Num Input Tokens Seen: 46944
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 123
 | Training Loss | Epoch | Step | Validation Loss | Input Tokens Seen |
 |:-------------:|:-----:|:----:|:---------------:|:-----------------:|
+| 1.0409        | 0.056 | 7    | 0.3513          | 2880              |
+| 0.4086        | 0.112 | 14   | 1.1121          | 5920              |
+| 0.9267        | 0.168 | 21   | 0.3511          | 8416              |
+| 0.7142        | 0.224 | 28   | 0.3859          | 11264             |
+| 0.5983        | 0.28  | 35   | 0.6585          | 13824             |
+| 0.394         | 0.336 | 42   | 0.4126          | 16672             |
+| 0.4533        | 0.392 | 49   | 1.1762          | 19296             |
+| 1.3512        | 0.448 | 56   | 0.8065          | 22432             |
+| 0.7948        | 0.504 | 63   | 1.0268          | 25504             |
+| 0.3463        | 0.56  | 70   | 0.3528          | 28064             |
+| 0.3652        | 0.616 | 77   | 0.3505          | 30720             |
+| 0.3476        | 0.672 | 84   | 0.3471          | 33504             |
+| 0.3395        | 0.728 | 91   | 0.3648          | 36128             |
+| 0.4569        | 0.784 | 98   | 0.3611          | 38592             |
+| 0.3191        | 0.84  | 105  | 0.4305          | 41280             |
+| 0.3951        | 0.896 | 112  | 0.4486          | 44160             |
+| 0.3107        | 0.952 | 119  | 0.4413          | 46944             |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a681b1052017f2ad662311fe5d05caae05e1e79b9342798ab07266faec070cf
 size 2818586248

 version https://git-lfs.github.com/spec/v1
+oid sha256:434d92bdf22308ada82c55657344041a47d5ad9cd87553d78a484f8fe58ce4ff
 size 2818586248