LamaDiab
/

MiniLM-V10Data-128BATCH-SemanticEngine

@@ -366,22 +366,7 @@ You can finetune this model on your own dataset.
 ### Training Logs
 | Epoch  | Step  | Training Loss | Validation Loss | cosine_accuracy |
 |:------:|:-----:|:-------------:|:---------------:|:---------------:|
-| 0.0003 | 1     | 1.6763        | -               | -               |
-| 0.2789 | 1000  | 1.6731        | 1.2452          | 0.9435          |
-| 0.5579 | 2000  | 1.4545        | 1.1861          | 0.9491          |
-| 0.8368 | 3000  | 1.3514        | 1.1498          | 0.9530          |
-| 1.1158 | 4000  | 1.2499        | 1.1096          | 0.9535          |
-| 1.3947 | 5000  | 1.1977        | 1.0828          | 0.9589          |
-| 1.6736 | 6000  | 1.1468        | 1.0728          | 0.9585          |
-| 1.9526 | 7000  | 1.1011        | 1.0473          | 0.9593          |
-| 2.2315 | 8000  | 1.0401        | 1.0429          | 0.9575          |
-| 2.5105 | 9000  | 1.0196        | 1.0377          | 0.9599          |
-| 2.7894 | 10000 | 0.9939        | 1.0395          | 0.9592          |
-| 3.0683 | 11000 | 0.9579        | 1.0249          | 0.9612          |
-| 3.3473 | 12000 | 0.9437        | 1.0262          | 0.9600          |
-| 3.6262 | 13000 | 0.9279        | 1.0129          | 0.9618          |
-| 3.9052 | 14000 | 0.9184        | 1.0108          | 0.9621          |
-| 4.1841 | 15000 | 0.8807        | 1.0071          | 0.9614          |
 | 4.4630 | 16000 | 0.8802        | 1.0004          | 0.9613          |
 | 4.7420 | 17000 | 0.8752        | 1.0061          | 0.9617          |

 ### Training Logs
 | Epoch  | Step  | Training Loss | Validation Loss | cosine_accuracy |
 |:------:|:-----:|:-------------:|:---------------:|:---------------:|
+| 4.1841 | 15000 | 0.8884        | 1.0071          | 0.9614          |
 | 4.4630 | 16000 | 0.8802        | 1.0004          | 0.9613          |
 | 4.7420 | 17000 | 0.8752        | 1.0061          | 0.9617          |

checkpoint-17925/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2069d4b55b2dee427b0082cedb4ca93e7fba56bcfcc7e29a0edb22977cacdec8
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:e41377ba25d8813928ae800791180b298f08b3f137afff07123ecd1fe1b0657c
 size 14244

checkpoint-17925/trainer_state.json CHANGED Viewed

@@ -244,16 +244,16 @@
       "epoch": 4.184100418410042,
       "grad_norm": 4.519611358642578,
       "learning_rate": 5.964002440512509e-06,
-      "loss": 0.8807,
       "step": 15000
     },
     {
       "epoch": 4.184100418410042,
       "eval_cosine_accuracy": 0.9614049792289734,
       "eval_loss": 1.0071080923080444,
-      "eval_runtime": 22.3262,
-      "eval_samples_per_second": 425.913,
-      "eval_steps_per_second": 3.359,
       "step": 15000
     },
     {
@@ -267,9 +267,9 @@
       "epoch": 4.463040446304045,
       "eval_cosine_accuracy": 0.9612998366355896,
       "eval_loss": 1.0004464387893677,
-      "eval_runtime": 23.5229,
-      "eval_samples_per_second": 404.245,
-      "eval_steps_per_second": 3.188,
       "step": 16000
     },
     {
@@ -283,9 +283,9 @@
       "epoch": 4.741980474198048,
       "eval_cosine_accuracy": 0.9617204666137695,
       "eval_loss": 1.0060843229293823,
-      "eval_runtime": 22.4412,
-      "eval_samples_per_second": 423.73,
-      "eval_steps_per_second": 3.342,
       "step": 17000
     }
   ],

       "epoch": 4.184100418410042,
       "grad_norm": 4.519611358642578,
       "learning_rate": 5.964002440512509e-06,
+      "loss": 0.8884,
       "step": 15000
     },
     {
       "epoch": 4.184100418410042,
       "eval_cosine_accuracy": 0.9614049792289734,
       "eval_loss": 1.0071080923080444,
+      "eval_runtime": 21.2593,
+      "eval_samples_per_second": 447.287,
+      "eval_steps_per_second": 3.528,
       "step": 15000
     },
     {
       "epoch": 4.463040446304045,
       "eval_cosine_accuracy": 0.9612998366355896,
       "eval_loss": 1.0004464387893677,
+      "eval_runtime": 21.271,
+      "eval_samples_per_second": 447.04,
+      "eval_steps_per_second": 3.526,
       "step": 16000
     },
     {
       "epoch": 4.741980474198048,
       "eval_cosine_accuracy": 0.9617204666137695,
       "eval_loss": 1.0060843229293823,
+      "eval_runtime": 21.4196,
+      "eval_samples_per_second": 443.939,
+      "eval_steps_per_second": 3.501,
       "step": 17000
     }
   ],

checkpoint-17925/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddb1e0dab31f45e0e46ba20c97f0f69d3bc5247ba9f25051c28fed605796b0eb
 size 5752

 version https://git-lfs.github.com/spec/v1
+oid sha256:93b1607a15af70cf6b32a232aa87f4ee1d3038e5a70922f63dc141b69792d409
 size 5752