End of training

Browse files

Files changed (5) hide show

README.md +63 -29
runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436653.86f59ffbd25a.1423.153 +2 -2
runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436653.86f59ffbd25a.1423.154 +2 -2
runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436720.86f59ffbd25a.1423.155 +3 -0
runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436720.86f59ffbd25a.1423.156 +3 -0

README.md CHANGED Viewed

@@ -17,9 +17,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [Anwaarma/Merged-Server-praj](https://huggingface.co/Anwaarma/Merged-Server-praj) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7888
-- Accuracy: 0.31
-- F1: 0.4733
 ## Model description
@@ -38,7 +38,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -50,31 +50,65 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|
-| No log        | 0.0   | 50   | 0.5805          | 0.6      | 0.5992 |
-| No log        | 0.01  | 100  | 0.5687          | 0.65     | 0.6505 |
-| No log        | 0.01  | 150  | 0.5711          | 0.64     | 0.6404 |
-| No log        | 0.01  | 200  | 0.5643          | 0.67     | 0.6678 |
-| No log        | 0.02  | 250  | 0.5757          | 0.64     | 0.6393 |
-| No log        | 0.02  | 300  | 0.5855          | 0.66     | 0.6517 |
-| No log        | 0.02  | 350  | 0.5529          | 0.63     | 0.6260 |
-| No log        | 0.03  | 400  | 0.5646          | 0.62     | 0.6105 |
-| No log        | 0.03  | 450  | 0.5814          | 0.61     | 0.6087 |
-| 0.5986        | 0.03  | 500  | 0.5702          | 0.62     | 0.6129 |
-| 0.5986        | 0.04  | 550  | 0.5618          | 0.62     | 0.6205 |
-| 0.5986        | 0.04  | 600  | 0.5517          | 0.63     | 0.6306 |
-| 0.5986        | 0.04  | 650  | 0.5522          | 0.62     | 0.6192 |
-| 0.5986        | 0.05  | 700  | 0.5524          | 0.63     | 0.6288 |
-| 0.5986        | 0.05  | 750  | 0.5619          | 0.64     | 0.6404 |
-| 0.5986        | 0.05  | 800  | 0.5638          | 0.64     | 0.64   |
-| 0.5986        | 0.06  | 850  | 0.5481          | 0.66     | 0.6605 |
-| 0.5986        | 0.06  | 900  | 0.5562          | 0.64     | 0.64   |
-| 0.5986        | 0.06  | 950  | 0.5502          | 0.64     | 0.6354 |
-| 0.5834        | 0.07  | 1000 | 0.5970          | 0.68     | 0.6606 |
-| 0.5834        | 0.07  | 1050 | 0.5369          | 0.67     | 0.6702 |
-| 0.5834        | 0.07  | 1100 | 0.5970          | 0.6      | 0.5966 |
-| 0.5834        | 0.08  | 1150 | 0.5770          | 0.62     | 0.6192 |
-| 0.5834        | 0.08  | 1200 | 0.5582          | 0.63     | 0.6306 |
-| 0.5834        | 0.09  | 1250 | 0.5505          | 0.66     | 0.66   |
 ### Framework versions

 This model is a fine-tuned version of [Anwaarma/Merged-Server-praj](https://huggingface.co/Anwaarma/Merged-Server-praj) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5643
+- Accuracy: 0.82
+- F1: 0.9011
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 4e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|
+| No log        | 0.0   | 50   | 0.5790          | 0.6      | 0.5992 |
+| No log        | 0.01  | 100  | 0.5691          | 0.65     | 0.6505 |
+| No log        | 0.01  | 150  | 0.5678          | 0.65     | 0.6505 |
+| No log        | 0.01  | 200  | 0.5621          | 0.68     | 0.6773 |
+| No log        | 0.02  | 250  | 0.5666          | 0.63     | 0.6303 |
+| No log        | 0.02  | 300  | 0.5721          | 0.65     | 0.6463 |
+| No log        | 0.02  | 350  | 0.5533          | 0.63     | 0.6260 |
+| No log        | 0.03  | 400  | 0.5614          | 0.62     | 0.6105 |
+| No log        | 0.03  | 450  | 0.5756          | 0.62     | 0.6181 |
+| 0.5985        | 0.03  | 500  | 0.5666          | 0.6      | 0.5947 |
+| 0.5985        | 0.04  | 550  | 0.5613          | 0.64     | 0.6406 |
+| 0.5985        | 0.04  | 600  | 0.5541          | 0.63     | 0.6306 |
+| 0.5985        | 0.04  | 650  | 0.5571          | 0.62     | 0.6192 |
+| 0.5985        | 0.05  | 700  | 0.5536          | 0.62     | 0.6192 |
+| 0.5985        | 0.05  | 750  | 0.5614          | 0.63     | 0.6306 |
+| 0.5985        | 0.05  | 800  | 0.5667          | 0.63     | 0.6297 |
+| 0.5985        | 0.06  | 850  | 0.5466          | 0.66     | 0.6600 |
+| 0.5985        | 0.06  | 900  | 0.5532          | 0.66     | 0.6593 |
+| 0.5985        | 0.06  | 950  | 0.5482          | 0.67     | 0.6630 |
+| 0.5855        | 0.07  | 1000 | 0.5837          | 0.63     | 0.6220 |
+| 0.5855        | 0.07  | 1050 | 0.5368          | 0.67     | 0.6705 |
+| 0.5855        | 0.07  | 1100 | 0.5793          | 0.62     | 0.6167 |
+| 0.5855        | 0.08  | 1150 | 0.5694          | 0.63     | 0.6276 |
+| 0.5855        | 0.08  | 1200 | 0.5520          | 0.63     | 0.6306 |
+| 0.5855        | 0.09  | 1250 | 0.5572          | 0.66     | 0.6593 |
+| 0.5855        | 0.09  | 1300 | 0.5706          | 0.62     | 0.6150 |
+| 0.5855        | 0.09  | 1350 | 0.5694          | 0.66     | 0.6593 |
+| 0.5855        | 0.1   | 1400 | 0.5559          | 0.65     | 0.6497 |
+| 0.5855        | 0.1   | 1450 | 0.5515          | 0.67     | 0.6705 |
+| 0.5777        | 0.1   | 1500 | 0.5447          | 0.64     | 0.6393 |
+| 0.5777        | 0.11  | 1550 | 0.5453          | 0.65     | 0.6502 |
+| 0.5777        | 0.11  | 1600 | 0.5575          | 0.64     | 0.6400 |
+| 0.5777        | 0.11  | 1650 | 0.5498          | 0.66     | 0.6584 |
+| 0.5777        | 0.12  | 1700 | 0.5620          | 0.66     | 0.6604 |
+| 0.5777        | 0.12  | 1750 | 0.5734          | 0.67     | 0.6702 |
+| 0.5777        | 0.12  | 1800 | 0.5561          | 0.66     | 0.6593 |
+| 0.5777        | 0.13  | 1850 | 0.5376          | 0.67     | 0.6649 |
+| 0.5777        | 0.13  | 1900 | 0.5652          | 0.65     | 0.6505 |
+| 0.5777        | 0.13  | 1950 | 0.5414          | 0.67     | 0.6689 |
+| 0.575         | 0.14  | 2000 | 0.5340          | 0.67     | 0.6665 |
+| 0.575         | 0.14  | 2050 | 0.5393          | 0.68     | 0.6794 |
+| 0.575         | 0.14  | 2100 | 0.5253          | 0.7      | 0.6994 |
+| 0.575         | 0.15  | 2150 | 0.5334          | 0.69     | 0.6834 |
+| 0.575         | 0.15  | 2200 | 0.5395          | 0.68     | 0.6773 |
+| 0.575         | 0.15  | 2250 | 0.5426          | 0.65     | 0.6446 |
+| 0.575         | 0.16  | 2300 | 0.5523          | 0.64     | 0.6370 |
+| 0.575         | 0.16  | 2350 | 0.5378          | 0.68     | 0.6804 |
+| 0.575         | 0.16  | 2400 | 0.5375          | 0.67     | 0.6649 |
+| 0.575         | 0.17  | 2450 | 0.5378          | 0.68     | 0.6742 |
+| 0.556         | 0.17  | 2500 | 0.5491          | 0.69     | 0.6867 |
+| 0.556         | 0.17  | 2550 | 0.5347          | 0.66     | 0.6517 |
+| 0.556         | 0.18  | 2600 | 0.5325          | 0.69     | 0.6852 |
+| 0.556         | 0.18  | 2650 | 0.5490          | 0.68     | 0.6794 |
+| 0.556         | 0.18  | 2700 | 0.5313          | 0.7      | 0.7005 |
+| 0.556         | 0.19  | 2750 | 0.5451          | 0.65     | 0.6314 |
+| 0.556         | 0.19  | 2800 | 0.5506          | 0.64     | 0.6312 |
+| 0.556         | 0.19  | 2850 | 0.5539          | 0.65     | 0.6497 |
+| 0.556         | 0.2   | 2900 | 0.5601          | 0.66     | 0.6604 |
+| 0.556         | 0.2   | 2950 | 0.5530          | 0.67     | 0.6705 |
 ### Framework versions

runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436653.86f59ffbd25a.1423.153 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:859e38bc1dc588f55bfff9bbe4945dc6e1f29dad994ed923bc3748a4e815fa00
-size 23565

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2fb32cfda3bf47ffd0d37f778c0662e346f0b3a9d6c90c898b0d288df8f6433
+size 27240

runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436653.86f59ffbd25a.1423.154 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8cde4c5956dc55757865475991bfb253163f021bf22f037a68abebbb25b47649
-size 23565

 version https://git-lfs.github.com/spec/v1
+oid sha256:0fbbcb486141a5714a88486d1ed7f1acc62d3160edb3dbc54ac13be6ba67855d
+size 27240

runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436720.86f59ffbd25a.1423.155 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49ae1c5f8c87a93000d14a06f42fbd4a816f579656fac433c215306eb0a0e464
+size 826

runs/Dec24_16-50-51_86f59ffbd25a/events.out.tfevents.1703436720.86f59ffbd25a.1423.156 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:85d67cb3fb1fd3612c17151a51e7e5e8f6e562fe229077463394c190c1eba8ef
+size 826