End of training

Browse files

Files changed (3) hide show

README.md +27 -32
model.safetensors +1 -1
runs/May30_15-30-17_sunfu-DSKT-ubn/events.out.tfevents.1717054225.sunfu-DSKT-ubn.1707.0 +2 -2

README.md CHANGED Viewed

@@ -15,8 +15,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/git-base](https://huggingface.co/microsoft/git-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0495
-- Wer Score: 4.7488
 ## Model description
@@ -35,12 +35,12 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
-- train_batch_size: 4
 - eval_batch_size: 2
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 50
@@ -50,33 +50,28 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch   | Step | Validation Loss | Wer Score |
 |:-------------:|:-------:|:----:|:---------------:|:---------:|
-| 7.2487        | 1.8182  | 50   | 4.3718          | 22.0605   |
-| 2.0953        | 3.6364  | 100  | 0.2876          | 4.0186    |
-| 0.0846        | 5.4545  | 150  | 0.0417          | 0.4419    |
-| 0.023         | 7.2727  | 200  | 0.0380          | 0.4233    |
-| 0.018         | 9.0909  | 250  | 0.0369          | 0.4186    |
-| 0.0144        | 10.9091 | 300  | 0.0393          | 3.0093    |
-| 0.0116        | 12.7273 | 350  | 0.0407          | 6.9628    |
-| 0.0087        | 14.5455 | 400  | 0.0406          | 3.5209    |
-| 0.0062        | 16.3636 | 450  | 0.0423          | 14.7023   |
-| 0.0034        | 18.1818 | 500  | 0.0429          | 9.0372    |
-| 0.0024        | 20.0    | 550  | 0.0471          | 8.3442    |
-| 0.0013        | 21.8182 | 600  | 0.0469          | 13.5907   |
-| 0.0009        | 23.6364 | 650  | 0.0464          | 14.6186   |
-| 0.0005        | 25.4545 | 700  | 0.0468          | 11.1674   |
-| 0.0004        | 27.2727 | 750  | 0.0476          | 7.9907    |
-| 0.0003        | 29.0909 | 800  | 0.0480          | 7.3070    |
-| 0.0003        | 30.9091 | 850  | 0.0480          | 7.2140    |
-| 0.0003        | 32.7273 | 900  | 0.0484          | 6.9628    |
-| 0.0003        | 34.5455 | 950  | 0.0487          | 6.8512    |
-| 0.0003        | 36.3636 | 1000 | 0.0489          | 6.0698    |
-| 0.0003        | 38.1818 | 1050 | 0.0491          | 5.4837    |
-| 0.0003        | 40.0    | 1100 | 0.0492          | 4.9256    |
-| 0.0002        | 41.8182 | 1150 | 0.0493          | 4.7860    |
-| 0.0002        | 43.6364 | 1200 | 0.0493          | 4.8140    |
-| 0.0002        | 45.4545 | 1250 | 0.0494          | 4.8       |
-| 0.0002        | 47.2727 | 1300 | 0.0495          | 4.7581    |
-| 0.0002        | 49.0909 | 1350 | 0.0495          | 4.7488    |
 ### Framework versions

 This model is a fine-tuned version of [microsoft/git-base](https://huggingface.co/microsoft/git-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0279
+- Wer Score: 7.0134
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 5
 - eval_batch_size: 2
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 10
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 50
 | Training Loss | Epoch   | Step | Validation Loss | Wer Score |
 |:-------------:|:-------:|:----:|:---------------:|:---------:|
+| 8.5536        | 2.2727  | 50   | 7.1184          | 52.625    |
+| 6.2017        | 4.5455  | 100  | 5.0281          | 22.3527   |
+| 4.1263        | 6.8182  | 150  | 2.9941          | 21.8616   |
+| 2.2013        | 9.0909  | 200  | 1.2700          | 18.7321   |
+| 0.7916        | 11.3636 | 250  | 0.3337          | 12.1607   |
+| 0.1917        | 13.6364 | 300  | 0.0798          | 4.5357    |
+| 0.0458        | 15.9091 | 350  | 0.0356          | 1.0       |
+| 0.0142        | 18.1818 | 400  | 0.0278          | 7.25      |
+| 0.0066        | 20.4545 | 450  | 0.0287          | 8.4196    |
+| 0.0043        | 22.7273 | 500  | 0.0270          | 7.8795    |
+| 0.0032        | 25.0    | 550  | 0.0272          | 7.2545    |
+| 0.0027        | 27.2727 | 600  | 0.0273          | 7.0179    |
+| 0.0023        | 29.5455 | 650  | 0.0271          | 7.2054    |
+| 0.002         | 31.8182 | 700  | 0.0275          | 7.0580    |
+| 0.0018        | 34.0909 | 750  | 0.0276          | 7.2589    |
+| 0.0016        | 36.3636 | 800  | 0.0277          | 7.0312    |
+| 0.0015        | 38.6364 | 850  | 0.0277          | 7.0759    |
+| 0.0014        | 40.9091 | 900  | 0.0278          | 7.1071    |
+| 0.0014        | 43.1818 | 950  | 0.0278          | 7.1161    |
+| 0.0013        | 45.4545 | 1000 | 0.0279          | 6.9241    |
+| 0.0013        | 47.7273 | 1050 | 0.0279          | 6.9911    |
+| 0.0013        | 50.0    | 1100 | 0.0279          | 7.0134    |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62df65df5450100315d52046ef4d4c2e5762fb7dc668375c8d682df0e2c2b976
 size 706516040

 version https://git-lfs.github.com/spec/v1
+oid sha256:027854b5e86b1d8a695a7bf94832fd71eb728d47bd832e2721440650fead2a47
 size 706516040

runs/May30_15-30-17_sunfu-DSKT-ubn/events.out.tfevents.1717054225.sunfu-DSKT-ubn.1707.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f174fbc073be6b61732c3bcf8023c9a831fddee4bdaced8f12cb879b123c7c86
-size 16107

 version https://git-lfs.github.com/spec/v1
+oid sha256:4560e80b8ac2a11fa402b18322e91bf11311b40fc335178034a6bc5a6b36a0bf
+size 16996