Model save

Browse files

Files changed (3) hide show

README.md +50 -12
p_object.json +0 -0
prediction_reference.json +0 -0

README.md CHANGED Viewed

@@ -16,8 +16,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/dit-base-finetuned-rvlcdip](https://huggingface.co/microsoft/dit-base-finetuned-rvlcdip) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- F1: 0.9705
-- Loss: 0.0391
 ## Model description
@@ -37,22 +37,60 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 3e-05
-- train_batch_size: 128
-- eval_batch_size: 128
 - seed: 1337
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5.0
 ### Training results
-| Training Loss | Epoch | Step | F1     | Validation Loss |
-|:-------------:|:-----:|:----:|:------:|:---------------:|
-| 0.0594        | 1.0   | 1981 | 0.9705 | 0.0440          |
-| 0.0678        | 2.0   | 3962 | 0.9705 | 0.0447          |
-| 0.0615        | 3.0   | 5943 | 0.9705 | 0.0416          |
-| 0.0685        | 4.0   | 7924 | 0.9705 | 0.0385          |
-| 0.0582        | 5.0   | 9905 | 0.9705 | 0.0391          |
 ### Framework versions

 This model is a fine-tuned version of [microsoft/dit-base-finetuned-rvlcdip](https://huggingface.co/microsoft/dit-base-finetuned-rvlcdip) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0478
+- F1: 0.6048
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 3e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 1337
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- training_steps: 10000
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | F1     |
+|:-------------:|:------:|:----:|:---------------:|:------:|
+| 0.1165        | 0.0126 | 50   | 0.0642          | 0.4177 |
+| 0.0942        | 0.0252 | 100  | 0.0485          | 0.4772 |
+| 0.1076        | 0.0379 | 150  | 0.0584          | 0.4643 |
+| 0.1103        | 0.0505 | 200  | 0.0446          | nan    |
+| 0.0873        | 0.0631 | 250  | 0.0518          | 0.5313 |
+| 0.1053        | 0.0757 | 300  | 0.0736          | 0.5329 |
+| 0.0797        | 0.0884 | 350  | 0.0726          | 0.5326 |
+| 0.0857        | 0.1010 | 400  | 0.0693          | 0.5498 |
+| 0.0885        | 0.1136 | 450  | 0.0917          | nan    |
+| 0.102         | 0.1262 | 500  | 0.0580          | 0.5649 |
+| 0.0716        | 0.1389 | 550  | 0.0797          | 0.5381 |
+| 0.0854        | 0.1515 | 600  | 0.0744          | 0.5718 |
+| 0.089         | 0.1641 | 650  | 0.0504          | 0.5790 |
+| 0.0721        | 0.1767 | 700  | 0.0618          | 0.5727 |
+| 0.0721        | 0.1893 | 750  | 0.0703          | 0.5904 |
+| 0.0865        | 0.2020 | 800  | 0.0588          | 0.5953 |
+| 0.0767        | 0.2146 | 850  | 0.0437          | 0.5918 |
+| 0.0773        | 0.2272 | 900  | 0.0568          | 0.5957 |
+| 0.0748        | 0.2398 | 950  | 0.0465          | 0.5942 |
+| 0.0761        | 0.2525 | 1000 | 0.0660          | nan    |
+| 0.0855        | 0.2651 | 1050 | 0.0491          | 0.5964 |
+| 0.0832        | 0.2777 | 1100 | 0.0498          | 0.6048 |
+| 0.0821        | 0.2903 | 1150 | 0.0597          | 0.6032 |
+| 0.0715        | 0.3030 | 1200 | 0.0643          | nan    |
+| 0.085         | 0.3156 | 1250 | 0.0659          | 0.6054 |
+| 0.0826        | 0.3282 | 1300 | 0.0556          | 0.6012 |
+| 0.064         | 0.3408 | 1350 | 0.0564          | nan    |
+| 0.0854        | 0.3534 | 1400 | 0.0552          | nan    |
+| 0.0702        | 0.3661 | 1450 | 0.0675          | 0.6061 |
+| 0.0771        | 0.3787 | 1500 | 0.0578          | nan    |
+| 0.08          | 0.3913 | 1550 | 0.0492          | nan    |
+| 0.0804        | 0.4039 | 1600 | 0.0538          | 0.6112 |
+| 0.083         | 0.4166 | 1650 | 0.0579          | 0.6048 |
+| 0.0701        | 0.4292 | 1700 | 0.0674          | 0.6045 |
+| 0.0721        | 0.4418 | 1750 | 0.0491          | 0.5979 |
+| 0.0765        | 0.4544 | 1800 | 0.0439          | nan    |
+| 0.0692        | 0.4671 | 1850 | 0.0468          | 0.6058 |
+| 0.0761        | 0.4797 | 1900 | 0.0574          | 0.6125 |
+| 0.0757        | 0.4923 | 1950 | 0.0569          | 0.6126 |
+| 0.0654        | 0.5049 | 2000 | 0.0549          | 0.6095 |
+| 0.0706        | 0.5175 | 2050 | 0.0423          | 0.6042 |
+| 0.0647        | 0.5302 | 2100 | 0.0463          | 0.6056 |
+| 0.0626        | 0.5428 | 2150 | 0.0478          | 0.6048 |
 ### Framework versions

p_object.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

prediction_reference.json CHANGED Viewed

The diff for this file is too large to render. See raw diff