DanSarm
/

receipt-operations-model

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [DanSarm/receipt-core-model](https://huggingface.co/DanSarm/receipt-core-model) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1278
 ## Model description
@@ -41,71 +41,32 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 1000
-- mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.4517        | 1.0   | 19   | 0.2472          |
-| 0.1736        | 2.0   | 38   | 0.1857          |
-| 0.1242        | 3.0   | 57   | 0.1488          |
-| 0.0957        | 4.0   | 76   | 0.1314          |
-| 0.0691        | 5.0   | 95   | 0.1292          |
-| 0.0546        | 6.0   | 114  | 0.1221          |
-| 0.0456        | 7.0   | 133  | 0.1136          |
-| 0.0422        | 8.0   | 152  | 0.1116          |
-| 0.0321        | 9.0   | 171  | 0.1234          |
-| 0.0266        | 10.0  | 190  | 0.1123          |
-| 0.0228        | 11.0  | 209  | 0.1139          |
-| 0.0213        | 12.0  | 228  | 0.1122          |
-| 0.0201        | 13.0  | 247  | 0.1166          |
-| 0.0188        | 14.0  | 266  | 0.1238          |
-| 0.0146        | 15.0  | 285  | 0.1256          |
-| 0.0134        | 16.0  | 304  | 0.1186          |
-| 0.0124        | 17.0  | 323  | 0.1193          |
-| 0.0108        | 18.0  | 342  | 0.1150          |
-| 0.0084        | 19.0  | 361  | 0.1171          |
-| 0.0077        | 20.0  | 380  | 0.1216          |
-| 0.0082        | 21.0  | 399  | 0.1225          |
-| 0.0073        | 22.0  | 418  | 0.1210          |
-| 0.0066        | 23.0  | 437  | 0.1199          |
-| 0.0083        | 24.0  | 456  | 0.1170          |
-| 0.0087        | 25.0  | 475  | 0.1172          |
-| 0.0053        | 26.0  | 494  | 0.1160          |
-| 0.0061        | 27.0  | 513  | 0.1178          |
-| 0.0045        | 28.0  | 532  | 0.1169          |
-| 0.0048        | 29.0  | 551  | 0.1192          |
-| 0.0034        | 30.0  | 570  | 0.1219          |
-| 0.0032        | 31.0  | 589  | 0.1194          |
-| 0.0038        | 32.0  | 608  | 0.1230          |
-| 0.0036        | 33.0  | 627  | 0.1241          |
-| 0.0036        | 34.0  | 646  | 0.1235          |
-| 0.0039        | 35.0  | 665  | 0.1178          |
-| 0.0025        | 36.0  | 684  | 0.1174          |
-| 0.004         | 37.0  | 703  | 0.1146          |
-| 0.003         | 38.0  | 722  | 0.1148          |
-| 0.002         | 39.0  | 741  | 0.1186          |
-| 0.0026        | 40.0  | 760  | 0.1137          |
-| 0.0019        | 41.0  | 779  | 0.1134          |
-| 0.0018        | 42.0  | 798  | 0.1135          |
-| 0.0014        | 43.0  | 817  | 0.1139          |
-| 0.0019        | 44.0  | 836  | 0.1189          |
-| 0.0012        | 45.0  | 855  | 0.1153          |
-| 0.0017        | 46.0  | 874  | 0.1155          |
-| 0.0019        | 47.0  | 893  | 0.1181          |
-| 0.0013        | 48.0  | 912  | 0.1189          |
-| 0.0012        | 49.0  | 931  | 0.1231          |
-| 0.0011        | 50.0  | 950  | 0.1211          |
-| 0.0021        | 51.0  | 969  | 0.1217          |
-| 0.002         | 52.0  | 988  | 0.1235          |
-| 0.0022        | 53.0  | 1007 | 0.1193          |
-| 0.0022        | 54.0  | 1026 | 0.1185          |
-| 0.002         | 55.0  | 1045 | 0.1230          |
-| 0.0014        | 56.0  | 1064 | 0.1246          |
-| 0.0012        | 57.0  | 1083 | 0.1249          |
-| 0.0014        | 58.0  | 1102 | 0.1278          |
 ### Framework versions

 This model is a fine-tuned version of [DanSarm/receipt-core-model](https://huggingface.co/DanSarm/receipt-core-model) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0950
 ## Model description
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 20
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.3537        | 1.0   | 29   | 0.2147          |
+| 0.1355        | 2.0   | 58   | 0.1529          |
+| 0.0971        | 3.0   | 87   | 0.1183          |
+| 0.0765        | 4.0   | 116  | 0.1090          |
+| 0.0589        | 5.0   | 145  | 0.1075          |
+| 0.0538        | 6.0   | 174  | 0.1000          |
+| 0.0424        | 7.0   | 203  | 0.1012          |
+| 0.0363        | 8.0   | 232  | 0.0978          |
+| 0.0329        | 9.0   | 261  | 0.0995          |
+| 0.0289        | 10.0  | 290  | 0.0950          |
+| 0.0259        | 11.0  | 319  | 0.0972          |
+| 0.0246        | 12.0  | 348  | 0.0980          |
+| 0.0204        | 13.0  | 377  | 0.0960          |
+| 0.0195        | 14.0  | 406  | 0.0957          |
+| 0.0185        | 15.0  | 435  | 0.0955          |
+| 0.0193        | 16.0  | 464  | 0.0963          |
+| 0.0157        | 17.0  | 493  | 0.0959          |
+| 0.0149        | 18.0  | 522  | 0.0967          |
+| 0.0145        | 19.0  | 551  | 0.0973          |
+| 0.0138        | 20.0  | 580  | 0.0967          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c911e4aa8deb946a9d2079d975a098ba3ad45b4213776f7a20065972a4efc351
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:f29f5e53eb22d84a051ab40726976e6d596a5ff5f1bb9249024a33ca7e088f12
 size 891644712

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2253c33e223c464dba0a7a9af2cef236304c1f38cd6915d3d894d937bc87941
-size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:361394d111e45d4e9e6261298d94d4ff388236b2471bec8a993412e9c7354a85
+size 5496