Fine-tuned Construction Receipt Model

Browse files

Files changed (4) hide show

README.md +66 -68
model.safetensors +1 -1
tokenizer.json +3 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [DanSarm/receipt-core-model](https://huggingface.co/DanSarm/receipt-core-model) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2738
 ## Model description
@@ -41,81 +41,79 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 1000
-- mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 1.9458        | 1.0   | 25   | 0.6631          |
-| 0.6783        | 2.0   | 50   | 0.4201          |
-| 0.448         | 3.0   | 75   | 0.3256          |
-| 0.3453        | 4.0   | 100  | 0.2814          |
-| 0.2939        | 5.0   | 125  | 0.2581          |
-| 0.2389        | 6.0   | 150  | 0.2528          |
-| 0.2087        | 7.0   | 175  | 0.2462          |
-| 0.1769        | 8.0   | 200  | 0.2311          |
-| 0.1746        | 9.0   | 225  | 0.2286          |
-| 0.1488        | 10.0  | 250  | 0.2306          |
-| 0.1322        | 11.0  | 275  | 0.2275          |
-| 0.1219        | 12.0  | 300  | 0.2243          |
-| 0.1161        | 13.0  | 325  | 0.2069          |
-| 0.0984        | 14.0  | 350  | 0.2317          |
-| 0.0936        | 15.0  | 375  | 0.2312          |
-| 0.0891        | 16.0  | 400  | 0.2274          |
-| 0.0792        | 17.0  | 425  | 0.2311          |
-| 0.07          | 18.0  | 450  | 0.2399          |
-| 0.0666        | 19.0  | 475  | 0.2336          |
-| 0.0704        | 20.0  | 500  | 0.2349          |
-| 0.0644        | 21.0  | 525  | 0.2397          |
-| 0.0552        | 22.0  | 550  | 0.2434          |
-| 0.0517        | 23.0  | 575  | 0.2428          |
-| 0.0475        | 24.0  | 600  | 0.2462          |
-| 0.0453        | 25.0  | 625  | 0.2203          |
-| 0.0422        | 26.0  | 650  | 0.2264          |
-| 0.0395        | 27.0  | 675  | 0.2366          |
-| 0.0394        | 28.0  | 700  | 0.2393          |
-| 0.0361        | 29.0  | 725  | 0.2423          |
-| 0.0302        | 30.0  | 750  | 0.2480          |
-| 0.0317        | 31.0  | 775  | 0.2441          |
-| 0.0265        | 32.0  | 800  | 0.2519          |
-| 0.027         | 33.0  | 825  | 0.2541          |
-| 0.027         | 34.0  | 850  | 0.2512          |
-| 0.0266        | 35.0  | 875  | 0.2590          |
-| 0.0246        | 36.0  | 900  | 0.2319          |
-| 0.023         | 37.0  | 925  | 0.2419          |
-| 0.0195        | 38.0  | 950  | 0.2473          |
-| 0.0206        | 39.0  | 975  | 0.2471          |
-| 0.019         | 40.0  | 1000 | 0.2485          |
-| 0.0175        | 41.0  | 1025 | 0.2635          |
-| 0.0163        | 42.0  | 1050 | 0.2513          |
-| 0.0185        | 43.0  | 1075 | 0.2618          |
-| 0.0167        | 44.0  | 1100 | 0.2549          |
-| 0.0161        | 45.0  | 1125 | 0.2540          |
-| 0.0163        | 46.0  | 1150 | 0.2543          |
-| 0.0149        | 47.0  | 1175 | 0.2482          |
-| 0.016         | 48.0  | 1200 | 0.2487          |
-| 0.0134        | 49.0  | 1225 | 0.2572          |
-| 0.0136        | 50.0  | 1250 | 0.2589          |
-| 0.0141        | 51.0  | 1275 | 0.2512          |
-| 0.0108        | 52.0  | 1300 | 0.2565          |
-| 0.011         | 53.0  | 1325 | 0.2512          |
-| 0.0094        | 54.0  | 1350 | 0.2588          |
-| 0.0132        | 55.0  | 1375 | 0.2515          |
-| 0.0125        | 56.0  | 1400 | 0.2597          |
-| 0.0118        | 57.0  | 1425 | 0.2601          |
-| 0.0097        | 58.0  | 1450 | 0.2579          |
-| 0.0098        | 59.0  | 1475 | 0.2586          |
-| 0.0083        | 60.0  | 1500 | 0.2821          |
-| 0.0081        | 61.0  | 1525 | 0.2811          |
-| 0.0081        | 62.0  | 1550 | 0.2633          |
-| 0.0078        | 63.0  | 1575 | 0.2738          |
 ### Framework versions
 - Transformers 4.49.0
 - Pytorch 2.6.0+cu124
-- Datasets 3.3.1
-- Tokenizers 0.21.0

 This model is a fine-tuned version of [DanSarm/receipt-core-model](https://huggingface.co/DanSarm/receipt-core-model) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2616
 ## Model description
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 500
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 1.3079        | 1.0   | 44   | 0.4549          |
+| 0.4772        | 2.0   | 88   | 0.3239          |
+| 0.3391        | 3.0   | 132  | 0.2757          |
+| 0.2673        | 4.0   | 176  | 0.2483          |
+| 0.2231        | 5.0   | 220  | 0.2324          |
+| 0.1909        | 6.0   | 264  | 0.2200          |
+| 0.1688        | 7.0   | 308  | 0.2094          |
+| 0.1511        | 8.0   | 352  | 0.2051          |
+| 0.1343        | 9.0   | 396  | 0.2102          |
+| 0.1248        | 10.0  | 440  | 0.1969          |
+| 0.1129        | 11.0  | 484  | 0.2020          |
+| 0.1042        | 12.0  | 528  | 0.1937          |
+| 0.0953        | 13.0  | 572  | 0.2084          |
+| 0.0871        | 14.0  | 616  | 0.2120          |
+| 0.0879        | 15.0  | 660  | 0.2149          |
+| 0.0789        | 16.0  | 704  | 0.2104          |
+| 0.0771        | 17.0  | 748  | 0.2206          |
+| 0.067         | 18.0  | 792  | 0.2162          |
+| 0.0644        | 19.0  | 836  | 0.2176          |
+| 0.0572        | 20.0  | 880  | 0.2225          |
+| 0.0538        | 21.0  | 924  | 0.2258          |
+| 0.0552        | 22.0  | 968  | 0.2223          |
+| 0.0516        | 23.0  | 1012 | 0.2228          |
+| 0.0444        | 24.0  | 1056 | 0.2273          |
+| 0.0398        | 25.0  | 1100 | 0.2279          |
+| 0.0388        | 26.0  | 1144 | 0.2264          |
+| 0.0377        | 27.0  | 1188 | 0.2261          |
+| 0.0344        | 28.0  | 1232 | 0.2305          |
+| 0.0323        | 29.0  | 1276 | 0.2415          |
+| 0.0296        | 30.0  | 1320 | 0.2364          |
+| 0.0297        | 31.0  | 1364 | 0.2434          |
+| 0.0268        | 32.0  | 1408 | 0.2391          |
+| 0.0232        | 33.0  | 1452 | 0.2384          |
+| 0.0226        | 34.0  | 1496 | 0.2370          |
+| 0.022         | 35.0  | 1540 | 0.2401          |
+| 0.0218        | 36.0  | 1584 | 0.2355          |
+| 0.0222        | 37.0  | 1628 | 0.2384          |
+| 0.0185        | 38.0  | 1672 | 0.2289          |
+| 0.0169        | 39.0  | 1716 | 0.2419          |
+| 0.0172        | 40.0  | 1760 | 0.2434          |
+| 0.0149        | 41.0  | 1804 | 0.2515          |
+| 0.0143        | 42.0  | 1848 | 0.2405          |
+| 0.0133        | 43.0  | 1892 | 0.2493          |
+| 0.0151        | 44.0  | 1936 | 0.2440          |
+| 0.0117        | 45.0  | 1980 | 0.2458          |
+| 0.011         | 46.0  | 2024 | 0.2501          |
+| 0.01          | 47.0  | 2068 | 0.2546          |
+| 0.0102        | 48.0  | 2112 | 0.2501          |
+| 0.0099        | 49.0  | 2156 | 0.2542          |
+| 0.01          | 50.0  | 2200 | 0.2647          |
+| 0.0098        | 51.0  | 2244 | 0.2525          |
+| 0.0105        | 52.0  | 2288 | 0.2569          |
+| 0.0076        | 53.0  | 2332 | 0.2586          |
+| 0.0087        | 54.0  | 2376 | 0.2648          |
+| 0.0109        | 55.0  | 2420 | 0.2599          |
+| 0.0087        | 56.0  | 2464 | 0.2537          |
+| 0.0103        | 57.0  | 2508 | 0.2536          |
+| 0.0075        | 58.0  | 2552 | 0.2607          |
+| 0.0078        | 59.0  | 2596 | 0.2620          |
+| 0.0055        | 60.0  | 2640 | 0.2629          |
+| 0.0071        | 61.0  | 2684 | 0.2608          |
+| 0.007         | 62.0  | 2728 | 0.2616          |
 ### Framework versions
 - Transformers 4.49.0
 - Pytorch 2.6.0+cu124
+- Datasets 3.4.1
+- Tokenizers 0.21.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22194e837198408c893d67c727c0776bb8cac42c3eb2fe6486900c4e6b45987f
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d82b2a83cc59f2599b15fff94a0e29335ce941ea39c2c771940fb0ec28a0f25
 size 891644712

tokenizer.json CHANGED Viewed

@@ -7,7 +7,9 @@
     "stride": 0
   },
   "padding": {
-    "strategy": "BatchLongest",
     "direction": "Right",
     "pad_to_multiple_of": null,
     "pad_id": 0,

     "stride": 0
   },
   "padding": {
+    "strategy": {
+      "Fixed": 128
+    },
     "direction": "Right",
     "pad_to_multiple_of": null,
     "pad_id": 0,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b78e866639e360525130aceb768ecc0b4d5663acea3fae8b817631cb40018b73
-size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f8ef3dc419004156b9b0e465ddaf08fc9a7f9aedf41e1a02ce69bf5b1b13603
+size 5496