End of training

Browse files

Files changed (6) hide show

README.md +102 -103
config.json +0 -1
model.safetensors +1 -1
runs/Mar10_16-49-46_d0c17e360eb0/events.out.tfevents.1710089386.d0c17e360eb0.144.3 +3 -0
tokenizer.json +18 -18
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,5 +1,4 @@
 ---
-base_model: Marcin1304/calculator_model_test_second_version
 tags:
 - generated_from_trainer
 model-index:
@@ -12,9 +11,9 @@ should probably proofread and complete it, then remove this comment. -->
 # calculator_model_test_second_version
-This model is a fine-tuned version of [Marcin1304/calculator_model_test_second_version](https://huggingface.co/Marcin1304/calculator_model_test_second_version) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2389
 ## Model description
@@ -45,106 +44,106 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 2.2873        | 1.0   | 6    | 1.9912          |
-| 1.5146        | 2.0   | 12   | 1.3209          |
-| 1.2285        | 3.0   | 18   | 1.1801          |
-| 1.0626        | 4.0   | 24   | 0.9960          |
-| 0.9666        | 5.0   | 30   | 0.9306          |
-| 0.97          | 6.0   | 36   | 1.0819          |
-| 0.9378        | 7.0   | 42   | 0.8703          |
-| 0.8406        | 8.0   | 48   | 0.9923          |
-| 0.8336        | 9.0   | 54   | 1.0611          |
-| 0.8993        | 10.0  | 60   | 1.0071          |
-| 0.9199        | 11.0  | 66   | 1.0511          |
-| 0.8449        | 12.0  | 72   | 0.9035          |
-| 0.8191        | 13.0  | 78   | 0.8029          |
-| 0.8255        | 14.0  | 84   | 0.8020          |
-| 0.7228        | 15.0  | 90   | 0.7840          |
-| 0.7615        | 16.0  | 96   | 0.7198          |
-| 0.7899        | 17.0  | 102  | 0.8399          |
-| 0.7886        | 18.0  | 108  | 0.8223          |
-| 0.7632        | 19.0  | 114  | 0.9763          |
-| 0.8606        | 20.0  | 120  | 0.8903          |
-| 0.8832        | 21.0  | 126  | 0.7017          |
-| 0.6498        | 22.0  | 132  | 0.7738          |
-| 0.6574        | 23.0  | 138  | 0.7236          |
-| 0.6743        | 24.0  | 144  | 0.6933          |
-| 0.7442        | 25.0  | 150  | 0.7139          |
-| 0.6502        | 26.0  | 156  | 0.7101          |
-| 0.6673        | 27.0  | 162  | 0.7023          |
-| 0.6832        | 28.0  | 168  | 0.6822          |
-| 0.6392        | 29.0  | 174  | 0.7016          |
-| 0.6422        | 30.0  | 180  | 0.6936          |
-| 0.6156        | 31.0  | 186  | 0.7276          |
-| 0.7164        | 32.0  | 192  | 0.9599          |
-| 0.756         | 33.0  | 198  | 0.6658          |
-| 0.6535        | 34.0  | 204  | 0.6337          |
-| 0.6145        | 35.0  | 210  | 0.6351          |
-| 0.6088        | 36.0  | 216  | 0.7991          |
-| 0.7964        | 37.0  | 222  | 0.7509          |
-| 0.6849        | 38.0  | 228  | 0.8377          |
-| 0.7383        | 39.0  | 234  | 0.8608          |
-| 0.7743        | 40.0  | 240  | 0.7585          |
-| 0.6994        | 41.0  | 246  | 0.6738          |
-| 0.5989        | 42.0  | 252  | 0.6800          |
-| 0.6557        | 43.0  | 258  | 0.6884          |
-| 0.6094        | 44.0  | 264  | 0.6098          |
-| 0.5702        | 45.0  | 270  | 0.5899          |
-| 0.5163        | 46.0  | 276  | 0.6388          |
-| 0.5197        | 47.0  | 282  | 0.5813          |
-| 0.533         | 48.0  | 288  | 0.5542          |
-| 0.5098        | 49.0  | 294  | 0.6037          |
-| 0.5744        | 50.0  | 300  | 0.5459          |
-| 0.5406        | 51.0  | 306  | 0.4853          |
-| 0.4949        | 52.0  | 312  | 0.5002          |
-| 0.5339        | 53.0  | 318  | 0.4890          |
-| 0.4816        | 54.0  | 324  | 0.5177          |
-| 0.4628        | 55.0  | 330  | 0.6028          |
-| 0.6122        | 56.0  | 336  | 0.6144          |
-| 0.5971        | 57.0  | 342  | 0.5610          |
-| 0.4972        | 58.0  | 348  | 0.4756          |
-| 0.4366        | 59.0  | 354  | 0.5127          |
-| 0.4997        | 60.0  | 360  | 0.4715          |
-| 0.438         | 61.0  | 366  | 0.4521          |
-| 0.4767        | 62.0  | 372  | 0.4349          |
-| 0.412         | 63.0  | 378  | 0.4219          |
-| 0.4277        | 64.0  | 384  | 0.4291          |
-| 0.4438        | 65.0  | 390  | 0.4336          |
-| 0.4469        | 66.0  | 396  | 0.4069          |
-| 0.411         | 67.0  | 402  | 0.4527          |
-| 0.4254        | 68.0  | 408  | 0.4175          |
-| 0.4065        | 69.0  | 414  | 0.4491          |
-| 0.4622        | 70.0  | 420  | 0.5119          |
-| 0.4282        | 71.0  | 426  | 0.4622          |
-| 0.4039        | 72.0  | 432  | 0.4182          |
-| 0.3895        | 73.0  | 438  | 0.3957          |
-| 0.3855        | 74.0  | 444  | 0.3803          |
-| 0.3831        | 75.0  | 450  | 0.3974          |
-| 0.3929        | 76.0  | 456  | 0.3644          |
-| 0.3427        | 77.0  | 462  | 0.4010          |
-| 0.4154        | 78.0  | 468  | 0.3790          |
-| 0.3531        | 79.0  | 474  | 0.3431          |
-| 0.3188        | 80.0  | 480  | 0.3468          |
-| 0.3318        | 81.0  | 486  | 0.3372          |
-| 0.4482        | 82.0  | 492  | 0.3205          |
-| 0.3545        | 83.0  | 498  | 0.3224          |
-| 0.3746        | 84.0  | 504  | 0.3176          |
-| 0.3518        | 85.0  | 510  | 0.3004          |
-| 0.3093        | 86.0  | 516  | 0.3007          |
-| 0.2869        | 87.0  | 522  | 0.2944          |
-| 0.3496        | 88.0  | 528  | 0.2786          |
-| 0.314         | 89.0  | 534  | 0.2811          |
-| 0.3336        | 90.0  | 540  | 0.2715          |
-| 0.2944        | 91.0  | 546  | 0.2637          |
-| 0.2578        | 92.0  | 552  | 0.2534          |
-| 0.2688        | 93.0  | 558  | 0.2583          |
-| 0.2726        | 94.0  | 564  | 0.2568          |
-| 0.2723        | 95.0  | 570  | 0.2487          |
-| 0.2621        | 96.0  | 576  | 0.2543          |
-| 0.2512        | 97.0  | 582  | 0.2403          |
-| 0.2427        | 98.0  | 588  | 0.2397          |
-| 0.2482        | 99.0  | 594  | 0.2399          |
-| 0.2797        | 100.0 | 600  | 0.2389          |
 ### Framework versions

 ---
 tags:
 - generated_from_trainer
 model-index:
 # calculator_model_test_second_version
+This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1239
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.4193        | 1.0   | 6    | 2.7303          |
+| 2.3495        | 2.0   | 12   | 1.9121          |
+| 1.7677        | 3.0   | 18   | 1.6227          |
+| 1.6093        | 4.0   | 24   | 1.5830          |
+| 1.5528        | 5.0   | 30   | 1.5309          |
+| 1.5114        | 6.0   | 36   | 1.4526          |
+| 1.4513        | 7.0   | 42   | 1.3988          |
+| 1.4022        | 8.0   | 48   | 1.3442          |
+| 1.3473        | 9.0   | 54   | 1.2809          |
+| 1.2985        | 10.0  | 60   | 1.2159          |
+| 1.2173        | 11.0  | 66   | 1.1870          |
+| 1.1373        | 12.0  | 72   | 1.0899          |
+| 1.0855        | 13.0  | 78   | 1.0270          |
+| 1.04          | 14.0  | 84   | 0.9607          |
+| 1.0274        | 15.0  | 90   | 0.9749          |
+| 0.9975        | 16.0  | 96   | 0.9045          |
+| 0.9274        | 17.0  | 102  | 0.9247          |
+| 0.8963        | 18.0  | 108  | 0.8161          |
+| 0.8767        | 19.0  | 114  | 0.8131          |
+| 0.8764        | 20.0  | 120  | 0.9056          |
+| 0.8763        | 21.0  | 126  | 0.7668          |
+| 0.8097        | 22.0  | 132  | 0.8305          |
+| 0.8           | 23.0  | 138  | 0.7579          |
+| 0.7483        | 24.0  | 144  | 0.7418          |
+| 0.8242        | 25.0  | 150  | 0.7103          |
+| 0.7375        | 26.0  | 156  | 0.6743          |
+| 0.7078        | 27.0  | 162  | 0.6516          |
+| 0.7112        | 28.0  | 168  | 0.7178          |
+| 0.7518        | 29.0  | 174  | 0.7132          |
+| 0.6874        | 30.0  | 180  | 0.6438          |
+| 0.6671        | 31.0  | 186  | 0.6512          |
+| 0.6595        | 32.0  | 192  | 0.6338          |
+| 0.6375        | 33.0  | 198  | 0.5772          |
+| 0.5933        | 34.0  | 204  | 0.5397          |
+| 0.5938        | 35.0  | 210  | 0.5182          |
+| 0.5818        | 36.0  | 216  | 0.5315          |
+| 0.6946        | 37.0  | 222  | 0.9134          |
+| 0.7946        | 38.0  | 228  | 0.7031          |
+| 0.7079        | 39.0  | 234  | 0.6212          |
+| 0.6055        | 40.0  | 240  | 0.5024          |
+| 0.5524        | 41.0  | 246  | 0.5142          |
+| 0.543         | 42.0  | 252  | 0.4946          |
+| 0.5265        | 43.0  | 258  | 0.4820          |
+| 0.5339        | 44.0  | 264  | 0.6029          |
+| 0.5624        | 45.0  | 270  | 0.5800          |
+| 0.5097        | 46.0  | 276  | 0.4858          |
+| 0.5059        | 47.0  | 282  | 0.4554          |
+| 0.4807        | 48.0  | 288  | 0.4538          |
+| 0.4824        | 49.0  | 294  | 0.4248          |
+| 0.4691        | 50.0  | 300  | 0.3919          |
+| 0.5413        | 51.0  | 306  | 0.5179          |
+| 0.5131        | 52.0  | 312  | 0.3809          |
+| 0.4312        | 53.0  | 318  | 0.3955          |
+| 0.4226        | 54.0  | 324  | 0.3597          |
+| 0.4059        | 55.0  | 330  | 0.3501          |
+| 0.3887        | 56.0  | 336  | 0.3281          |
+| 0.3784        | 57.0  | 342  | 0.3294          |
+| 0.3696        | 58.0  | 348  | 0.2937          |
+| 0.3694        | 59.0  | 354  | 0.3153          |
+| 0.3815        | 60.0  | 360  | 0.2878          |
+| 0.3575        | 61.0  | 366  | 0.3236          |
+| 0.3527        | 62.0  | 372  | 0.2940          |
+| 0.3481        | 63.0  | 378  | 0.2703          |
+| 0.3466        | 64.0  | 384  | 0.3331          |
+| 0.4037        | 65.0  | 390  | 0.3615          |
+| 0.363         | 66.0  | 396  | 0.3057          |
+| 0.3374        | 67.0  | 402  | 0.2810          |
+| 0.3256        | 68.0  | 408  | 0.2785          |
+| 0.3206        | 69.0  | 414  | 0.2553          |
+| 0.306         | 70.0  | 420  | 0.2336          |
+| 0.2884        | 71.0  | 426  | 0.2361          |
+| 0.2892        | 72.0  | 432  | 0.2257          |
+| 0.275         | 73.0  | 438  | 0.2237          |
+| 0.2968        | 74.0  | 444  | 0.2405          |
+| 0.2879        | 75.0  | 450  | 0.2139          |
+| 0.2832        | 76.0  | 456  | 0.2139          |
+| 0.2726        | 77.0  | 462  | 0.2174          |
+| 0.2687        | 78.0  | 468  | 0.2037          |
+| 0.2609        | 79.0  | 474  | 0.1833          |
+| 0.2518        | 80.0  | 480  | 0.1836          |
+| 0.253         | 81.0  | 486  | 0.1861          |
+| 0.2417        | 82.0  | 492  | 0.1650          |
+| 0.2279        | 83.0  | 498  | 0.1706          |
+| 0.2323        | 84.0  | 504  | 0.1785          |
+| 0.225         | 85.0  | 510  | 0.1694          |
+| 0.2194        | 86.0  | 516  | 0.1586          |
+| 0.2217        | 87.0  | 522  | 0.1575          |
+| 0.2093        | 88.0  | 528  | 0.1497          |
+| 0.2109        | 89.0  | 534  | 0.1562          |
+| 0.2081        | 90.0  | 540  | 0.1549          |
+| 0.2027        | 91.0  | 546  | 0.1419          |
+| 0.1982        | 92.0  | 552  | 0.1347          |
+| 0.1951        | 93.0  | 558  | 0.1355          |
+| 0.1893        | 94.0  | 564  | 0.1338          |
+| 0.1881        | 95.0  | 570  | 0.1336          |
+| 0.1911        | 96.0  | 576  | 0.1303          |
+| 0.1862        | 97.0  | 582  | 0.1289          |
+| 0.1882        | 98.0  | 588  | 0.1301          |
+| 0.1792        | 99.0  | 594  | 0.1250          |
+| 0.176         | 100.0 | 600  | 0.1239          |
 ### Framework versions

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "Marcin1304/calculator_model_test_second_version",
   "architectures": [
     "EncoderDecoderModel"
   ],

 {
   "architectures": [
     "EncoderDecoderModel"
   ],

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3b28e666d29c5c7b00df5675bc551dacacdce5b0b220df390da21c8441cfea4
 size 31207604

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a905feeabc9c81f0b25326160ef494abc4e4a552b3464073d72745417f3b87b
 size 31207604

runs/Mar10_16-49-46_d0c17e360eb0/events.out.tfevents.1710089386.d0c17e360eb0.144.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca2b4abe7646ffee89092aaac16cc99695d7fb22f2e6959ea92ce2447a040291
+size 56963

tokenizer.json CHANGED Viewed

@@ -115,34 +115,34 @@
       "=": 16,
       "10": 17,
       "99": 18,
-      "98": 19,
-      "11": 20,
       "12": 21,
       "97": 22,
       "13": 23,
       "96": 24,
-      "95": 25,
-      "14": 26,
       "15": 27,
       "94": 28,
-      "93": 29,
-      "16": 30,
-      "92": 31,
-      "17": 32,
       "18": 33,
       "91": 34,
       "19": 35,
       "90": 36,
-      "89": 37,
-      "20": 38,
       "21": 39,
       "88": 40,
       "22": 41,
       "87": 42,
       "23": 43,
       "86": 44,
-      "85": 45,
-      "24": 46,
       "25": 47,
       "84": 48,
       "26": 49,
@@ -153,34 +153,34 @@
     "merges": [
       "1 0",
       "9 9",
-      "9 8",
       "1 1",
       "1 2",
       "9 7",
       "1 3",
       "9 6",
-      "9 5",
       "1 4",
       "1 5",
       "9 4",
-      "9 3",
       "1 6",
-      "9 2",
       "1 7",
       "1 8",
       "9 1",
       "1 9",
       "9 0",
-      "8 9",
       "2 0",
       "2 1",
       "8 8",
       "2 2",
       "8 7",
       "2 3",
       "8 6",
-      "8 5",
       "2 4",
       "2 5",
       "8 4",
       "2 6",

       "=": 16,
       "10": 17,
       "99": 18,
+      "11": 19,
+      "98": 20,
       "12": 21,
       "97": 22,
       "13": 23,
       "96": 24,
+      "14": 25,
+      "95": 26,
       "15": 27,
       "94": 28,
+      "16": 29,
+      "93": 30,
+      "17": 31,
+      "92": 32,
       "18": 33,
       "91": 34,
       "19": 35,
       "90": 36,
+      "20": 37,
+      "89": 38,
       "21": 39,
       "88": 40,
       "22": 41,
       "87": 42,
       "23": 43,
       "86": 44,
+      "24": 45,
+      "85": 46,
       "25": 47,
       "84": 48,
       "26": 49,
     "merges": [
       "1 0",
       "9 9",
       "1 1",
+      "9 8",
       "1 2",
       "9 7",
       "1 3",
       "9 6",
       "1 4",
+      "9 5",
       "1 5",
       "9 4",
       "1 6",
+      "9 3",
       "1 7",
+      "9 2",
       "1 8",
       "9 1",
       "1 9",
       "9 0",
       "2 0",
+      "8 9",
       "2 1",
       "8 8",
       "2 2",
       "8 7",
       "2 3",
       "8 6",
       "2 4",
+      "8 5",
       "2 5",
       "8 4",
       "2 6",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ccdf611c06fe9eca36b65af10df63a7dc7b3021668b537fc76ed6fca0b2c36c
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a20c9478f127efcc47208f649d6556492aa8d0790902940f60b7e5ea7d0ce58
 size 5112