model_5M_large_ds_masking_0.15_predicted_hparamas

Browse files

Files changed (3) hide show

README.md +25 -38
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,8 +16,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1505
-- Accuracy: 0.9476
 ## Model description
@@ -52,42 +52,29 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| No log        | 0      | 0    | 4.4418          | 0.0139   |
-| No log        | 0.0044 | 122  | 0.7610          | 0.7639   |
-| No log        | 0.0087 | 244  | 0.4993          | 0.8385   |
-| No log        | 0.0131 | 366  | 0.3921          | 0.8712   |
-| No log        | 0.0175 | 488  | 0.3668          | 0.8783   |
-| 6.5788        | 0.0218 | 610  | 0.3430          | 0.8860   |
-| 6.5788        | 0.0262 | 732  | 0.3129          | 0.8956   |
-| 6.5788        | 0.0306 | 854  | 0.2956          | 0.9016   |
-| 6.5788        | 0.0349 | 976  | 0.2694          | 0.9090   |
-| 2.8797        | 0.0393 | 1098 | 0.2481          | 0.9166   |
-| 2.8797        | 0.0437 | 1220 | 0.2353          | 0.9206   |
-| 2.8797        | 0.0480 | 1342 | 0.2224          | 0.9242   |
-| 2.8797        | 0.0524 | 1464 | 0.2115          | 0.9281   |
-| 1.9967        | 0.0568 | 1586 | 0.2092          | 0.9287   |
-| 1.9967        | 0.0611 | 1708 | 0.1998          | 0.9312   |
-| 1.9967        | 0.0655 | 1830 | 0.1976          | 0.9322   |
-| 1.9967        | 0.0699 | 1952 | 0.1908          | 0.9346   |
-| 1.6721        | 0.0743 | 2074 | 0.1862          | 0.9360   |
-| 1.6721        | 0.0786 | 2196 | 0.1825          | 0.9370   |
-| 1.6721        | 0.0830 | 2318 | 0.1812          | 0.9378   |
-| 1.6721        | 0.0874 | 2440 | 0.1747          | 0.9398   |
-| 1.5178        | 0.0917 | 2562 | 0.1755          | 0.9396   |
-| 1.5178        | 0.0961 | 2684 | 0.1730          | 0.9404   |
-| 1.5178        | 0.1005 | 2806 | 0.1719          | 0.9406   |
-| 1.5178        | 0.1048 | 2928 | 0.1686          | 0.9416   |
-| 1.4607        | 0.1092 | 3050 | 0.1682          | 0.9419   |
-| 1.4607        | 0.1136 | 3172 | 0.1644          | 0.9431   |
-| 1.4607        | 0.1179 | 3294 | 0.1640          | 0.9430   |
-| 1.4607        | 0.1223 | 3416 | 0.1613          | 0.9442   |
-| 1.3879        | 0.1267 | 3538 | 0.1615          | 0.9441   |
-| 1.3879        | 0.1310 | 3660 | 0.1593          | 0.9448   |
-| 1.3879        | 0.1354 | 3782 | 0.1551          | 0.9460   |
-| 1.3879        | 0.1398 | 3904 | 0.1555          | 0.9464   |
-| 1.3075        | 0.1441 | 4026 | 0.1519          | 0.9476   |
-| 1.3075        | 0.1485 | 4148 | 0.1515          | 0.9475   |
-| 1.3075        | 0.1529 | 4270 | 0.1505          | 0.9477   |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1606
+- Accuracy: 0.9442
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| No log        | 0      | 0    | 4.5171          | 0.0026   |
+| No log        | 0.0044 | 122  | 0.7823          | 0.7600   |
+| No log        | 0.0087 | 244  | 0.4773          | 0.8451   |
+| No log        | 0.0131 | 366  | 0.4435          | 0.8554   |
+| No log        | 0.0175 | 488  | 0.3739          | 0.8770   |
+| 6.7174        | 0.0218 | 610  | 0.3468          | 0.8851   |
+| 6.7174        | 0.0262 | 732  | 0.3011          | 0.9001   |
+| 6.7174        | 0.0306 | 854  | 0.2789          | 0.9067   |
+| 6.7174        | 0.0349 | 976  | 0.2546          | 0.9135   |
+| 2.7623        | 0.0393 | 1098 | 0.2348          | 0.9200   |
+| 2.7623        | 0.0437 | 1220 | 0.2193          | 0.9256   |
+| 2.7623        | 0.0480 | 1342 | 0.2050          | 0.9300   |
+| 2.7623        | 0.0524 | 1464 | 0.1958          | 0.9331   |
+| 1.8687        | 0.0568 | 1586 | 0.1918          | 0.9348   |
+| 1.8687        | 0.0611 | 1708 | 0.1862          | 0.9363   |
+| 1.8687        | 0.0655 | 1830 | 0.1852          | 0.9362   |
+| 1.8687        | 0.0699 | 1952 | 0.1795          | 0.9385   |
+| 1.587         | 0.0743 | 2074 | 0.1719          | 0.9406   |
+| 1.587         | 0.0786 | 2196 | 0.1682          | 0.9420   |
+| 1.587         | 0.0830 | 2318 | 0.1672          | 0.9421   |
+| 1.587         | 0.0874 | 2440 | 0.1610          | 0.9441   |
+| 1.4413        | 0.0917 | 2562 | 0.1606          | 0.9447   |
+| 1.4413        | 0.0961 | 2684 | 0.1599          | 0.9447   |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:802c070ef8f72ad2b541e367123a06d4f807d87b80e70e73c76b77c44ffab8f4
 size 18195880

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe7643f397b632e3b16b77d6540378ff1d7180ec4fe194929231ff59b1334da9
 size 18195880

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9243e47382667938593c8e5309aaee41f9dd1b236f8168472703bdad9c27ad86
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ff875155df15d0af1b09c5af9c4d074f8b9147e963c136e7a9da5c6ef930829
 size 5905