model_5M_large_ds_masking_0.2_predicted_hparamas

Browse files

Files changed (3) hide show

README.md +38 -39
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,8 +16,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2523
-- Accuracy: 0.9142
 ## Model description
@@ -52,43 +52,42 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| No log        | 0      | 0    | 4.4578          | 0.0029   |
-| No log        | 0.0044 | 122  | 1.0031          | 0.6944   |
-| No log        | 0.0087 | 244  | 0.6903          | 0.7791   |
-| No log        | 0.0131 | 366  | 0.5695          | 0.8139   |
-| No log        | 0.0175 | 488  | 0.5445          | 0.8215   |
-| 8.1688        | 0.0218 | 610  | 0.5206          | 0.8292   |
-| 8.1688        | 0.0262 | 732  | 0.4568          | 0.8489   |
-| 8.1688        | 0.0306 | 854  | 0.4226          | 0.8600   |
-| 8.1688        | 0.0349 | 976  | 0.3945          | 0.8684   |
-| 4.0756        | 0.0393 | 1098 | 0.3686          | 0.8767   |
-| 4.0756        | 0.0437 | 1220 | 0.3483          | 0.8831   |
-| 4.0756        | 0.0480 | 1342 | 0.3363          | 0.8869   |
-| 4.0756        | 0.0524 | 1464 | 0.3249          | 0.8906   |
-| 2.945         | 0.0568 | 1586 | 0.3184          | 0.8928   |
-| 2.945         | 0.0611 | 1708 | 0.3092          | 0.8954   |
-| 2.945         | 0.0655 | 1830 | 0.3072          | 0.8962   |
-| 2.945         | 0.0699 | 1952 | 0.2999          | 0.8985   |
-| 2.5794        | 0.0743 | 2074 | 0.2950          | 0.9002   |
-| 2.5794        | 0.0786 | 2196 | 0.2924          | 0.9008   |
-| 2.5794        | 0.0830 | 2318 | 0.2876          | 0.9022   |
-| 2.5794        | 0.0874 | 2440 | 0.2836          | 0.9036   |
-| 2.4062        | 0.0917 | 2562 | 0.2790          | 0.9052   |
-| 2.4062        | 0.0961 | 2684 | 0.2764          | 0.9062   |
-| 2.4062        | 0.1005 | 2806 | 0.2759          | 0.9061   |
-| 2.4062        | 0.1048 | 2928 | 0.2735          | 0.9070   |
-| 2.3491        | 0.1092 | 3050 | 0.2710          | 0.9080   |
-| 2.3491        | 0.1136 | 3172 | 0.2669          | 0.9093   |
-| 2.3491        | 0.1179 | 3294 | 0.2656          | 0.9096   |
-| 2.3491        | 0.1223 | 3416 | 0.2644          | 0.9100   |
-| 2.2145        | 0.1267 | 3538 | 0.2615          | 0.9112   |
-| 2.2145        | 0.1310 | 3660 | 0.2603          | 0.9113   |
-| 2.2145        | 0.1354 | 3782 | 0.2563          | 0.9129   |
-| 2.2145        | 0.1398 | 3904 | 0.2553          | 0.9131   |
-| 2.1421        | 0.1441 | 4026 | 0.2527          | 0.9141   |
-| 2.1421        | 0.1485 | 4148 | 0.2503          | 0.9148   |
-| 2.1421        | 0.1529 | 4270 | 0.2516          | 0.9143   |
-| 2.1421        | 0.1572 | 4392 | 0.2515          | 0.9141   |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1505
+- Accuracy: 0.9476
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| No log        | 0      | 0    | 4.4418          | 0.0139   |
+| No log        | 0.0044 | 122  | 0.7610          | 0.7639   |
+| No log        | 0.0087 | 244  | 0.4993          | 0.8385   |
+| No log        | 0.0131 | 366  | 0.3921          | 0.8712   |
+| No log        | 0.0175 | 488  | 0.3668          | 0.8783   |
+| 6.5788        | 0.0218 | 610  | 0.3430          | 0.8860   |
+| 6.5788        | 0.0262 | 732  | 0.3129          | 0.8956   |
+| 6.5788        | 0.0306 | 854  | 0.2956          | 0.9016   |
+| 6.5788        | 0.0349 | 976  | 0.2694          | 0.9090   |
+| 2.8797        | 0.0393 | 1098 | 0.2481          | 0.9166   |
+| 2.8797        | 0.0437 | 1220 | 0.2353          | 0.9206   |
+| 2.8797        | 0.0480 | 1342 | 0.2224          | 0.9242   |
+| 2.8797        | 0.0524 | 1464 | 0.2115          | 0.9281   |
+| 1.9967        | 0.0568 | 1586 | 0.2092          | 0.9287   |
+| 1.9967        | 0.0611 | 1708 | 0.1998          | 0.9312   |
+| 1.9967        | 0.0655 | 1830 | 0.1976          | 0.9322   |
+| 1.9967        | 0.0699 | 1952 | 0.1908          | 0.9346   |
+| 1.6721        | 0.0743 | 2074 | 0.1862          | 0.9360   |
+| 1.6721        | 0.0786 | 2196 | 0.1825          | 0.9370   |
+| 1.6721        | 0.0830 | 2318 | 0.1812          | 0.9378   |
+| 1.6721        | 0.0874 | 2440 | 0.1747          | 0.9398   |
+| 1.5178        | 0.0917 | 2562 | 0.1755          | 0.9396   |
+| 1.5178        | 0.0961 | 2684 | 0.1730          | 0.9404   |
+| 1.5178        | 0.1005 | 2806 | 0.1719          | 0.9406   |
+| 1.5178        | 0.1048 | 2928 | 0.1686          | 0.9416   |
+| 1.4607        | 0.1092 | 3050 | 0.1682          | 0.9419   |
+| 1.4607        | 0.1136 | 3172 | 0.1644          | 0.9431   |
+| 1.4607        | 0.1179 | 3294 | 0.1640          | 0.9430   |
+| 1.4607        | 0.1223 | 3416 | 0.1613          | 0.9442   |
+| 1.3879        | 0.1267 | 3538 | 0.1615          | 0.9441   |
+| 1.3879        | 0.1310 | 3660 | 0.1593          | 0.9448   |
+| 1.3879        | 0.1354 | 3782 | 0.1551          | 0.9460   |
+| 1.3879        | 0.1398 | 3904 | 0.1555          | 0.9464   |
+| 1.3075        | 0.1441 | 4026 | 0.1519          | 0.9476   |
+| 1.3075        | 0.1485 | 4148 | 0.1515          | 0.9475   |
+| 1.3075        | 0.1529 | 4270 | 0.1505          | 0.9477   |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9db8d5b41a2151b5c2bd62514c305b449eb96ed6fed1c33eb38ac5c1fab8a48b
 size 18195880

 version https://git-lfs.github.com/spec/v1
+oid sha256:802c070ef8f72ad2b541e367123a06d4f807d87b80e70e73c76b77c44ffab8f4
 size 18195880

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ebdac9aced14dee41c7a014115093947be8f4cde7c874511e3c7acd2deeb9e4a
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:9243e47382667938593c8e5309aaee41f9dd1b236f8168472703bdad9c27ad86
 size 5905