model_5M_large_ds_masking_0.5_predicted_hparamas

Browse files

Files changed (3) hide show

README.md +39 -39
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,8 +16,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5105
-- Accuracy: 0.8309
 ## Model description
@@ -52,43 +52,43 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| No log        | 0      | 0    | 4.4023          | 0.0066   |
-| No log        | 0.0044 | 122  | 1.2619          | 0.6163   |
-| No log        | 0.0087 | 244  | 1.0124          | 0.6795   |
-| No log        | 0.0131 | 366  | 0.8866          | 0.7158   |
-| No log        | 0.0175 | 488  | 0.8865          | 0.7166   |
-| 10.5295       | 0.0218 | 610  | 0.8234          | 0.7347   |
-| 10.5295       | 0.0262 | 732  | 0.7646          | 0.7519   |
-| 10.5295       | 0.0306 | 854  | 0.7361          | 0.7603   |
-| 10.5295       | 0.0349 | 976  | 0.7118          | 0.7680   |
-| 6.5692        | 0.0393 | 1098 | 0.6775          | 0.7784   |
-| 6.5692        | 0.0437 | 1220 | 0.6562          | 0.7858   |
-| 6.5692        | 0.0480 | 1342 | 0.6391          | 0.7905   |
-| 6.5692        | 0.0524 | 1464 | 0.6223          | 0.7956   |
-| 5.4485        | 0.0568 | 1586 | 0.6140          | 0.7983   |
-| 5.4485        | 0.0611 | 1708 | 0.6021          | 0.8018   |
-| 5.4485        | 0.0655 | 1830 | 0.5968          | 0.8039   |
-| 5.4485        | 0.0699 | 1952 | 0.5881          | 0.8065   |
-| 4.9395        | 0.0743 | 2074 | 0.5793          | 0.8094   |
-| 4.9395        | 0.0786 | 2196 | 0.5739          | 0.8109   |
-| 4.9395        | 0.0830 | 2318 | 0.5707          | 0.8120   |
-| 4.9395        | 0.0874 | 2440 | 0.5638          | 0.8139   |
-| 4.6796        | 0.0917 | 2562 | 0.5605          | 0.8150   |
-| 4.6796        | 0.0961 | 2684 | 0.5514          | 0.8179   |
-| 4.6796        | 0.1005 | 2806 | 0.5520          | 0.8177   |
-| 4.6796        | 0.1048 | 2928 | 0.5496          | 0.8189   |
-| 4.5172        | 0.1092 | 3050 | 0.5424          | 0.8207   |
-| 4.5172        | 0.1136 | 3172 | 0.5391          | 0.8221   |
-| 4.5172        | 0.1179 | 3294 | 0.5362          | 0.8228   |
-| 4.5172        | 0.1223 | 3416 | 0.5327          | 0.8241   |
-| 4.3971        | 0.1267 | 3538 | 0.5295          | 0.8248   |
-| 4.3971        | 0.1310 | 3660 | 0.5259          | 0.8260   |
-| 4.3971        | 0.1354 | 3782 | 0.5238          | 0.8267   |
-| 4.3971        | 0.1398 | 3904 | 0.5195          | 0.8278   |
-| 4.3028        | 0.1441 | 4026 | 0.5200          | 0.8278   |
-| 4.3028        | 0.1485 | 4148 | 0.5150          | 0.8295   |
-| 4.3028        | 0.1529 | 4270 | 0.5160          | 0.8294   |
-| 4.3028        | 0.1572 | 4392 | 0.5140          | 0.8298   |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3546
+- Accuracy: 0.8807
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| No log        | 0      | 0    | 4.3903          | 0.0137   |
+| No log        | 0.0044 | 122  | 1.1251          | 0.6574   |
+| No log        | 0.0087 | 244  | 0.8266          | 0.7365   |
+| No log        | 0.0131 | 366  | 0.7493          | 0.7590   |
+| No log        | 0.0175 | 488  | 0.6913          | 0.7755   |
+| 9.1782        | 0.0218 | 610  | 0.6348          | 0.7927   |
+| 9.1782        | 0.0262 | 732  | 0.5897          | 0.8064   |
+| 9.1782        | 0.0306 | 854  | 0.5569          | 0.8170   |
+| 9.1782        | 0.0349 | 976  | 0.5262          | 0.8266   |
+| 5.0917        | 0.0393 | 1098 | 0.4957          | 0.8360   |
+| 5.0917        | 0.0437 | 1220 | 0.4761          | 0.8424   |
+| 5.0917        | 0.0480 | 1342 | 0.4616          | 0.8464   |
+| 5.0917        | 0.0524 | 1464 | 0.4479          | 0.8510   |
+| 4.0398        | 0.0568 | 1586 | 0.4397          | 0.8536   |
+| 4.0398        | 0.0611 | 1708 | 0.4293          | 0.8564   |
+| 4.0398        | 0.0655 | 1830 | 0.4231          | 0.8592   |
+| 4.0398        | 0.0699 | 1952 | 0.4139          | 0.8614   |
+| 3.5268        | 0.0743 | 2074 | 0.4088          | 0.8635   |
+| 3.5268        | 0.0786 | 2196 | 0.4035          | 0.8649   |
+| 3.5268        | 0.0830 | 2318 | 0.4000          | 0.8666   |
+| 3.5268        | 0.0874 | 2440 | 0.3950          | 0.8678   |
+| 3.3084        | 0.0917 | 2562 | 0.3915          | 0.8688   |
+| 3.3084        | 0.0961 | 2684 | 0.3866          | 0.8705   |
+| 3.3084        | 0.1005 | 2806 | 0.3843          | 0.8712   |
+| 3.3084        | 0.1048 | 2928 | 0.3804          | 0.8726   |
+| 3.1769        | 0.1092 | 3050 | 0.3776          | 0.8733   |
+| 3.1769        | 0.1136 | 3172 | 0.3729          | 0.8749   |
+| 3.1769        | 0.1179 | 3294 | 0.3723          | 0.8751   |
+| 3.1769        | 0.1223 | 3416 | 0.3698          | 0.8759   |
+| 3.0785        | 0.1267 | 3538 | 0.3659          | 0.8772   |
+| 3.0785        | 0.1310 | 3660 | 0.3644          | 0.8775   |
+| 3.0785        | 0.1354 | 3782 | 0.3599          | 0.8788   |
+| 3.0785        | 0.1398 | 3904 | 0.3584          | 0.8794   |
+| 2.9831        | 0.1441 | 4026 | 0.3567          | 0.8800   |
+| 2.9831        | 0.1485 | 4148 | 0.3528          | 0.8817   |
+| 2.9831        | 0.1529 | 4270 | 0.3535          | 0.8811   |
+| 2.9831        | 0.1572 | 4392 | 0.3541          | 0.8809   |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e5d7aea7006ec800dae97a3783fa1cdf6c27e1fb1126c6d0a79c8ac015643490
 size 18195880

 version https://git-lfs.github.com/spec/v1
+oid sha256:606918f4388fe79e9e2647e29eb87a837ea9c4f8a3684774be9ad7e6ff4b0cd6
 size 18195880

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f17fd9ea669ce7a724261a1d10a58c196aa0f95f6e5e105d7c2f1e6849e2a1e8
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:385f6814dec1b9e30ba5a183b4d506f225719ec3a0b4980f9196c2af493b9812
 size 5905