JulesGo
/

vit_focus

@@ -14,9 +14,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0859
-- Mse: 0.1291
-- Mae: 0.3120
 ## Model description
@@ -35,7 +35,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0001
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
@@ -43,30 +43,39 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 32
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 20
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Mse    | Mae    |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|
-| No log        | 1.0   | 10   | 0.1177          | 0.1614 | 0.3476 |
-| No log        | 2.0   | 20   | 0.0932          | 0.1411 | 0.3288 |
-| No log        | 3.0   | 30   | 0.0914          | 0.1478 | 0.3351 |
-| 0.3379        | 4.0   | 40   | 0.0799          | 0.1369 | 0.3216 |
-| 0.3379        | 5.0   | 50   | 0.0773          | 0.1365 | 0.3211 |
-| 0.3379        | 6.0   | 60   | 0.0842          | 0.1413 | 0.3251 |
-| 0.3379        | 7.0   | 70   | 0.0877          | 0.1329 | 0.3170 |
-| 0.2829        | 8.0   | 80   | 0.0830          | 0.1370 | 0.3192 |
-| 0.2829        | 9.0   | 90   | 0.0827          | 0.1408 | 0.3254 |
-| 0.2829        | 10.0  | 100  | 0.0859          | 0.1291 | 0.3120 |
-| 0.2829        | 11.0  | 110  | 0.1009          | 0.1478 | 0.3309 |
-| 0.2461        | 12.0  | 120  | 0.0810          | 0.1352 | 0.3174 |
-| 0.2461        | 13.0  | 130  | 0.0837          | 0.1368 | 0.3189 |
-| 0.2461        | 14.0  | 140  | 0.0887          | 0.1410 | 0.3230 |
-| 0.2461        | 15.0  | 150  | 0.0837          | 0.1321 | 0.3139 |
-| 0.2104        | 16.0  | 160  | 0.0908          | 0.1404 | 0.3226 |
-| 0.2104        | 17.0  | 170  | 0.0857          | 0.1367 | 0.3183 |
-| 0.2104        | 18.0  | 180  | 0.0834          | 0.1351 | 0.3171 |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0609
+- Mse: 0.1301
+- Mae: 0.3117
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - total_train_batch_size: 32
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 30
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Mse    | Mae    |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|
+| No log        | 1.0   | 10   | 0.0993          | 0.1529 | 0.3380 |
+| No log        | 2.0   | 20   | 0.1050          | 0.1554 | 0.3409 |
+| No log        | 3.0   | 30   | 0.0997          | 0.1493 | 0.3352 |
+| 0.313         | 4.0   | 40   | 0.0656          | 0.1345 | 0.3157 |
+| 0.313         | 5.0   | 50   | 0.0659          | 0.1366 | 0.3203 |
+| 0.313         | 6.0   | 60   | 0.0639          | 0.1296 | 0.3119 |
+| 0.313         | 7.0   | 70   | 0.0639          | 0.1351 | 0.3178 |
+| 0.1742        | 8.0   | 80   | 0.0639          | 0.1274 | 0.3086 |
+| 0.1742        | 9.0   | 90   | 0.0728          | 0.1294 | 0.3096 |
+| 0.1742        | 10.0  | 100  | 0.0671          | 0.1330 | 0.3150 |
+| 0.1742        | 11.0  | 110  | 0.0670          | 0.1260 | 0.3067 |
+| 0.1284        | 12.0  | 120  | 0.0658          | 0.1253 | 0.3059 |
+| 0.1284        | 13.0  | 130  | 0.0641          | 0.1281 | 0.3104 |
+| 0.1284        | 14.0  | 140  | 0.0643          | 0.1289 | 0.3105 |
+| 0.1284        | 15.0  | 150  | 0.0649          | 0.1342 | 0.3172 |
+| 0.0981        | 16.0  | 160  | 0.0656          | 0.1276 | 0.3085 |
+| 0.0981        | 17.0  | 170  | 0.0627          | 0.1316 | 0.3136 |
+| 0.0981        | 18.0  | 180  | 0.0620          | 0.1343 | 0.3169 |
+| 0.0981        | 19.0  | 190  | 0.0632          | 0.1311 | 0.3129 |
+| 0.0767        | 20.0  | 200  | 0.0630          | 0.1326 | 0.3143 |
+| 0.0767        | 21.0  | 210  | 0.0641          | 0.1299 | 0.3117 |
+| 0.0767        | 22.0  | 220  | 0.0634          | 0.1294 | 0.3114 |
+| 0.0767        | 23.0  | 230  | 0.0629          | 0.1315 | 0.3130 |
+| 0.0615        | 24.0  | 240  | 0.0612          | 0.1308 | 0.3124 |
+| 0.0615        | 25.0  | 250  | 0.0599          | 0.1302 | 0.3118 |
+| 0.0615        | 26.0  | 260  | 0.0609          | 0.1313 | 0.3132 |
+| 0.0615        | 27.0  | 270  | 0.0609          | 0.1301 | 0.3117 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35efaeb9a773fd405b498a9b43bd438766510ce0d0c48f6192a6aada07e8f650
 size 97176156

 version https://git-lfs.github.com/spec/v1
+oid sha256:48f7c5a7f684c08ba478f32613b8b76b519776c876a398fe247ef8ae047246d8
 size 97176156