MamiVenkat
/

modernbert-llm-model

Text Classification

Generated from Trainer

text-embeddings-inference

Model card Files Files and versions

Metrics Training metrics Community

MamiVenkat commited on Aug 24, 2025

Commit

f51aa62

·

verified ·

1 Parent(s): 51dd6a3

End of training

Files changed (2) hide show

README.md +11 -9
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0000
-- F1: 1.0
 ## Model description
@@ -38,28 +38,30 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 32
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:------:|
-| 0.0123        | 1.0   | 380  | 0.0011          | 0.9993 |
-| 0.0001        | 2.0   | 760  | 0.0000          | 1.0    |
-| 0.0           | 3.0   | 1140 | 0.0001          | 1.0    |
-| 0.0           | 4.0   | 1520 | 0.0000          | 1.0    |
-| 0.0           | 5.0   | 1900 | 0.0000          | 1.0    |
 ### Framework versions
 - Transformers 4.48.0.dev0
-- Pytorch 2.6.0+cu124
 - Datasets 4.0.0
 - Tokenizers 0.21.4

 This model is a fine-tuned version of [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2954
+- F1: 0.9985
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 32
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 5
+- label_smoothing_factor: 0.1
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:------:|
+| 0.2966        | 1.0   | 380  | 0.2980          | 0.9978 |
+| 0.2933        | 2.0   | 760  | 0.2952          | 0.9985 |
+| 0.2912        | 3.0   | 1140 | 0.2954          | 0.9978 |
+| 0.2912        | 4.0   | 1520 | 0.2954          | 0.9985 |
+| 0.2912        | 5.0   | 1900 | 0.2954          | 0.9985 |
 ### Framework versions
 - Transformers 4.48.0.dev0
+- Pytorch 2.8.0+cu126
 - Datasets 4.0.0
 - Tokenizers 0.21.4

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3394bb660af69749bf0a4a05249b271892eeba5c7de1352596628fe9bc8860b
 size 598442860

 version https://git-lfs.github.com/spec/v1
+oid sha256:a6aeb765a70b605bbd8c622ee5edfe4adafb31bd3861011ed11e936970f396d8
 size 598442860