prakod
/

codemix-test

text2text-generation

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

prakod commited on May 28, 2025

Commit

d492ad7

·

verified ·

1 Parent(s): 8b0188c

Model save

Files changed (3) hide show

README.md +2 -14
generation_config.json +1 -0
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -3,8 +3,6 @@ library_name: transformers
 base_model: ai4bharat/IndicBART
 tags:
 - generated_from_trainer
-metrics:
-- bleu
 model-index:
 - name: codemix-test
   results: []
@@ -16,10 +14,6 @@ should probably proofread and complete it, then remove this comment. -->
 # codemix-test
 This model is a fine-tuned version of [ai4bharat/IndicBART](https://huggingface.co/ai4bharat/IndicBART) on the None dataset.
-It achieves the following results on the evaluation set:
-- Loss: 0.6472
-- Bleu: 30.874
-- Gen Len: 14.395
 ## Model description
@@ -38,7 +32,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -46,16 +40,10 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 64
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 3
-- mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Bleu    | Gen Len |
-|:-------------:|:------:|:----:|:---------------:|:-------:|:-------:|
-| 7.0739        | 0.9965 | 500  | 3.9011          | 25.8809 | 21.0    |
-| 2.6832        | 1.9945 | 1000 | 1.1507          | 31.3951 | 14.701  |
-| 1.0226        | 2.9925 | 1500 | 0.6472          | 30.874  | 14.395  |
 ### Framework versions

 base_model: ai4bharat/IndicBART
 tags:
 - generated_from_trainer
 model-index:
 - name: codemix-test
   results: []
 # codemix-test
 This model is a fine-tuned version of [ai4bharat/IndicBART](https://huggingface.co/ai4bharat/IndicBART) on the None dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-06
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - total_train_batch_size: 64
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 5
 ### Training results
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "bos_token_id": 64000,
   "eos_token_id": 64001,
   "forced_eos_token_id": 2,

 {
+  "_from_model_config": true,
   "bos_token_id": 64000,
   "eos_token_id": 64001,
   "forced_eos_token_id": 2,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:09138b0fbec0d22bd3def8c317c8240332e6beec2dd169911545ed5bedba8dd6
 size 976355336

 version https://git-lfs.github.com/spec/v1
+oid sha256:83ec61594eeb82c2b1f52303b9a28949f593d8da6d4ccca3840d153d934f5b1f
 size 976355336