End of training

Browse files

Files changed (8) hide show

README.md +88 -22
model.safetensors +1 -1
runs/Nov21_16-16-14_ca85e5befb5e/events.out.tfevents.1763741775.ca85e5befb5e.7281.0 +3 -0
runs/Nov21_16-18-04_ca85e5befb5e/events.out.tfevents.1763741885.ca85e5befb5e.8926.0 +3 -0
runs/Nov21_16-20-32_ca85e5befb5e/events.out.tfevents.1763742033.ca85e5befb5e.9692.0 +3 -0
runs/Nov21_16-28-28_ca85e5befb5e/events.out.tfevents.1763742509.ca85e5befb5e.9901.0 +3 -0
runs/Nov22_06-13-00_ca85e5befb5e/events.out.tfevents.1763791982.ca85e5befb5e.45213.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,29 +1,95 @@
-# iitb-en-indic-only-punct
-This repository contains a fine-tuned version of the IndicTrans2 (200M) model
-trained for **English (Latn) → Marathi (Deva)** translation *without punctuation*.
-### Model details
-- Base model: IndicTrans2 (200M)
-- Task: Machine Translation
-- Language pair: en_Latn → mar_Deva
-- Special modification: punctuation removed during preprocessing
-- Finetuned at IIT Bombay.
-### Training information
-Trained on custom student dataset using 🤗 Transformers.
-### Intended use
-Research, MT evaluation, academic experiments, punctuation-robust translation.
-### License
-MIT License
-### Tags
-- transformation
-- machine-translation
-- english
-- marathi
-- indic
-- iitb

+---
+library_name: transformers
+license: mit
+base_model: ai4bharat/indictrans2-en-indic-dist-200M
+tags:
+- generated_from_trainer
+metrics:
+- bleu
+model-index:
+- name: iitb_en_indic_robust_punctuation_model
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# iitb_en_indic_robust_punctuation_model
+This model is a fine-tuned version of [ai4bharat/indictrans2-en-indic-dist-200M](https://huggingface.co/ai4bharat/indictrans2-en-indic-dist-200M) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.2679
+- Bleu: 12.6319
+- Chrfpp: 35.424
+- Comet: 0.549
+- Bleurt: None
+- Gen Len: 20.8721
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 16
+- eval_batch_size: 16
+- seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- num_epochs: 8
+### Training results
+| Training Loss | Epoch  | Step   | Validation Loss | Bleu    | Chrfpp  | Comet  | Bleurt | Gen Len |
+|:-------------:|:------:|:------:|:---------------:|:-------:|:-------:|:------:|:------:|:-------:|
+| 0.4295        | 0.2530 | 6000   | 0.4148          | 9.3672  | 31.5376 | 0.531  | None   | 20.8761 |
+| 0.4049        | 0.5059 | 12000  | 0.3887          | 9.7036  | 32.0364 | 0.5341 | None   | 20.8717 |
+| 0.408         | 0.7589 | 18000  | 0.3717          | 10.0257 | 32.395  | 0.5361 | None   | 20.8778 |
+| 0.3392        | 1.0119 | 24000  | 0.3609          | 10.2988 | 32.7193 | 0.5377 | None   | 20.8761 |
+| 0.3328        | 1.2649 | 30000  | 0.3508          | 10.4288 | 32.9579 | 0.5393 | None   | 20.8767 |
+| 0.3216        | 1.5178 | 36000  | 0.3408          | 10.7134 | 33.2408 | 0.5413 | None   | 20.8727 |
+| 0.3236        | 1.7708 | 42000  | 0.3333          | 10.7915 | 33.3923 | 0.5412 | None   | 20.8762 |
+| 0.2862        | 2.0238 | 48000  | 0.3286          | 10.8948 | 33.499  | 0.5414 | None   | 20.8747 |
+| 0.293         | 2.2768 | 54000  | 0.3217          | 11.0627 | 33.6756 | 0.5426 | None   | 20.8708 |
+| 0.2839        | 2.5297 | 60000  | 0.3168          | 11.1573 | 33.8408 | 0.5432 | None   | 20.8743 |
+| 0.2758        | 2.7827 | 66000  | 0.3109          | 11.3293 | 33.9424 | 0.5433 | None   | 20.8745 |
+| 0.2667        | 3.0357 | 72000  | 0.3075          | 11.3372 | 34.0924 | 0.5441 | None   | 20.8726 |
+| 0.2618        | 3.2886 | 78000  | 0.3040          | 11.5382 | 34.275  | 0.5452 | None   | 20.871  |
+| 0.2657        | 3.5416 | 84000  | 0.2997          | 11.6458 | 34.3695 | 0.5451 | None   | 20.8744 |
+| 0.2625        | 3.7946 | 90000  | 0.2961          | 11.7085 | 34.4786 | 0.5461 | None   | 20.8709 |
+| 0.2483        | 4.0476 | 96000  | 0.2931          | 11.8339 | 34.5484 | 0.5461 | None   | 20.8726 |
+| 0.2348        | 4.3005 | 102000 | 0.2897          | 11.8966 | 34.6524 | 0.5467 | None   | 20.8713 |
+| 0.2473        | 4.5535 | 108000 | 0.2870          | 11.9908 | 34.7337 | 0.5469 | None   | 20.8717 |
+| 0.2569        | 4.8065 | 114000 | 0.2829          | 12.0335 | 34.7971 | 0.5466 | None   | 20.8748 |
+| 0.2164        | 5.0594 | 120000 | 0.2822          | 12.1516 | 34.9439 | 0.5476 | None   | 20.8711 |
+| 0.2297        | 5.3124 | 126000 | 0.2802          | 12.2298 | 35.0421 | 0.548  | None   | 20.8724 |
+| 0.2261        | 5.5654 | 132000 | 0.2784          | 12.2563 | 35.0484 | 0.5481 | None   | 20.8713 |
+| 0.224         | 5.8184 | 138000 | 0.2749          | 12.3494 | 35.1261 | 0.5478 | None   | 20.8722 |
+| 0.2108        | 6.0713 | 144000 | 0.2750          | 12.3841 | 35.1321 | 0.5478 | None   | 20.8729 |
+| 0.2259        | 6.3243 | 150000 | 0.2726          | 12.4555 | 35.2263 | 0.5485 | None   | 20.871  |
+| 0.2172        | 6.5773 | 156000 | 0.2712          | 12.5084 | 35.2688 | 0.5484 | None   | 20.8734 |
+| 0.2139        | 6.8303 | 162000 | 0.2706          | 12.5631 | 35.3595 | 0.5489 | None   | 20.8732 |
+| 0.1997        | 7.0832 | 168000 | 0.2699          | 12.5653 | 35.367  | 0.5489 | None   | 20.8736 |
+| 0.2075        | 7.3362 | 174000 | 0.2690          | 12.5846 | 35.3799 | 0.5491 | None   | 20.8711 |
+| 0.199         | 7.5892 | 180000 | 0.2686          | 12.6322 | 35.4432 | 0.5493 | None   | 20.8724 |
+| 0.204         | 7.8421 | 186000 | 0.2679          | 12.6319 | 35.424  | 0.549  | None   | 20.8721 |
+### Framework versions
+- Transformers 4.53.2
+- Pytorch 2.4.0a0+f70bd71a48.nv24.06
+- Datasets 2.21.0
+- Tokenizers 0.21.4

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:613d176af2d487574b77f897420e5bcd10ec94c1d1d361f7b7c90374245a68df
 size 847194992

 version https://git-lfs.github.com/spec/v1
+oid sha256:72a8bd9589a2304e3b169b84a1089a1cf45bfe3f83a50e66539582a602602b8f
 size 847194992

runs/Nov21_16-16-14_ca85e5befb5e/events.out.tfevents.1763741775.ca85e5befb5e.7281.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f2f43addf3965218ad2e046805f6215f5ea787f813ec1fbc7b6d508e9f442e65
+size 8327

runs/Nov21_16-18-04_ca85e5befb5e/events.out.tfevents.1763741885.ca85e5befb5e.8926.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29b55caa52e5cf05a4f83ce6a0e122bbb01554352127368eba37a709d18e6a6e
+size 6511

runs/Nov21_16-20-32_ca85e5befb5e/events.out.tfevents.1763742033.ca85e5befb5e.9692.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:731bcc42686eb532ce9fa37de279c400da1127794a704ee09b6d5dda440008c7
+size 10904

runs/Nov21_16-28-28_ca85e5befb5e/events.out.tfevents.1763742509.ca85e5befb5e.9901.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f877b9c065b0ab365240a9c6bab6621522010ce50522bce2d7b2835fe92ce64
+size 222717

runs/Nov22_06-13-00_ca85e5befb5e/events.out.tfevents.1763791982.ca85e5befb5e.45213.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:abf69f41f0080f96448fa27f41186395f490a850f8d7e537e8a6fba3f03b1fe2
+size 428372

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c6063741840fcee2f681c159929de40bfbb0b620a681194d8a28d37d265d08c
 size 5624

 version https://git-lfs.github.com/spec/v1
+oid sha256:7cf659c2a30905882e341fd27de8f3ed7015ba2b74cf877908296a0a7958d2eb
 size 5624