Readme Actualizare

Browse files

Files changed (7) hide show

README.md +41 -15
pub/evaluare-common-voice-iazar.png +0 -0
pub/evaluare-common-voice.png +0 -0
pub/evaluare-iazar.png +0 -0
pub/evaluare-whisper-small.png +0 -0
pub/iazar-evaluare-toate.png +0 -0
pub/tg-2024-05-04T21:48:19.wav +0 -0

README.md CHANGED Viewed

@@ -30,28 +30,54 @@ should probably proofread and complete it, then remove this comment. -->
 # Whisper Small Ro - Iazar
-This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the Date audio colectate în cadrul proiectului TekWil dataset.
-It achieves the following results on the evaluation set:
-- Loss: 0.8207
 - Wer: 46.2651
-## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
-## Training procedure
-### Training hyperparameters
-The following hyperparameters were used during training:
 - learning_rate: 1e-05
 - train_batch_size: 16
 - eval_batch_size: 8
@@ -62,14 +88,14 @@ The following hyperparameters were used during training:
 - training_steps: 200
 - mixed_precision_training: Native AMP
-### Training results
-| Training Loss | Epoch   | Step | Validation Loss | Wer     |
 |:-------------:|:-------:|:----:|:---------------:|:-------:|
 | 0.0005        | 66.6667 | 200  | 0.8207          | 46.2651 |
-### Framework versions
 - Transformers 4.40.1
 - Pytorch 2.2.1+cu121

 # Whisper Small Ro - Iazar
+O adjustare a modelului [openai/whisper-small](https://huggingface.co/openai/whisper-small) pe Date audio colectate în cadrul proiectului TekWill.
+Obține următoarele rezultate pe setul de evaluare:
+- Pierdere: 0,8207
 - Wer: 46.2651
+## Descriere
+Este un model intenționat pentru transcrierea graiului Moldovenesc în text.
+## Datele
+Pentru antrenarea modelului s-au folosit atît date de la [Common Voice](https://huggingface.co/datasets/mozilla-foundation/common_voice_11_0), cît și [date colectate în cadrul proiectului](https://github.com/Yehoward/iazar-datacollector).
+## Performanță
+![audioul transcris](./pub/tg-2024-05-04T21:48:19.wav)
+Am făcut niște testări pe mai multe modele, ca să observăm dacă există un oarecare progres.
+![whisper small ro](./pub/evaluare-whisper-small.png)
+Transcriere de către modelul preantrenat de la Whisper.
+![whisper small ro](./pub/evaluare-common-voice.png)
+Transcriere de către modelul antrenat numai cu date de la Common Voice.
+![whisper small ro](./pub/evaluare-iazar.png)
+Transcriere de către modelul antrenat numai cu datele colectate în cadrul proiectului.
+![whisper small ro](./pub/evaluare-common-voice-iazar.png)
+Transcrierea de către modelul antrenat atît cu date de la Common Voice, cît și cu date colectate în cadrul proiectului.
+## Procedura de antrenament
+### Codul de antrenare
+Am folosit google colab pentru antrenarea modelului.
+mai multe detalii -> https://github.com/Yehoward/Iazar?tab=readme-ov-file#code_de_antrenare_iazaripynb
+### Hiperparametri de antrenament
+Următorii hiperparametri au fost utilizați în timpul antrenamentului:
 - learning_rate: 1e-05
 - train_batch_size: 16
 - eval_batch_size: 8
 - training_steps: 200
 - mixed_precision_training: Native AMP
+### Rezultate antrenament
+| Pierdere la antrenament | Epocă | Pasul | Pierdere de validare | Rata de erori a cuvintelor |
 |:-------------:|:-------:|:----:|:---------------:|:-------:|
 | 0.0005        | 66.6667 | 200  | 0.8207          | 46.2651 |
+### Versiuni cadre
 - Transformers 4.40.1
 - Pytorch 2.2.1+cu121

pub/evaluare-common-voice-iazar.png ADDED Viewed

pub/evaluare-common-voice.png ADDED Viewed

pub/evaluare-iazar.png ADDED Viewed

pub/evaluare-whisper-small.png ADDED Viewed

pub/iazar-evaluare-toate.png ADDED Viewed

pub/tg-2024-05-04T21:48:19.wav ADDED Viewed

Binary file (128 kB). View file