Spaces:

confit
/

README

Running

App Files Files Community

yangwang825 commited on Jun 20, 2024

Commit

523d629

verified ·

1 Parent(s): 1d1c2c3

Update README.md

Browse files

Files changed (1) hide show

README.md +32 -29

README.md CHANGED Viewed

@@ -17,41 +17,44 @@ ConFit is a pioneering organisation dedicated to advancing the fields of speech
 Audio classification:
-| Dataset | Classes | Task | Samples | Average Duration |
-| :---: | :---: | :---: | :---: | :---: |
-| WMMS | 32 | Multi-class | 1697 | 10.42 |
-| MSWC (English) | 271 | Multi-class | 33726 | 0.99 |
-| MSWC (Spanish) | 146 | Multi-class | 11759 | 0.99 |
-| MSWC (Indian) | 14 | Multi-class | 739 | 0.99 |
-| ESC50 | 50 | Multi-class | 2000 | 5.00 |
-| AudioSet | 527 | Multi-label | | |
-| Pianos | 8 | Multi-class | 668 | 4.86 |
-| FSD-Kaggle-2019 (curated) | 80 | Multi-label | | |
-| GTZAN | 10 | Multi-class | 930 | 30.02 |
-| Nsynth (instrument) | 11 | Multi-class | | |
-| Nsynth (pitch) | 112 | Multi-class | | |
-| CREMA-D | 6 | Multi-class | 7442 | 2.54 |
-| IEMOCAP | 4 | Multi-class | 5531 | 4.52 |
-| EmoDB | 7 | Multi-class | 535 | 2.77 |
-| EMOVO | 7 | Multi-class | 588 | 3.12 |
-| IRMAS | 11 | Multi-label | 9579 | 7.16 |
-| RAVDESS | 8 | Multi-class | 2880 | 3.70 |
-| TIMIT | 630 | Multi-class | 6300 | 3.07 |
-| LibriSpeech | 2484 | Multi-class | 21933 | 3.75 |
 Automated audio captioning:
-| Dataset | Samples | Duration |
-| :---: | :---: | :---: |
-| Music4All | | |
 Music, speech, and noise:
-| Dataset | Samples | Duration |
-| :---: | :---: | :---: |
-| MUSAN | | |
-| RIR-Noise | | |
-| ARCA23K | | |
 ## Contact Us

 Audio classification:
+| Dataset | Split Method | Classes | Task | # Clips | Average Duration | Sampling Rate |
+| :---: | :---: | :---: | :---: | :---: | :---: | :---: |
+| WMMS | TT | 32 | Multi-class | 1697 | 10.42 | 16000 |
+| MSWC (English) | TVT | 271 | Multi-class | 33726 | 0.99 | 16000 |
+| MSWC (Spanish) | TVT | 146 | Multi-class | 11759 | 0.99 | 16000 |
+| MSWC (Indian) | TVT | 14 | Multi-class | 739 | 0.99 | 16000 |
+| ESC50 | 5-fold | 50 | Multi-class | 2000 | 5.00 | 44100 |
+| UrbanSound8K | | 10 | Multi-class | | | |
+| AudioSet | | 527 | Multi-label | | | |
+| MagnaTagATune | | | Multi-label | | | |
+| Medley-solos-DB | | 8 | Multi-class | | | 44100 |
+| Pianos | TVT | 8 | Multi-class | 668 | 4.86 | 16000 |
+| FSD-Kaggle-2019 (curated) | TT | 80 | Multi-label | 9451 | 8.93 | 44100 |
+| GTZAN | TVT | 10 | Multi-class | 930 | 30.02 | 22050 |
+| Nsynth (instrument) | TVT | 11 | Multi-class | 305979 | 4.00 | 16000 |
+| Nsynth (pitch) | TVT | 112 | Multi-class | 305979 | 4.00 | 16000 |
+| CREMA-D | TVT | 6 | Multi-class | 7442 | 2.54 | 16000 |
+| IEMOCAP | 5-fold | 4 | Multi-class | 5531 | 4.52 | 16000 |
+| EmoDB | TT | 7 | Multi-class | 535 | 2.77 | 16000 |
+| EMOVO | 6-fold | 7 | Multi-class | 588 | 3.12 | 48000 |
+| IRMAS | TT | 11 | Multi-label | 9579 | 7.16 | 44100 |
+| RAVDESS | 5-fold | 8 | Multi-class | 2880 | 3.70 | 48000 |
+| TIMIT | TVT | 630 | Multi-class | 6300 | 3.07 | 16000 |
+| LibriSpeech | TT | 2484 | Multi-class | 21933 | 3.75 | 16000 |
 Automated audio captioning:
+| Dataset | # Clips | Average Duration | Sampling Rate |
+| :---: | :---: | :---: | :---: |
+| Music4All | | | |
 Music, speech, and noise:
+| Dataset | # Clips | Average Duration | Sampling Rate |
+| :---: | :---: | :---: | :---: |
+| MUSAN | 2016 | 195.16 | 16000 |
+| RIR-Noise | 61260 | 1.54 | 16000 |
+| ARCA23K | | | |
 ## Contact Us