Aynursusuz's picture
Update README.md
32507f4 verified

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: Audio Quality Assessment
emoji: 🎵
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.2.0
app_file: app.py
pinned: false
license: mit

🎵 VyvoData: Audio Quality Assessment Demo

Unified Automatic Quality Assessment for Speech, Music, and Sound

📋 Genel Bakış

Bu Gradio demo uygulaması, VyvoData projesi için geliştirilmiş kapsamlı bir ses kalite değerlendirme aracıdır. Konuşma, müzik ve genel ses dosyalarının kalitesini otomatik olarak analiz eder ve 26 detaylı metrik sağlar.

✨ Özellikler

📊 Kalite Metrikleri (26 Adet)

Genlik ve Enerji Metrikleri

  • SNR (Signal-to-Noise Ratio): Sinyal gürültü oranı (dB)
  • RMS Energy: Sesin ortalama enerji seviyesi
  • Peak Level: Maksimum ses seviyesi (dB)
  • Crest Factor: Tepe değerinin RMS'e oranı
  • Dynamic Range: Sesin dinamik aralığı (dB)

Spektral Metrikler

  • Zero Crossing Rate: Dalga formunun sıfır geçiş oranı
  • Spectral Centroid: Frekans spektrumunun ağırlık merkezi (Hz)
  • Spectral Rolloff: Spektral enerji yoğunlaşmasının sınırı (Hz)
  • Spectral Bandwidth: Frekans spektrumunun genişliği (Hz)
  • Spectral Flatness: Spektrumun düzlük derecesi
  • Spectral Contrast: Spektral tepe ve vadi farklılıkları

Harmonik ve Perküsif Metrikler

  • Harmonic-to-Noise Ratio (HNR): Harmonik içerik oranı (dB)
  • THD (Total Harmonic Distortion): Harmonik bozulma yüzdesi (%)

Zamansal Metrikler

  • Tempo: Vuruş hızı (BPM)
  • Onset Strength: Başlangıç kuvveti ortalaması

İstatistiksel Metrikler

  • Kurtosis: Dağılımın sivrilik ölçüsü
  • Skewness: Dağılımın çarpıklık ölçüsü

Frekans Metrikleri

  • Fundamental Frequency (F0): Temel frekans (Hz)

Algısal Metrikler

  • Loudness (LUFS approx): Ses yüksekliği tahmini
  • Silence Ratio: Sessizlik oranı
  • Clipping Ratio: Distorsiyon/clipping oranı (%)

Özellik Metrikleri

  • MFCC Mean & Std Dev: Mel-frequency cepstral coefficients
  • Chroma Mean & Std Dev: Müzikal ton özellikleri

Genel Skor

  • Overall Quality Score: 0-100 arası AI-powered kalite skoru

📈 Görselleştirmeler

  1. Waveform: Zaman-genlik grafiği
  2. Spectrogram: Zaman-frekans-güç dağılımı
  3. Mel Spectrogram: İnsan işitme sistemine uyarlanmış spektrogram
  4. Spectral Features: Spektral merkez ve rolloff analizi
  5. Frequency Spectrum: Frekans dağılımı
  6. Zero Crossing Rate: ZCR zaman serisi
  7. MFCC: Mel-frequency cepstral coefficients
  8. Chromagram: Müzikal ton ve pitch sınıfı analizi

🎯 Kullanım Alanları

  • Ses kaydı kalite kontrolü
  • Müzik prodüksiyonu analizi
  • Konuşma netliği değerlendirmesi
  • Ses restorasyon öncesi/sonrası karşılaştırma
  • Podcast ve audiobook kalite kontrolü

🚀 Kullanım

  1. Ses Yükleme: Sol panelden bir ses dosyası yükleyin veya mikrofondan kayıt yapın
  2. Metrik Seçimi: Analiz etmek istediğiniz metrikleri seçin
  3. Analiz: "Analiz Et" butonuna tıklayın
  4. Sonuçları İnceleme:
    • Seçili metriklerin grafiklerini görün
    • Detaylı kalite metriklerini inceleyin
    • JSON çıktısına erişin

📊 Kalite Skoru Değerlendirmesi

Skor Aralığı Durum Açıklama
80-100 🟢 Mükemmel Profesyonel kalitede ses
60-79 🟡 İyi Kabul edilebilir kalite
40-59 🟠 Orta İyileştirme gerekebilir
0-39 🔴 Düşük Ciddi kalite sorunları

🔧 Teknik Detaylar

Desteklenen Formatlar

  • WAV, MP3, OGG, FLAC, M4A
  • Ve librosa'nın desteklediği diğer formatlar

Metrik Hesaplama

  • Amplitude Analysis: RMS, Peak, Crest Factor
  • Spectral Analysis: FFT, STFT, Mel-Spectrogram
  • Harmonic Analysis: HPSS, THD, HNR
  • Temporal Analysis: Onset, Tempo, Beat tracking
  • Perceptual Analysis: Loudness, Silence, Clipping detection
  • Feature Extraction: MFCC, Chroma, Statistical features

🔗 Bağlantılar

  • GitHub Repository: Vyvo-Labs/VyvoData
  • Paper: VyvoData araştırma makalesi
  • Demo: Bu Gradio uygulaması

📝 Lisans

MIT License - Bu proje VyvoData projesinden ilham alınarak geliştirilmiştir.


Vyvo Labs | VyvoData Framework | Powered by Gradio