multi-speaker-dub / README.md
ziffir's picture
Update README.md
743550b verified

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: Advanced Multi-Speaker Realtime Dub
emoji: 🎭
colorFrom: pink
colorTo: blue
sdk: gradio
sdk_version: 6.5.1
app_file: app.py
pinned: false
license: apache-2.0
hardware: gpu-t4

🎭 Gelişmiş Çoklu Konuşmacı Realtime Dublaj

Özellikler

  • Çoklu Konuşmacı Desteği: 2+ kişi aynı anda
  • Cinsiyet Tespiti: Kadın/Erkek otomatik ayırma
  • Cinsiyet Koruma: Çeviri sonrası ses karakteri korunur
  • Gerçek Zamanlı: Mikrofon anlık çeviri
  • Dosya Modu: Video/ses dosyası yükleme
  • Senkronize Mix: Zamanlamalı profesyonel mix

Kullanım

Dosya Modu

  1. Video veya ses dosyası yükle
  2. Hedef dil seç (TR, EN, DE, vs.)
  3. "Dublajı Başlat" butonuna tıkla
  4. Her konuşmacı ayrı cinsiyet sesiyle konuşur!

Realtime Modu

  1. Mikrofon izni ver
  2. Konuşmaya başla
  3. Anlık çeviri dinle

Teknolojiler

  • Voxtral Mini 4B: Mistral AI çeviri modeli
  • Pyannote 3.1: Konuşmacı diarization
  • Pitch Shifting: Cinsiyet karakteristiği
  • Crossfade Mix: Profesyonel ses birleştirme

Sistem Gereksinimleri

  • GPU: T4 (ücretsiz) veya daha iyisi
  • RAM: 16GB+
  • Disk: ~10GB model cache

API Kullanımı

from gradio_client import Client

client = Client("KULLANICI_ADIN/SPACE_ADI")
result = client.predict(
    "ses.wav",  # audio file
    "tr",       # target language
    True,       # preserve gender
    True,       # enhance audio
    fn_index=0
)