███╗ ███╗ ██╗ █████╗
████╗ ████║ ██║██╔══██╗
██╔████╔██║ ██║███████║
██║╚██╔╝██║ ██║██╔══██║
██║ ╚═╝ ██║ ██║██║ ██║
╚═╝ ╚═╝ ╚═╝╚═╝ ╚═╝
Mia Translate
Mektup'un Dil Köprüsü — 450+ Dil Arasında Gerçek Zamanlı Çeviri
🌐 Mia Translate Nedir?
Mia Translate, Mektup mesajlaşma uygulamasının çeviri katmanını güçlendiren çok dilli makine çevirisi modelidir.
Mektup'un sesli mesaj çeviri akışında ikinci ve kritik halka Mia Translate'dir: Mia STT tarafından metne dönüştürülen içerik, bu model aracılığıyla alıcının diline çevrilir ve ardından Mia TTS tarafından seslendirilir.
Bu repo, Google'ın madlad400-3b-mt model ağırlıklarını Apache 2.0 lisansı çerçevesinde barındırmaktadır.
✨ Öne Çıkan Özellikler
| Özellik | Detay |
|---|---|
| 🌐 Dil Kapsamı | 450'den fazla dil — tek modelde |
| ⚖️ Lisans | Apache 2.0 — ticari kullanım serbest |
| 🏗️ Mimari | T5 encoder-decoder (3 milyar parametre) |
| 📊 Eğitim Verisi | 1 trilyon token, çok dilli genel alan |
| ⚡ Hız | Gerçek zamanlı kısa metin çevirisi için uygun |
| 🎯 Kalite | Flores-200 kıyaslamalarında çok daha büyük modellerle rekabet eder |
| 🔗 Uyumluluk | Mia STT ve Mia TTS ile sorunsuz entegrasyon |
🔗 Mia Ekosistemindeki Yeri
Mia Translate, Mektup'un üç katmanlı sesli mesaj çeviri pipeline'ının kalbidir:
┌─────────────────────────────────────────────────────────────┐
│ Mektup Ses Akışı │
├────────────────┬──────────────────────┬─────────────────────┤
│ Mia STT │ Mia Translate │ Mia TTS │
│ │ │ │
│ Ses → Metin │ Metin → Metin │ Metin → Ses │
│ │ │ │
│ │ │ │
└────────────────┴──────────────────────┴─────────────────────┘
| Adım | Model | Repo | Lisans |
|---|---|---|---|
| 1️⃣ Konuşma Tanıma | Mia STT | mektup-mia/Mia-STT |
Apache 2.0 |
| 2️⃣ Metin Çevirisi | Mia Translate | mektup-mia/Mia-Translate ← bu repo |
Apache 2.0 |
| 3️⃣ Konuşma Sentezi | Mia TTS | mektup-mia/Mia-TTS |
Apache 2.0 |
Üç modelin tamamı Apache 2.0 lisanslıdır — lisans uyum yükü minimumdur.
🗣️ Desteklenen Kullanım Senaryoları
Sesli Mesaj Metin Çevirisi (MVP — Aktif)
Mektup'un ilk sürümünde Mia STT tarafından üretilen transkript metni, Mia Translate aracılığıyla alıcının tercih ettiği dile çevrilir.
Yazılı Mesaj Çevirisi (MVP — Aktif)
Kullanıcıların gönderdiği yazılı mesajlar, alıcı tarafından kendi dilinde okuyabilmesi için otomatik olarak çevrilir.
Çok Dilli Grup Sohbeti (Gelecek Sürüm)
Gruptaki her katılımcı farklı bir dil kullanabilir; Mia Translate her mesajı her üye için kişiselleştirilmiş dil tercihine göre çevirir.
Kişiye Özel Dil Tercihi (Gelecek Sürüm)
Belirli kişilerle yapılan sohbetlerde çeviri devre dışı bırakılabilir veya farklı dil kombinasyonları tanımlanabilir.
🌐 Dil Öncelikleri
Mektup'un hedef kullanıcı kitlesi doğrultusunda aşağıdaki diller öncelikli test ve optimizasyon kapsamındadır:
Birincil: Türkçe · İngilizce · Arapça · Almanca · Fransızca
İkincil: Rusça · İspanyolca · Japonca · Korece · Çince
Geniş Kapsam: MADLAD-400'ün desteklediği 450+ dilin tamamı
⚙️ Teknik Mimari
Mia Translate, Google Research'ün MADLAD-400 makalesinde sunulan makine çevirisi modelini kullanır:
- Mimari: T5 encoder-decoder
- Parametre Sayısı: 3 milyar
- Eğitim Verisi: 1 trilyon token, CommonCrawl ve paralel çoklu kaynak
- Dil Kapsamı: 450+ dil, tek bir model checkpoint'i
- Hedef Dil Formatı:
<2tr>gibi dil etiketleriyle yönlendirme - Giriş Limiti: 512 token (kısa mesajlar için idealdir)
- Kalite: Flores-200 kıyaslamalarında çok daha büyük modellerle rekabetçi
📋 Lisans ve Atıf
Bu model, Apache 2.0 lisansı altında dağıtılmaktadır.
Model ağırlıkları Google Research'ün google/madlad400-3b-mt reposuna aittir. Mektup ekibi olarak bu çalışma için Google Research ekibine teşekkür ederiz.
Akademik atıf için lütfen orijinal makaleyi kullanınız:
Kudugunta, S., Caswell, I., Zhang, B., Garcia, X., Cheng, C., Krause, O., Pestoni, B., Roedel, F., Stella, R., & Johnson, M. (2023). MADLAD-400: A Multilingual And Document-Level Large Audited Dataset. arXiv:2309.04662
⚠️ Kullanım Kısıtlamaları
- 🚫 Model genel alan verisiyle eğitilmiştir; tıp ve hukuk gibi alan özgü metinlerde doğruluk düşebilir
- 🚫 512 tokeni aşan uzun metinlerde çeviri kalitesi bozulabilir
- 🚫 Üretilen çeviriler resmi veya sertifikalı çeviri belgesi olarak kullanılamaz
- 🚫 Yasadışı veya etik dışı faaliyetler için kullanım kesinlikle yasaktır
Mektup, bu modeli yalnızca kişiler arası günlük iletişim çevirisi amacıyla kullanmaktadır.
🔗 Bağlantılar
| 📱 Mektup Uygulaması | mektup.app |
| 👂 Mia STT | mektup-mia/Mia-STT |
| 🔊 Mia TTS | mektup-mia/Mia-TTS |
| 🤗 Temel Model | google/madlad400-3b-mt |
| 📄 Araştırma Makalesi | arXiv:2309.04662 |
Mia Translate, Mektup'un sesli deneyimini güçlendirmek amacıyla derlenmiştir.
Dil sınırlarını ortadan kaldırmak için — herkes kendi dilinde konuşsun.
mektup-mia/Mia-Translate · Apache 2.0 · google/madlad400-3b-mt üzerine inşa edilmiştir
Model tree for mektup-mia/Mia-Translate
Base model
google/madlad400-3b-mt