███╗   ███╗ ██╗ █████╗
████╗ ████║ ██║██╔══██╗
██╔████╔██║ ██║███████║
██║╚██╔╝██║ ██║██╔══██║
██║ ╚═╝ ██║ ██║██║  ██║
╚═╝     ╚═╝ ╚═╝╚═╝  ╚═╝

Mia Translate

Mektup'un Dil Köprüsü — 450+ Dil Arasında Gerçek Zamanlı Çeviri


Lisans Temel Model Dil Desteği Uygulama



🌐 Mia Translate Nedir?

Mia Translate, Mektup mesajlaşma uygulamasının çeviri katmanını güçlendiren çok dilli makine çevirisi modelidir.

Mektup'un sesli mesaj çeviri akışında ikinci ve kritik halka Mia Translate'dir: Mia STT tarafından metne dönüştürülen içerik, bu model aracılığıyla alıcının diline çevrilir ve ardından Mia TTS tarafından seslendirilir.

Bu repo, Google'ın madlad400-3b-mt model ağırlıklarını Apache 2.0 lisansı çerçevesinde barındırmaktadır.


✨ Öne Çıkan Özellikler

Özellik Detay
🌐 Dil Kapsamı 450'den fazla dil — tek modelde
⚖️ Lisans Apache 2.0 — ticari kullanım serbest
🏗️ Mimari T5 encoder-decoder (3 milyar parametre)
📊 Eğitim Verisi 1 trilyon token, çok dilli genel alan
Hız Gerçek zamanlı kısa metin çevirisi için uygun
🎯 Kalite Flores-200 kıyaslamalarında çok daha büyük modellerle rekabet eder
🔗 Uyumluluk Mia STT ve Mia TTS ile sorunsuz entegrasyon

🔗 Mia Ekosistemindeki Yeri

Mia Translate, Mektup'un üç katmanlı sesli mesaj çeviri pipeline'ının kalbidir:

┌─────────────────────────────────────────────────────────────┐
│                      Mektup Ses Akışı                       │
├────────────────┬──────────────────────┬─────────────────────┤
│   Mia STT      │   Mia Translate      │   Mia TTS           │
│                │                      │                     │
│  Ses → Metin   │  Metin → Metin       │  Metin → Ses        │
│                │                      │                     │
│                │                      │                     │
└────────────────┴──────────────────────┴─────────────────────┘
Adım Model Repo Lisans
1️⃣ Konuşma Tanıma Mia STT mektup-mia/Mia-STT Apache 2.0
2️⃣ Metin Çevirisi Mia Translate mektup-mia/Mia-Translatebu repo Apache 2.0
3️⃣ Konuşma Sentezi Mia TTS mektup-mia/Mia-TTS Apache 2.0

Üç modelin tamamı Apache 2.0 lisanslıdır — lisans uyum yükü minimumdur.


🗣️ Desteklenen Kullanım Senaryoları

Sesli Mesaj Metin Çevirisi (MVP — Aktif)

Mektup'un ilk sürümünde Mia STT tarafından üretilen transkript metni, Mia Translate aracılığıyla alıcının tercih ettiği dile çevrilir.

Yazılı Mesaj Çevirisi (MVP — Aktif)

Kullanıcıların gönderdiği yazılı mesajlar, alıcı tarafından kendi dilinde okuyabilmesi için otomatik olarak çevrilir.

Çok Dilli Grup Sohbeti (Gelecek Sürüm)

Gruptaki her katılımcı farklı bir dil kullanabilir; Mia Translate her mesajı her üye için kişiselleştirilmiş dil tercihine göre çevirir.

Kişiye Özel Dil Tercihi (Gelecek Sürüm)

Belirli kişilerle yapılan sohbetlerde çeviri devre dışı bırakılabilir veya farklı dil kombinasyonları tanımlanabilir.


🌐 Dil Öncelikleri

Mektup'un hedef kullanıcı kitlesi doğrultusunda aşağıdaki diller öncelikli test ve optimizasyon kapsamındadır:

Birincil: Türkçe · İngilizce · Arapça · Almanca · Fransızca
İkincil: Rusça · İspanyolca · Japonca · Korece · Çince
Geniş Kapsam: MADLAD-400'ün desteklediği 450+ dilin tamamı


⚙️ Teknik Mimari

Mia Translate, Google Research'ün MADLAD-400 makalesinde sunulan makine çevirisi modelini kullanır:

  • Mimari: T5 encoder-decoder
  • Parametre Sayısı: 3 milyar
  • Eğitim Verisi: 1 trilyon token, CommonCrawl ve paralel çoklu kaynak
  • Dil Kapsamı: 450+ dil, tek bir model checkpoint'i
  • Hedef Dil Formatı: <2tr> gibi dil etiketleriyle yönlendirme
  • Giriş Limiti: 512 token (kısa mesajlar için idealdir)
  • Kalite: Flores-200 kıyaslamalarında çok daha büyük modellerle rekabetçi

📋 Lisans ve Atıf

Bu model, Apache 2.0 lisansı altında dağıtılmaktadır.

Model ağırlıkları Google Research'ün google/madlad400-3b-mt reposuna aittir. Mektup ekibi olarak bu çalışma için Google Research ekibine teşekkür ederiz.

Akademik atıf için lütfen orijinal makaleyi kullanınız:

Kudugunta, S., Caswell, I., Zhang, B., Garcia, X., Cheng, C., Krause, O., Pestoni, B., Roedel, F., Stella, R., & Johnson, M. (2023). MADLAD-400: A Multilingual And Document-Level Large Audited Dataset. arXiv:2309.04662


⚠️ Kullanım Kısıtlamaları

  • 🚫 Model genel alan verisiyle eğitilmiştir; tıp ve hukuk gibi alan özgü metinlerde doğruluk düşebilir
  • 🚫 512 tokeni aşan uzun metinlerde çeviri kalitesi bozulabilir
  • 🚫 Üretilen çeviriler resmi veya sertifikalı çeviri belgesi olarak kullanılamaz
  • 🚫 Yasadışı veya etik dışı faaliyetler için kullanım kesinlikle yasaktır

Mektup, bu modeli yalnızca kişiler arası günlük iletişim çevirisi amacıyla kullanmaktadır.


🔗 Bağlantılar

📱 Mektup Uygulaması mektup.app
👂 Mia STT mektup-mia/Mia-STT
🔊 Mia TTS mektup-mia/Mia-TTS
🤗 Temel Model google/madlad400-3b-mt
📄 Araştırma Makalesi arXiv:2309.04662


Mia Translate, Mektup'un sesli deneyimini güçlendirmek amacıyla derlenmiştir.
Dil sınırlarını ortadan kaldırmak için — herkes kendi dilinde konuşsun.


mektup-mia/Mia-Translate · Apache 2.0 · google/madlad400-3b-mt üzerine inşa edilmiştir

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for mektup-mia/Mia-Translate

Finetuned
(5)
this model

Paper for mektup-mia/Mia-Translate