Spaces:

Mnem-AI
/

MnemAI

Sleeping

App Files Files Community

fraunhofer commited on Dec 8, 2025

Commit

7604960

1 Parent(s): 3ef82e6

SPACE PYTHON CODES

Browse files

Files changed (6) hide show

Dockerfile +28 -0
__pycache__/main.cpython-313.pyc +0 -0
__pycache__/phonology_engine.cpython-313.pyc +0 -0
main.py +135 -0
phonology_engine.py +59 -0
requirements.txt +5 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,28 @@

+# Python 3.9 tabanlı bir Linux kuruyoruz
+FROM python:3.9
+# Çalışma klasörünü ayarla
+WORKDIR /code
+# Ses işleme için gerekli olan FFmpeg'i kur (Linux paket yöneticisiyle)
+RUN apt-get update && apt-get install -y ffmpeg
+# Kütüphane listesini kopyala ve kur
+COPY ./requirements.txt /code/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+# Kullanıcı yetkilerini ayarla (Hugging Face güvenlik kuralı)
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user \
+    PATH=/home/user/.local/bin:$PATH
+# Kodları sunucuya kopyala
+WORKDIR $HOME/app
+COPY --chown=user . $HOME/app
+# Modeli önceden indir (Deploy süresini hızlandırır)
+RUN python3 -c "import whisper; whisper.load_model('base')"
+# Uygulamayı başlat (Port 7860 olmak ZORUNDA)
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

__pycache__/main.cpython-313.pyc ADDED Viewed

Binary file (5.34 kB). View file

__pycache__/phonology_engine.cpython-313.pyc ADDED Viewed

Binary file (2.58 kB). View file

main.py ADDED Viewed

	@@ -0,0 +1,135 @@

+from fastapi import FastAPI, UploadFile, File, Form, HTTPException
+from faster_whisper import WhisperModel
+from phonology_engine import FonolojikVaryasyonMotoru
+import difflib
+import os
+import shutil
+import uuid
+app = FastAPI(title="MnemAI Ses Analiz API")
+# --- MODEL AYARLARI ---
+# Hugging Face CPU'su için 'int8' en iyisidir.
+MODEL_SIZE = "large-v2"
+DEVICE = "cpu"
+COMPUTE_TYPE = "int8"
+print("⏳ Whisper modeli ve Varyasyon Motoru yükleniyor...")
+# Modeli global olarak bir kez yüklüyoruz
+model = WhisperModel(MODEL_SIZE, device=DEVICE, compute_type=COMPUTE_TYPE)
+motor = FonolojikVaryasyonMotoru()
+print("✅ Sistem hazır!")
+def kelime_analizi_yap(hedef: str, gelen: str):
+    """
+    Hedef kelime ile gelen kelimeyi karşılaştırır ve hataları raporlar.
+    """
+    hedef = hedef.lower().replace("İ", "i").strip()
+    gelen = gelen.lower().replace("İ", "i").strip()
+    # 1. Tam Eşleşme
+    if hedef == gelen:
+        return {
+            "durum": "basarili",
+            "skor": 100,
+            "mesaj": "Harika! Tamamen doğru söyledin.",
+            "hatalar": []
+        }
+    # 2. Hata Analizi (Difflib)
+    matcher = difflib.SequenceMatcher(None, hedef, gelen)
+    hatalar = []
+    # Opcodes: 'replace', 'delete', 'insert', 'equal'
+    for tag, i1, i2, j1, j2 in matcher.get_opcodes():
+        if tag == 'replace':
+            beklenen = hedef[i1:i2]
+            soylenen = gelen[j1:j2]
+            hatalar.append(f"'{beklenen.upper()}' yerine '{soylenen.upper()}' dedin.")
+        elif tag == 'delete':
+            beklenen = hedef[i1:i2]
+            hatalar.append(f"'{beklenen.upper()}' sesini yuttun.")
+        elif tag == 'insert':
+            fazla = gelen[j1:j2]
+            hatalar.append(f"Fazladan '{fazla.upper()}' sesi çıkardın.")
+    skor = int(matcher.ratio() * 100)
+    return {
+        "durum": "hatali",
+        "skor": skor,
+        "mesaj": "Bazı sesleri düzeltmemiz gerekiyor.",
+        "hatalar": hatalar,
+        "detayli_fark": {
+            "beklenen": hedef,
+            "algilanan": gelen
+        }
+    }
+@app.post("/analiz")
+async def ses_analiz(
+    file: UploadFile = File(...),
+    hedef_kelime: str = Form(...)
+):
+    """
+    Endpoint: Ses dosyasını ve hedeflenen kelimeyi alır, analiz sonucunu döner.
+    """
+    # 1. Dosyayı Geçici Kaydet
+    if not file.filename.lower().endswith(('.wav', '.mp3', '.m4a', '.ogg')):
+         raise HTTPException(status_code=400, detail="Geçersiz dosya formatı.")
+    temp_filename = f"temp_{uuid.uuid4()}.wav"
+    try:
+        with open(temp_filename, "wb") as buffer:
+            shutil.copyfileobj(file.file, buffer)
+        # 2. Fonolojik Prompt Üret (Whisper'ı yönlendirmek için)
+        prompt_metni = motor.varyasyonlari_uret(hedef_kelime)
+        # 3. Whisper Transkripsiyon
+        # initial_prompt: Whisper'a bu kelimenin varyasyonlu olabileceğini söylüyoruz.
+        segments, _ = model.transcribe(
+            temp_filename,
+            language="tr",
+            initial_prompt=f"Bu çocuk şu kelimeleri söyleyebilir: {prompt_metni}",
+            # --- YENİ EKLENEN AYARLAR ---
+            beam_size=5,                # Daha fazla olasılığı değerlendir
+            vad_filter=False,           # Sessizlik filtresini KAPAT (Çok önemli)
+            word_timestamps=False,      # Tek kelime için gereksiz, hız kazandırır
+            # Whisper'ın "Emin değilim" deyip susmasını engellemek için filtreleri kapatıyoruz:
+            no_speech_threshold=0.95,   # Sessizlik eşiğini yükselt
+            log_prob_threshold=None,    # Düşük olasılıklı tahminleri de kabul et (Silme)
+            compression_ratio_threshold=None, # Tekrar eden bozuk sesleri de al
+            temperature=0               # Yaratıcılığı kapat, en net duyduğunu ver
+        )
+        # Generator'dan metni al
+        algilanan_metin = " ".join([s.text for s in segments]).strip()
+        # Noktalama temizliği
+        algilanan_metin = algilanan_metin.replace(".", "").replace("?", "").replace("!", "")
+        # 4. Karşılaştırma ve Raporlama
+        sonuc = kelime_analizi_yap(hedef_kelime, algilanan_metin)
+        return {
+            "hedef_kelime": hedef_kelime,
+            "algilanan_metin": algilanan_metin,
+            "analiz_sonucu": sonuc
+        }
+    except Exception as e:
+        return {"hata": str(e)}
+    finally:
+        # Geçici dosyayı temizle
+        if os.path.exists(temp_filename):
+            os.remove(temp_filename)
+@app.get("/")
+def root():
+    return {"durum": "MnemAI Sunucusu Calisiyor"}

phonology_engine.py ADDED Viewed

	@@ -0,0 +1,59 @@

+import itertools
+class FonolojikVaryasyonMotoru:
+    def __init__(self):
+        # TÜRKÇE FONOLOJİK BOZUKLUK KURALLARI
+        self.kurallar = {
+            # R Bozuklukları (Rhotacism)
+            'r': ['r', 'y', 'ğ', 'l', ''],
+            # Önleştirme (Fronting) K->T, G->D
+            'k': ['k', 't'],
+            'g': ['g', 'd'],
+            # Durdurma (Stopping) S->T, F->P vb.
+            's': ['s', 't', ''],
+            'z': ['z', 'd'],
+            'f': ['f', 'p'],
+            'v': ['v', 'b'],
+            # Seda Değişimleri & Diğerleri
+            'b': ['b', 'p'],
+            'd': ['d', 't'],
+            'c': ['c', 'ç', 't'],
+            'ç': ['ç', 't', 'ş'],
+            'j': ['j', 'd', 'z'],
+            'ş': ['ş', 's', 't', 'ç'],
+            'l': ['l', 'y', ''],
+            'ğ': ['ğ', 'y', ''],
+            'h': ['h', '']
+        }
+    def varyasyonlari_uret(self, hedef_kelime, max_limit=150):
+        """
+        Hedef kelimenin olası yanlış telaffuz varyasyonlarını üretir.
+        Whisper'a 'Initial Prompt' olarak vermek için kullanılır.
+        """
+        kelime = hedef_kelime.lower().strip()
+        harf_opsiyonlari = []
+        for harf in kelime:
+            secenekler = self.kurallar.get(harf, [harf])
+            if harf not in secenekler:
+                secenekler.insert(0, harf)
+            harf_opsiyonlari.append(secenekler)
+        tum_kombinasyonlar = list(itertools.product(*harf_opsiyonlari))
+        sonuc_listesi = set()
+        for kombinasyon in tum_kombinasyonlar:
+            varyasyon = "".join(kombinasyon)
+            if len(varyasyon) > 1:
+                sonuc_listesi.add(varyasyon)
+        sonuc_listesi.add(kelime)
+        final_liste = sorted(list(sonuc_listesi))
+        # Whisper prompt limiti için kesme işlemi
+        if len(final_liste) > max_limit:
+            final_liste = final_liste[:max_limit]
+        prompt_string = " ".join(final_liste)
+        return prompt_string

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+fastapi
+uvicorn
+python-multipart
+faster-whisper
+numpy