Spaces:

speako
/

wav2vec2-server

Sleeping

App Files Files Community

feat: 기존의 정확도 대신 CRR로 계산

by daeunn - opened Jun 14, 2025

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

+29

-11

Files changed (1) hide show

app.py +29 -11

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ import yaml
 import tempfile
 import os
 import traceback
 from model.wav2vec2 import Wav2Vec2
 # ---------------- 설정 로드 ----------------
@@ -25,36 +26,53 @@ app = FastAPI(
 class TranscriptionResponse(BaseModel):
     transcription: str
     status: str
 # ---------------- API: 파일 업로드 POST ----------------
 @app.post("/transcribe", response_model=TranscriptionResponse)
-async def transcribe_audio(file: UploadFile = File(...)):
-    """오디오 파일을 업로드하여 음성 인식 수행"""
     # 파일 형식 검증
     if not file.filename.lower().endswith(('.wav', '.mp3', '.flac', '.m4a')):
         return TranscriptionResponse(
             transcription="",
-            status="error: 지원되지 않는 파일 형식입니다. wav, mp3, flac, m4a 파일만 지원됩니다."
         )
     try:
-        # 파일 내용 읽기
         audio_bytes = await file.read()
-        # 음성 인식 수행
         result = wav2vec2_model.transcribe_from_bytes(audio_bytes, file.filename)
         return TranscriptionResponse(
             transcription=result,
-            status="success"
         )
     except Exception as e:
         return TranscriptionResponse(
             transcription="",
-            status=f"error: {str(e)}"
         )
 # ---------------- HTML UI ----------------
 @app.get("/", response_class=HTMLResponse)

 import tempfile
 import os
 import traceback
+from model.cer_module import calculate_korean_crr
 from model.wav2vec2 import Wav2Vec2
 # ---------------- 설정 로드 ----------------
 class TranscriptionResponse(BaseModel):
     transcription: str
     status: str
+    crr: float = None  # CRR 값, 선택적 필드
 # ---------------- API: 파일 업로드 POST ----------------
 @app.post("/transcribe", response_model=TranscriptionResponse)
+async def transcribe_audio(file: UploadFile = File(...), reference: str = None):
     # 파일 형식 검증
     if not file.filename.lower().endswith(('.wav', '.mp3', '.flac', '.m4a')):
         return TranscriptionResponse(
             transcription="",
+            status="error: 지원되지 않는 파일 형식입니다. wav, mp3, flac, m4a 파일만 지원됩니다.",
+            crr=None
         )
     try:
         audio_bytes = await file.read()
         result = wav2vec2_model.transcribe_from_bytes(audio_bytes, file.filename)
+        # reference가 전달된 경우 CRR 계산
+        crr = None
+        if reference:
+            crr_result = calculate_korean_crr(reference, result)
+            crr = crr_result['crr']
         return TranscriptionResponse(
             transcription=result,
+            status="success",
+            crr=crr
         )
     except Exception as e:
         return TranscriptionResponse(
             transcription="",
+            status=f"error: {str(e)}",
+            crr=None
         )
+class CRRRequest(BaseModel):
+    original: str
+    corrected: str
+class CRRResponse(BaseModel):
+    crr: float
+@app.post("/calculate-crr", response_model=CRRResponse)
+async def calculate_crr_api(data: CRRRequest):
+    """
+    두 문장(original, corrected)을 받아 CRR(정확도)만 계산해서 반환
+    """
+    result = calculate_korean_crr(data.original, data.corrected)
+    return CRRResponse(crr=result['crr'])
 # ---------------- HTML UI ----------------
 @app.get("/", response_class=HTMLResponse)