Spaces:

speako
/

wav2vec2-server

Sleeping

App Files Files Community

bigeco commited on Jun 15, 2025

Commit

82307da

1 Parent(s): c4d95b5

Revert "feat: 기존의 정확도 대신 CRR로 계산 (#1)"

Browse files

This reverts commit 23ecab6fb3941031dbbc1e8374ee91844257371b.

Files changed (1) hide show

app.py +11 -29

app.py CHANGED Viewed

@@ -5,7 +5,6 @@ import yaml
 import tempfile
 import os
 import traceback
-from model.cer_module import calculate_korean_crr
 from model.wav2vec2 import Wav2Vec2
 # ---------------- 설정 로드 ----------------
@@ -26,53 +25,36 @@ app = FastAPI(
 class TranscriptionResponse(BaseModel):
     transcription: str
     status: str
-    crr: float = None  # CRR 값, 선택적 필드
 # ---------------- API: 파일 업로드 POST ----------------
 @app.post("/transcribe", response_model=TranscriptionResponse)
-async def transcribe_audio(file: UploadFile = File(...), reference: str = None):
     # 파일 형식 검증
     if not file.filename.lower().endswith(('.wav', '.mp3', '.flac', '.m4a')):
         return TranscriptionResponse(
             transcription="",
-            status="error: 지원되지 않는 파일 형식입니다. wav, mp3, flac, m4a 파일만 지원됩니다.",
-            crr=None
         )
     try:
         audio_bytes = await file.read()
-        result = wav2vec2_model.transcribe_from_bytes(audio_bytes, file.filename)
-        # reference가 전달된 경우 CRR 계산
-        crr = None
-        if reference:
-            crr_result = calculate_korean_crr(reference, result)
-            crr = crr_result['crr']
         return TranscriptionResponse(
             transcription=result,
-            status="success",
-            crr=crr
         )
     except Exception as e:
         return TranscriptionResponse(
             transcription="",
-            status=f"error: {str(e)}",
-            crr=None
         )
-class CRRRequest(BaseModel):
-    original: str
-    corrected: str
-class CRRResponse(BaseModel):
-    crr: float
-@app.post("/calculate-crr", response_model=CRRResponse)
-async def calculate_crr_api(data: CRRRequest):
-    """
-    두 문장(original, corrected)을 받아 CRR(정확도)만 계산해서 반환
-    """
-    result = calculate_korean_crr(data.original, data.corrected)
-    return CRRResponse(crr=result['crr'])
 # ---------------- HTML UI ----------------
 @app.get("/", response_class=HTMLResponse)

 import tempfile
 import os
 import traceback
 from model.wav2vec2 import Wav2Vec2
 # ---------------- 설정 로드 ----------------
 class TranscriptionResponse(BaseModel):
     transcription: str
     status: str
 # ---------------- API: 파일 업로드 POST ----------------
 @app.post("/transcribe", response_model=TranscriptionResponse)
+async def transcribe_audio(file: UploadFile = File(...)):
+    """오디오 파일을 업로드하여 음성 인식 수행"""
     # 파일 형식 검증
     if not file.filename.lower().endswith(('.wav', '.mp3', '.flac', '.m4a')):
         return TranscriptionResponse(
             transcription="",
+            status="error: 지원되지 않는 파일 형식입니다. wav, mp3, flac, m4a 파일만 지원됩니다."
         )
     try:
+        # 파일 내용 읽기
         audio_bytes = await file.read()
+        # 음성 인식 수행
+        result = wav2vec2_model.transcribe_from_bytes(audio_bytes, file.filename)
         return TranscriptionResponse(
             transcription=result,
+            status="success"
         )
     except Exception as e:
         return TranscriptionResponse(
             transcription="",
+            status=f"error: {str(e)}"
         )
 # ---------------- HTML UI ----------------
 @app.get("/", response_class=HTMLResponse)