Spaces:

hafsaabd82
/

Audio-Analyzer

Sleeping

hafsaabd82 commited on Dec 5, 2025

Commit

0ff3099

verified ·

1 Parent(s): 6f1feb7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -73,7 +73,7 @@ app.add_middleware(
 class AnalysisResults:
     timelineData: List[Dict[str, Any]] = field(default_factory=list)
     duration: float = 0.0
-    language_code: str = "unknown"
     diarizationErrorRate: Optional[float] = None
     speakerError: Optional[float] = None
     missedSpeech: Optional[float] = None
@@ -197,12 +197,12 @@ def analyze_audio(audio_file: str,
     try:
         print(f"Loading Whisper model '{model_name}' on {device}...")
         model = whisperx.load_model(model_name, device, compute_type="float32")
-        audio_loaded = whisperx.load_audio(audio_for_model)
-        language_code_detected = model.detect_language(audio_loaded)
-        language_code = language_code_detected
         print("Transcribing audio...")
         result = model.transcribe(audio_loaded, batch_size=4, language="ur"
           )
         full_text = " ".join([seg['text'] for seg in result.get("segments", [])]).strip()
         results.rawTranscriptionText = full_text
         aligned = {"segments": result["segments"]}
@@ -377,7 +377,7 @@ async def upload_file(audio_file: UploadFile = File(...)):
             analysis_result.duration = 0.0
         return AnalysisResult(
             duration=force_float(analysis_result.duration) or 0.0,
-            language=language_code,
             timeline_data=[
                 TimelineItem(
                     start=force_float(item.get('start')) or 0.0,

 class AnalysisResults:
     timelineData: List[Dict[str, Any]] = field(default_factory=list)
     duration: float = 0.0
+    languageCode: str = "unknown"
     diarizationErrorRate: Optional[float] = None
     speakerError: Optional[float] = None
     missedSpeech: Optional[float] = None
     try:
         print(f"Loading Whisper model '{model_name}' on {device}...")
         model = whisperx.load_model(model_name, device, compute_type="float32")
+        audio_loaded = whisperx.load_audio(audio_for_model)
         print("Transcribing audio...")
         result = model.transcribe(audio_loaded, batch_size=4, language="ur"
           )
+        language_code = result.get("detected_language")
+        results.languageCode = language_code
         full_text = " ".join([seg['text'] for seg in result.get("segments", [])]).strip()
         results.rawTranscriptionText = full_text
         aligned = {"segments": result["segments"]}
             analysis_result.duration = 0.0
         return AnalysisResult(
             duration=force_float(analysis_result.duration) or 0.0,
+            language=analysis_result.languageCode,
             timeline_data=[
                 TimelineItem(
                     start=force_float(item.get('start')) or 0.0,