Spaces:

tachiwin
/

classifier

Sleeping

Luis J Camargo commited on 8 days ago

Commit

40f26b2

1 Parent(s): 7c2c8fa

feat: add audio normalization for int16 and int32 audio input arrays

Files changed (1) hide show

app.py CHANGED Viewed

@@ -99,6 +99,16 @@ def predict_language(audio):
     sample_rate, audio_array = audio
     audio_len_sec = len(audio_array) / sample_rate
     # Resampling
     if sample_rate != 16000:
         print(f"[LOG] Step 2: Resampling {sample_rate}Hz -> 16000Hz...")

     sample_rate, audio_array = audio
     audio_len_sec = len(audio_array) / sample_rate
+    # Normalization
+    print("[LOG] Step 1: Normalizing audio...")
+    if audio_array.dtype == np.int16:
+        print("was npint16")
+        audio_array = audio_array.astype(np.float32) / 32768.0
+    elif audio_array.dtype == np.int32:
+        print("was npint32")
+        audio_array = audio_array.astype(np.float32) / 2147483648.0
+    print(f"[LOG] Memory after normalization: {get_mem_usage():.2f} MB")
     # Resampling
     if sample_rate != 16000:
         print(f"[LOG] Step 2: Resampling {sample_rate}Hz -> 16000Hz...")