chatterbox

@@ -32,7 +32,8 @@ class EndpointHandler:
             # Encode to base64
             audio_base64 = base64.b64encode(buffer.read()).decode('utf-8')
-            audio_length_seconds = len(wav) / self.model.sr
             return [{"audio_base64": audio_base64, "audio_length_seconds":audio_length_seconds}]

             # Encode to base64
             audio_base64 = base64.b64encode(buffer.read()).decode('utf-8')
+            wav_squeeze = wav.squeeze()  # Shape becomes [960000]
+            audio_length_seconds = len(wav_squeeze) / self.model.sr
             return [{"audio_base64": audio_base64, "audio_length_seconds":audio_length_seconds}]